强大利器WebGestalt
ORA就是常说的针对差异表达的基因进行注释,GSEA则是纳入全部表达基因进行注释,而NTA则是从拓扑学角度进行构建注释
注:ORA就是常说的针对差异表达的基因进行注释,GSEA则是纳入全部表达基因进行注释,而NTA则是从拓扑学角度进行构建注释
第一步 挑选目标物种
以人类基因组为例子,所以大家选择“Homo sapiens”这个默认选项即可,如果你是研究其它生物的,那么你可以在下拉框里选择相应的物种即可。
物种信息选择“Homo sapiens”
第二步 选择计算方法
这一步主要是用来选择我们进行富集分析的方法,一般我们常用的就是前两种“over-representation analysis”(ORA)和“gene set enrichment analysis”(GSEA)。
注意一下,第一种算法要求我们提供参考基因列表(reference gene list)而第二种算法GSEA则不需要,但是GSEA算法需要我们提供各个基因的得分。因此,对于只有基因名称的用户来说,只能使用ORA算法,这里我也选择ORA方法。
注释方法,ORA就是常说的针对差异表达的基因进行注释
第三步 选择功能数据库
这里需要你选择注释数据的来源,该网站提供了9类注释数据库,在这里我选择pathway,目的是进行接下来的通路分析:
注释内容
当你选择功能数据库类型后,你还需要选择具体的注释数据库,这里我选择KEGG和Reactome数据库,你可以点击旁边的“+”按钮来添加相关数据库:
也可以选别的
第四步:选择你的基因名类型并上传你的基因
这里你有两个选择:一个是上传基因列表文件,这个文件就是一个没有题头的文本文件,包含一列基因名;另一个是直接输入基因。
这里我们的基因名是gene symbol类型:
例子:A1BG A4GALT AAAS AACS AADACL3 AAED1 AAGAB AAK1 AAMDC AAMP AANAT AAR2 AARS AARS2 AASDH AASS AATBC AATF AATK AATK-AS1 ABAT ABCA1 ABCA12 ABCA2 ABCA3 ABCA5
第五步:选择参考基因列表
在这一步,我们需要设置参考基因集,这是ORA算法所必需的,这里平台选择我们选择编码蛋白质的基因组:
或者芯片数据来源的测序平台选择,比如例子里的基因来源于affy hg u133a这个平台
第六步:点击“Submit”按钮,静候结果即可
我们也可以直接点击“Results Download”直接将summary结果下载下来。
第七步:结果解读
1)Job Summary里面包涵了此次分析的全部参数设定,方便下次分析的时候结果可以被重复出来。如下
Job Summary
2)Go slim提供了简单的gene ontology词条的柱状图信息,如图
Go slim
3)Enrichment results是最重要的,提供了发表级的基因注释结果。可以选择以不同的形式呈现结果,包括表格形式,柱状图形式,散点图形式,甚至还给出了注释结果的拓扑学结构关系(DAG,有向无环图)。如下
富集结果
扑学结构关系(DAG,有向无环图)
4)词条细节。在最下面可以通过选择不同的词条展示富集到的词条中包括的基因名称以及得分情况,能够确立起重要作用的关键基因。
得分
这一部分对于进一步开展后续的湿实验具有重要意义。
生物信息学领域非常广泛,难以一次说尽。我们下次继续更新,一起深入学习生物信息学的内容!
喜欢的宝子们点个赞吧~码字不易,且行且珍惜~