长链非编码RNA(long noncoding RNA, lncRNA)是一类长度大于200 nt的非编码RNA,缺少或无开放阅读编码框(opening reading frame,OFR);并不一定都带多聚核苷酸尾,在数量上远低于编码蛋白基因(mRNA);与编码蛋白基因相比,具有更高的组织器官特异性,并且物种间的保守序列低(<10%)。
lncRNA广泛存在于各种生物体内,在表观遗传、转录以及转录后等多种水平上对生命活动进行关键性的调控,与动植物的生长发育,人类的疾病发生有着密切关系,也可作为疾病诊断的标志物或是重要靶点。近年来关于lncRNA的研究也越来越热门,文章数量也越来越多,这不上周小编就发过文章:Plant Journal:番茄lncRNA16397与致病疫霉抗性产生机制研究。
说了这么多,你是不是想问做lncRNA研究,要准备啥呢?
既然你诚心诚意的问了,那么小编就谦虚的告诉你一下好了~
想做lncRNA研究,需要注意非常重要的两点:一是研究的物种必须有参考基因组;二是这个物种能做去除核糖体RNA(rRNA)处理,同时满足这两个条件即可。
今天就先来教大家解决第一个问题:如何查找参考基因组。
这个时候需要用到三个网站:
Ensemble:http://www.ensembl.org【适用于动物参考基因组查找,网站也包括动物、植物及真菌基因组等】JGI(Phytozome):https://phytozome.jgi.doe.gov/pz/portal.html#【适用于植物参考基因组查找,网站也包括动物等其他物种,这个网站植物基因组更新比较快,动物基因组更新较慢】
NCBI:https://www.ncbi.nlm.nih.gov/【使用前两个网站进行查找后,如果没有得到结果,可以再到NCBI试试】
一.利用Ensemble查找动物参考基因组
1.打开网站:http://www.ensembl.org;点击下拉框,可以选择进入不同子数据库,脊椎动物、后生动物等,根据研究的物种选择:
2.以human为例,选择脊椎动物类,进入下一页面:
3.在右侧查找框中输入“human”,点击搜索:
4.选择你需要的内容(红色方框所示),点击进去可以查看,也可以下载:
5.这个页面选择你想要下载的点击下载(红色框标记内容),这样就查找并下载到了一个参考基因组,如果你输入进去的物种没有出现任何序列信息,可以去NCBI中确认一下,如果也没有,那就说明这个物种不适合做lncRNA分析。
PS:这个网站还有其他的功能,如BioMart 批量下载数据(序列、突变信息、注释信息、同源基因信息等),这里只教大家查找参考基因组。
二:JGI(Phytozome)植物参考基因组查找
1.打开网址:https://phytozome.jgi.doe.gov/pz/portal.html#;点击“species”(如下图)或者点击红色框中的图片,再输入基因序列号即可查找到序列:
2.植物有参考基因组的物种数不是很多,直接在species中也可以查看,可不需要搜索。如果这个网站没有对应的参考基因组,则需要去NCBI上试试看。
3.点击download下载数据:
PS:这个数据也可以进行一些其他的分析,如下图:
动物和植物的参考基因组查找就讲完了,以上两个网站基本包括了目前已有参考基因组的物种,如还想确认,可进入NCBI查询。
三.NCBI查询也比较简单,下拉框中选择“Genome”,在搜索框中输入物种名,根据得到的结果选定你需要的基因(红色框标记内容),打开查看或者下载就好了。
今天的内容就讲完了,主要是解决了第一个问题,如何查找参考基因组信息,下期将继续来说明第二个问题:你做的物种是否能做去除核糖体RNA(rRNA)处理。
如有问题,欢迎大家留言给小编一起讨论哦~
相关阅读:
Plant Journal:番茄lncRNA16397与致病疫霉抗性产生机制研究