ncbi数据库,ncbi是什么数据库
大家好,今天来为大家解答ncbi数据库这个问题的一些问题点,包括ncbi是什么数据库也一样很多人还不知道,因此呢,今天就来为大家分析分析,现在让我们一起来看看吧!如果解决了您的问题,还望您关注下本站哦,谢谢~
ncbi是什么数据库
NCBI是美国国家生物技术信息中心,建立于1988年。NCBI的初衷是为了给分子生物学家提供一个信息储存和处理的系统,除了建有GenBank核酸序列数据库之外,NCBI还可以提供众多功能强大的数据检索与分析工具。
NCBI是National Center for Biotechnology Information的缩写,指美国国家生物技术信息中心,建立于1988年。NCBI的初衷是为了给分子生物学家提供一个信息储存和处理的系统,除了建有GenBank核酸序列数据库(该数据库的数据资源来自全球几大DNA数据库,其中包括日本DNA数据库DDBJ、欧洲分子生物学实验室数据库EMBL以及其它几个知名科研机构)之外,NCBI还可以提供众多功能强大的数据检索与分析工具。
如何从ncbi上下载database
因此NCBI的分类学数据库不是一个系统发育或分类学的“专家数据库”(Wheeler et al., 2000)。获取序列所对应的分类学信息有两种方法。一种方法,从NCBI网站下载gi与taxid对应表,在Taxonomy数据库的FTP地址下载。这个目录下有多个压缩文件,其中针对Windows操作系统的两个针对蛋白质序列和核苷酸序列的压缩文件分别是gi_taxid_prot.dmp.gz和gi_taxid_nucl.dmp.gz文件。这两个文件都只有两列,左边为gi号,右边为Taxid。由于这些文件非常大,因此用浏览器来打开这些文件几乎是不可能的。随着时间的推移,这两个文件会越来越大,不过速度不会是指数增长的,并且在美国东部时间的每个星期一2:00 am NCBI会对其进行更新。对于Windows用户还有一个文件称为taxdump.zip文件。文件解压缩后包括1个*.prt文件和6个*.dmp文件。Gencode.dmp文件保存有不同的密码子表,与同目录的gc.prt联合使用;merged.dmp是保存有合并的taxid号的对应表;nodes.dmp是结点信息;division.dmp是较大的几个分类;names.dmp结点名称信息,每个id对应多行。这些数据被Phylogenie软件包中的blammer程序用于构建进化树。利用ftp地址的连接利用Http或ftp方式将文件下载到本地,通过本地程序或脚本搜索文本,来建立gi号与Taxid之间的联系(图)。这种方法比较适合于在线服务的Web形式的程序,通过在本地不断地及时更新程序就可以完成这项工作。第二种方法是对Taxonomy数据库进行API分析。
NCBI选择数据库
原理很简单后者是前者的子集。chromosome只包含所有已经测序的基因组数据。估计你的序列可能只是在高等生物中保守,所以才会出现选择chromosome数据库时相似数量下降非常多。
在做BLAST的时候,我们通常需要根据不同的目的选择不同的数据库。例如,要看一下测的序列是不是子集所期望的序列,以及,那nr数据库是最好的选择。至于以谁为准,因需要解决的问题而异。读一下blast每个数据库的定义,对于你选择数据库最有帮助。有一个基本原则是:nr数据库可以满足绝大多数的需求。少数特殊需求可以通过其他数据库完成,例如最近30天内的更新序列,搜索新基因这是必查的;题目中的chromosome数据库是只包含了全基因组或全染色体的数据。详参NCBI Blast说明。
http://www.ncbi.nlm.nih.gov/BLAST/blastcgihelp.shtml#nucleotide_databases
谁知道怎样在NCBI中找数据库
NCBI分类学数据库(taxonomy database)不是分类学或系统发育信息的信息源(primary source),而且也没有自己的一套完整的分类学系统,相反它只是努力整合各种各样来源的系统发育和分类学的知识,包括发表的文献、基于网络的数据库、序列提交者的建议以及来自NCBI外部的分类学专家。因此NCBI的分类学数据库不是一个系统发育或分类学的“专家数据库”(Wheeler et al., 2000)。
获取序列所对应的分类学信息有两种方法。
一种方法,从NCBI网站下载gi与taxid对应表,在Taxonomy数据库的FTP地址下载。这个目录下有多个压缩文件,其中针对Windows操作系统的两个针对蛋白质序列和核苷酸序列的压缩文件分别是gi_taxid_prot.dmp.gz和gi_taxid_nucl.dmp.gz文件。这两个文件都只有两列,左边为gi号,右边为Taxid。由于这些文件非常大,因此用浏览器来打开这些文件几乎是不可能的。随着时间的推移,这两个文件会越来越大,不过速度不会是指数增长的,并且在美国东部时间的每个星期一2:00 am NCBI会对其进行更新。
对于Windows用户还有一个文件称为taxdump.zip文件。文件解压缩后包括1个*.prt文件和6个*.dmp文件。Gencode.dmp文件保存有不同的密码子表,与同目录的gc.prt联合使用;merged.dmp是保存有合并的taxid号的对应表;nodes.dmp是结点信息;division.dmp是较大的几个分类;names.dmp结点名称信息,每个id对应多行。这些数据被Phylogenie软件包中的blammer程序用于构建进化树。
利用ftp地址的连接利用Http或ftp方式将文件下载到本地,通过本地程序或脚本搜索文本,来建立gi号与Taxid之间的联系(图)。这种方法比较适合于在线服务的Web形式的程序,通过在本地不断地及时更新程序就可以完成这项工作。
第二种方法是对Taxonomy数据库进行API分析。NCBI用来保存Taxonomy信息的数据库名称为TAXON。
END,本文到此结束,如果可以帮助到大家,还望关注本站哦!