ncbi数据库，ncbi是什么数据库

编程之家2023-10-20123次浏览

大家好，今天来为大家解答ncbi数据库这个问题的一些问题点，包括ncbi是什么数据库也一样很多人还不知道，因此呢，今天就来为大家分析分析，现在让我们一起来看看吧！如果解决了您的问题，还望您关注下本站哦，谢谢~

ncbi是什么数据库

NCBI是美国国家生物技术信息中心，建立于1988年。NCBI的初衷是为了给分子生物学家提供一个信息储存和处理的系统，除了建有GenBank核酸序列数据库之外，NCBI还可以提供众多功能强大的数据检索与分析工具。

NCBI是National Center for Biotechnology Information的缩写，指美国国家生物技术信息中心，建立于1988年。NCBI的初衷是为了给分子生物学家提供一个信息储存和处理的系统，除了建有GenBank核酸序列数据库（该数据库的数据资源来自全球几大DNA数据库，其中包括日本DNA数据库DDBJ、欧洲分子生物学实验室数据库EMBL以及其它几个知名科研机构）之外，NCBI还可以提供众多功能强大的数据检索与分析工具。

如何从ncbi上下载database

因此NCBI的分类学数据库不是一个系统发育或分类学的“专家数据库”（Wheeler et al., 2000）。获取序列所对应的分类学信息有两种方法。一种方法，从NCBI网站下载gi与taxid对应表，在Taxonomy数据库的FTP地址下载。这个目录下有多个压缩文件，其中针对Windows操作系统的两个针对蛋白质序列和核苷酸序列的压缩文件分别是gi_taxid_prot.dmp.gz和gi_taxid_nucl.dmp.gz文件。这两个文件都只有两列，左边为gi号，右边为Taxid。由于这些文件非常大，因此用浏览器来打开这些文件几乎是不可能的。随着时间的推移，这两个文件会越来越大，不过速度不会是指数增长的，并且在美国东部时间的每个星期一2：00 am NCBI会对其进行更新。对于Windows用户还有一个文件称为taxdump.zip文件。文件解压缩后包括1个*.prt文件和6个*.dmp文件。Gencode.dmp文件保存有不同的密码子表，与同目录的gc.prt联合使用；merged.dmp是保存有合并的taxid号的对应表；nodes.dmp是结点信息；division.dmp是较大的几个分类；names.dmp结点名称信息，每个id对应多行。这些数据被Phylogenie软件包中的blammer程序用于构建进化树。利用ftp地址的连接利用Http或ftp方式将文件下载到本地，通过本地程序或脚本搜索文本，来建立gi号与Taxid之间的联系（图）。这种方法比较适合于在线服务的Web形式的程序，通过在本地不断地及时更新程序就可以完成这项工作。第二种方法是对Taxonomy数据库进行API分析。

NCBI选择数据库

原理很简单后者是前者的子集。chromosome只包含所有已经测序的基因组数据。估计你的序列可能只是在高等生物中保守，所以才会出现选择chromosome数据库时相似数量下降非常多。

在做BLAST的时候，我们通常需要根据不同的目的选择不同的数据库。例如，要看一下测的序列是不是子集所期望的序列，以及，那nr数据库是最好的选择。至于以谁为准，因需要解决的问题而异。读一下blast每个数据库的定义，对于你选择数据库最有帮助。有一个基本原则是：nr数据库可以满足绝大多数的需求。少数特殊需求可以通过其他数据库完成，例如最近30天内的更新序列，搜索新基因这是必查的；题目中的chromosome数据库是只包含了全基因组或全染色体的数据。详参NCBI Blast说明。

http://www.ncbi.nlm.nih.gov/BLAST/blastcgihelp.shtml#nucleotide_databases

谁知道怎样在NCBI中找数据库

NCBI分类学数据库（taxonomy database）不是分类学或系统发育信息的信息源（primary source），而且也没有自己的一套完整的分类学系统，相反它只是努力整合各种各样来源的系统发育和分类学的知识，包括发表的文献、基于网络的数据库、序列提交者的建议以及来自NCBI外部的分类学专家。因此NCBI的分类学数据库不是一个系统发育或分类学的“专家数据库”（Wheeler et al., 2000）。

获取序列所对应的分类学信息有两种方法。

一种方法，从NCBI网站下载gi与taxid对应表，在Taxonomy数据库的FTP地址下载。这个目录下有多个压缩文件，其中针对Windows操作系统的两个针对蛋白质序列和核苷酸序列的压缩文件分别是gi_taxid_prot.dmp.gz和gi_taxid_nucl.dmp.gz文件。这两个文件都只有两列，左边为gi号，右边为Taxid。由于这些文件非常大，因此用浏览器来打开这些文件几乎是不可能的。随着时间的推移，这两个文件会越来越大，不过速度不会是指数增长的，并且在美国东部时间的每个星期一2：00 am NCBI会对其进行更新。

对于Windows用户还有一个文件称为taxdump.zip文件。文件解压缩后包括1个*.prt文件和6个*.dmp文件。Gencode.dmp文件保存有不同的密码子表，与同目录的gc.prt联合使用；merged.dmp是保存有合并的taxid号的对应表；nodes.dmp是结点信息；division.dmp是较大的几个分类；names.dmp结点名称信息，每个id对应多行。这些数据被Phylogenie软件包中的blammer程序用于构建进化树。

利用ftp地址的连接利用Http或ftp方式将文件下载到本地，通过本地程序或脚本搜索文本，来建立gi号与Taxid之间的联系（图）。这种方法比较适合于在线服务的Web形式的程序，通过在本地不断地及时更新程序就可以完成这项工作。

第二种方法是对Taxonomy数据库进行API分析。NCBI用来保存Taxonomy信息的数据库名称为TAXON。

END，本文到此结束，如果可以帮助到大家，还望关注本站哦！

七彩虹主机七彩虹diy主机怎么样云主机促销(云主机何时优惠大)