首页数据库embl数据库?DNA数据库的EMBL

embl数据库?DNA数据库的EMBL

编程之家2023-10-21102次浏览

大家好,embl数据库相信很多的网友都不是很明白,包括DNA数据库的EMBL也是一样,不过没有关系,接下来就来为大家分享关于embl数据库和DNA数据库的EMBL的一些知识点,大家可以关注收藏,免得下次来找不到哦,下面我们开始吧!

embl数据库?DNA数据库的EMBL

ncbi是什么数据库

NCBI是National Center for Biotechnology Information的缩写,指美国国家生物技术信息中心,建立于1988年。NCBI的初衷是为了给分子生物学家提供一个信息储存和处理的系统,除了建有GenBank核酸序列数据库(该数据库的数据资源来自全球几大DNA数据库,其中包括日本DNA数据库DDBJ、欧洲分子生物学实验室数据库EMBL以及其它几个知名科研机构)之外,NCBI还可以提供众多功能强大的数据检索与分析工具。

DNA数据库的EMBL

欧洲生物信息学研究所(European

Bioinformatics

Institute,

EBI)创建的一个核酸序列数据库。EMBL的数据来源主要有两部分,一部分由科研人员或某些基因组测序机构通过计算机网络直接提交,另一部分则来自科技文献或专利(Stoesser等,

1998)。EMBL与DDBJ、GenBank建有合作关系,他们分别在全世界范围内收集核酸序列信息,每天都将新发现或更新过的数据相互交换。

embl数据库?DNA数据库的EMBL

DNA数据库的规模正在以指数方式增长,平均不到9个月就增加一倍。1998年1月,EMBL中收录的序列数已超过一百万,包括15,500个物种,其中模式生物的序列占50%以上,它们包括人类(Homo

sapiens),

线虫(Caenorhabditis

elegans),啤酒酵母(Saccharomyces

cerevisiae),小鼠(Mus

musculus)和拟南芥(Arabidopsis

embl数据库?DNA数据库的EMBL

thalania)。

可以利用序列查询系统

SRS(Sequence

Retrieval

System)从EMBL数据库中提取有关信息(Etzold等,1996年)。SRS序列查询系统通过超文本链接将DNA序列数据库和蛋白质序列、功能位点、结构、基因图谱以及文献摘要MEDLINE等各种数据库联系在一起。利用EBI网站提供的BLAST或FastA程序,可以对EMBL数据库进行未知序列同源性搜索。

蛋白质序列数据库的数据库分类

PIR数据库按照数据的性质和注释层次分四个不同部分,分别为PIR1、PIR2、PIR3和PIR4。PIR1中的序列已经验证,注释最为详尽;PIR2中包含尚未确定的冗余序列;PIR3中的序列尚未加以检验,也未加注释;而PIR4中则包括了其它各种渠道获得的序列,既未验证,也无注释。除了PIR外,另一个重要的蛋白质序列数据库则是SwissProt。该数据库由瑞士日内瓦大学于1986年创建,目前由瑞士生物信息学研究所(Swiss Institute of Bioinformatics,简称SIB)和欧洲生物信息学研究所 EBI共同维护和管理。瑞士生物信息研究所下属的蛋白质分析专家系统(Expert Protein Analysis System,,简称ExPASy)的Web服务器除了开发和维护SwissProt数据库外,也是国际上蛋白质组和蛋白质分子模型研究的中心,为用户提供大量蛋白质信息资源。北京大学生物信息中心设有ExPASy的镜象。PIR和SwissProt是创建最早、使用最为广泛的两个蛋白质数据库。随着各种模式生物基因组计划的进展,DNA序列特别是EST序列大量进入核酸序列数据库。蛋白质序列数据库TrEMBL是从EMBL中的cDNA序列翻译得到的。TrEMBL数据库创建是于1996年[Bairoch, 2000],意为“Translation of EMBL”。该数据库采用SwissProt数据库格式,包含EMBL数据库中所有编码序列的翻译。TrEMBL数据库分两部分,SP-TrEMBL和 REM-TrEMBL。SP-TrEMBL中的条目最终将归并到SwissProt数据库中。而Rem-TrEMBL则包括其它剩余序列,包括免疫球蛋白、T细胞受体、少于8个氨基酸残基的小肽、合成序列、专利序列等。与TrEMBL类似,GenPept是由GenBank翻译得到的蛋白质序列。由于TrEMBL和GenPept均是由核酸序列通过计算机程序翻译生成,这两个数据库中的序列错误率较大,均有较大的冗余度。另一个常用的蛋白质序列数据库是已知三维结构蛋白质的一级结构序列数据库NRL-3D[Namboodiri, 1990]。该数据库的序列是从三维结构数据库PDB中提取出来。

几种常用Web数据库的比较

当前比较流行的Web数据库主要有:SQL Server、MySQL和Oracle。这3种数据库适应性强,性能优异,容易使用,在国内得到了广泛的应用 1.SQL Server是微软公司从Sysbase获得基本部件的使用许可后开发出的一种关系型数据库。目前最新的版本是SQL Server 2000,但SQL Server 7.0仍在广泛使用。由于均出自微软之手,使得SQL Server和Windows、IIS等产品有着天然的联系。事实上以Windows为核心的几乎所有微软的软件产品都采用了一致的开发策略,包括界面技术、面向对象技术、组件技术等,这样在微软的软件中很多都可以相互调用,而且配合得非常密切。因此如果用户使用的是Windows操作系统,那么IIS、 SQL Server就应该是最佳的选择。 2.MySQL是当今Unix或Linux类服务器上广泛使用的Web数据库系统。它于1996年诞生于瑞典的TcX公司,支持大部分的操作系统平台。MySQL的设计思想快捷、高效、实用。虽然它对ANSI SQL标准的支持并不完善,但支持所有常用的内容,完全可以胜任一般Web数据库的工作。由于它不支持事务处理,MySQL的速度比一些商业数据库快 2~3倍,并且MySQL还针对很多操作平台做了优化,完全支持多CPU系统的多线程方式。在编程方面,MySQL也提供了C、C++、Java、Perl、Python和TCL等API接口,而且有MyODBC接口,任何可以使用ODBC接口的语言都可以使用它。更重要的是,MySQL的源代码是公开的,可以免费使用,这就使得MySQL成为许多中小型网站、个人网站追捧的明星。 3.Oracle是Oracle公司开发出的一种面向网络计算机并支持对象关系模型的数据库产品。它是以高级结构化查询语言为基础的大型关系数据库,是目前最流行的客户/服务器体系机构的数据库之一。目前广泛使用的版本是Oracle 8i,它之所以备受用户喜爱是因为它具有以下突出的特点:(1)支持大型数据库、多用户和高性能的事务处理。Oracle支持最大数据库,其大小可达到几百千兆,可充分利用硬件设备;支持大量用户同时对数据库执行各种数据操作,并使数据征用最小,保证数据一致性;系统维护具有很高的性能,Oracle每天可连续24小时工作,正常的系统操作(后备或个别系统故障)不会中断数据库的应用;可在数据库级或子数据库级上控制数据的可用性。(2)Oracle遵守数据库存取语言、操作系统、用户接口、和网络通讯协议的工业标准,所以它是一个开放系统,保护了用户的投资。美国标准化和技术研究所(NIST)对Oracle Server进行过检验,完全与ANSI/ISO SQL89标准相兼容(3)实施安全性控制和完整性控制。Oracle为限制系统对各监控数据库存取提供可靠的安全性,并为可接受的数据指定标准,保证数据的完整性。(4)支持分布式数据库和分布式处理。Oracle为了充分利用计算机系统和网络,允许将处理分为数据库服务器和客户应用程序处理,所有共享的数据管理由数据库管理系统的计算机处理,而运行数据库应用的工作站集中于解释和显示数据。通过网络连接环境,Oracle将存放在多台计算机上的数据组合成一个逻辑数据库,可被全部网络用户存取。分布式系统像集中式数据库一样具有透明性和数据一致性。上面介绍的3种数据库产品是目前最常用的3种大型关系数据库系统,它们虽然在体系结构和操作方法上有许多相似的地方,但是在应用环境上还是各有侧重的。一个应用系统在选用数据库时,性能和价格时首先要考虑的两个因素,表1-1列出了这3种数据库在性能和价格上的对比情况,在使用时不同的系统应针对实际情况采用合适的方案。从用户的技术水平以及国内软件应用的现状来看,SQL Sever应该是一个较好的选择,尤其是对初学者而言。

好了,文章到这里就结束啦,如果本次分享的embl数据库和DNA数据库的EMBL问题对您有所帮助,还望关注下本站哦!

java邮件服务器 java mail 发邮件连接不上smtp服务器怎么办内部服务器错误500?网站打开显示500内部服务器错误,是什么原因怎么解决