首页数据库uniprot数据库?uniprot蛋白质序列数据库由哪几部分组成各有什么特点

uniprot数据库?uniprot蛋白质序列数据库由哪几部分组成各有什么特点

编程之家2023-10-1978次浏览

大家好,关于uniprot数据库很多朋友都还不太明白,不过没关系,因为今天小编就来为大家分享关于uniprot蛋白质序列数据库由哪几部分组成各有什么特点的知识点,相信应该可以解决大家的一些困惑和问题,如果碰巧可以解决您的问题,还望关注下本站哦,希望对各位有所帮助!

uniprot数据库?uniprot蛋白质序列数据库由哪几部分组成各有什么特点

uniprot蛋白质序列数据库由哪几部分组成各有什么特点

将PIR、SWISS-PROT和TrEMBL3个蛋白质数据库统一-起来组建而成,包含3个部分:

(1) UniProt Knowledgebase(UniProtKB),这是蛋白质序列、功能、分类、交叉引用等蛋白质知识库,记录经过人工筛选和注释;

■(2) UniRef( UniProt Non-redundant Reference)

数据库,将密切相关的蛋白质序列组合到一条记录中,以便提高搜索速度;目前,根据序列相似程度形成3个子库,即UniRef100、UniRef90和UniRef50;

■(3) UniParc(UniProt Archive),是UniProt存档库,

收录所有蛋白质序列。用户可以通过文本查询数据库,可以利用BLAST程序搜索数据库,也可以直接通过FTP下载数据。

uniprot数据库?uniprot蛋白质序列数据库由哪几部分组成各有什么特点

如何在uniprot数据库中查找某个蛋白序列

NCBI

NCBI下有很多数据库,以下是蛋白质序列PopSet

包括研究1个人群、1个种系产生或描写人群变化的1组组联合序列。PopSet既包括核酸序列数据又包括蛋白质序列数据。

Entrez

功能强大,在于它的大多数记录可相互链接,既可在同1数据库内链接,也可在数据库之间进行链接。当应用BLAST软件比较某氨基酸或DNA序列与库中其他氨基酸或DNA序列差异即进行类似性检索时,则会触及到蛋白质库或核苷酸库的库内链接。库间链接产生在核苷酸数据库内的记录与PubMed库中已发表序列的引文间的链接,或蛋白质序列记录与核苷酸序列库中编码它的核苷酸序列间的链接。BLAST(Basic

Local

uniprot数据库?uniprot蛋白质序列数据库由哪几部分组成各有什么特点

Alignment

Search

Tool)是用于序列类似性检索的1个重要数据库,是辨别基因和基因特点的工具。该软件能在15秒内完成全部DNA数据库的序列检索。BLAST记录的相干度有明确的统计学解释,以便更容易地将相干记录与随机的数据库记录像辨别。在NCBI主页的左工具条中,点击BLAST图标,即进入BLAST主页。

BLAST

主页提供了几种BLAST检索软件。其中BLAST2.0是1种新的BLAST检索工具,它在原有基础上作了改进,运行速度更快,灵敏度更高,同时具有Gapped

BLAST

和PSI-BLAST两种软件的新功能。Gapped

BLAST

允许在对准的序列中引入空位(碱基缺失或插入),引入空位(Gaps)意味着在比较两个相干序列时不会出现中断(Break)现象。这些空位对准的记分系统更能反应相干序列的类似程度。PSI-BLAST的全称是Position-Specific

Iterated

BALST,即特殊位置重复BLAST,它提供了自动、易用的概貌(Profile)检索,是查找序列同源的有效工具。Dnastar

可以用于解决你踢完的后半个问题

UniProt数据库怎么看

由于蛋白质组学的发展,使得蛋白质数据库也日益丰富,数据库的专一性及综合性均增强,而且,通过超文本的链接,可以使多个数据库进行相互的衔接。目前,关于蛋白质的结构,蛋白质质谱等数据库均较多,今天就来讲讲使用频率最高且冗余度最低的uniprot数据库。

拿到蛋白质组学鉴定结果后,看懂数据库当然是第一步的。

以常见的牛血清白蛋白(BSA)为例,首先下载BSA的数据库信息

首先sp表示,Swiss-Prot数据库是注释精炼的蛋白序列库,它的所有序列都经过了科学家的查阅文献核实(reviewed, manually annotated)。

P02769是蛋白在uniprot上的ID号,即蛋白的身份证号。

ALBU_BOVIN是蛋白在uniprot上的登录名,跟P02769是一个作用。

Serum albumin是蛋白名称,即蛋白的姓名啦。

OS表示Organism,也就是物种名称,数据库中的物种名称一般为拉丁名称,牛血清白蛋白Bostaurus当然是牛的拉丁。

GN表示gene name,即基因名称。

PE表示ProteinExistence,即蛋白的可靠性,PE=1、2、3、4、5分别对应如下,可以看出数字越小可靠性越高:

1. Experimental evidence at protein level

2. Experimental evidence at tranlevel

3. Protein inferred from homology

4. Protein predicted

5. Protein uncertain

SV表示SequenceVersion,即序列版本,即蛋白的身份证第二代,第三代……

这里需要指出的是,除了sp,有时还会出现下图的情况。

唯一不同的只有Tr,这里Tr,TrEMBL数据库全称“Translation of EMBL”,是从EMBL中的cDNA序列翻译得到的,其中TrEMBL收录的是未经人工注释的编码DNA序列翻译数据。(unreviewed, automatically annotated),不难看出,相比之下,sp数据库更可靠。

登陆uniprot官方网站(http://www.uniprot.org/,见截图)即可看到,目前uniprot网站收录的sp数据库有554241条蛋白条目,tr数据库有84827567条。当然这一数据每天都有更新。更多数据库参考信息相关链接:

UniProt数据库怎么看

标签:imageremfromcodemamicode不难科学家mattaurus

为什么说swiss-prot是重要的蛋白质序列数据库

SWISS-PROT是含有详细注释内容的蛋白质序列数据库,由欧洲生物信息学中心(EBI)维护,目前已合并入 UniProt数据库,旨在帮助基因组和蛋白质组以及相关的分子生物学研究人员提供有关蛋白质氨基酸序列的最新信息。

SWISS-PROT中尽可能减少了冗余序列,并与其它30多个数据建立

了交叉引用,其中包括核酸序列库、蛋白质序列库和蛋白质结构库等。SWISS-PROT数据库包含了EMBL核酸序列数据库中被经过仔细检查和准确注释了

的蛋白质序列,一般地,任何蛋白质序列数据的搜寻和比较都应从SWISS-PROT开始。

SWISS-PROT蛋白质序列数据由大量序列条目组成,每一个序列条目

有其自己的格式。为了标准化的目的,SWISS-PROT的格式与EMBL核酸序列数据库的格式尽可能类似。SWISS-PROT涉及已知蛋白质的序列、

引用文献信息、分类学信息、注释等,注释中包括蛋白质的功能、转录后修饰、特殊位点和区域、二级结构、四级结构、与其它序列的相似性、序列残缺与疾病的关

系、序列变异体和冲突等信息。利用序列提取系统(SRS)可以方便地检索SWISS-PROT和其它EBI的数据库。SWISS-PROT只接受直接测序

获得的蛋白质序列,序列提交可以在其Web页面上完成。

好了,关于uniprot数据库和uniprot蛋白质序列数据库由哪几部分组成各有什么特点的问题到这里结束啦,希望可以解决您的问题哈!

linux永久修改主机名?Linux永久临时修改主机名土地利用总体规划数据库标准 土地利用总体规划图怎么做的