snp数据库(snp 分子标记的检测技术)
大家好,感谢邀请,今天来为大家分享一下snp数据库的问题,以及和snp 分子标记的检测技术的一些困惑,大家要是还不太明白的话,也没有关系,因为接下来将为大家分享,希望可以帮助到大家,解决大家的问题,下面就开始吧!
数据库中job干吗用的
oracle数据库采用SNP进程来管理和运行JOB,SNP进程和实例中其他进程最大区别是这个进程被杀掉后,系统就会自动重新启动一个SNP,因此并不影响oracle实例运行.SNP进程本身也是被系统周期性地调用去查看数据字典中的JOB序列目录,看是否有JOB需要去运行,运行之后SNP就进入休眠状态.唤醒,SNP被调用的时间的设置是在数据库初始化文件里通过参数job_queue_interval设置进行的,数据库在打开的时候根据初始化文件去初始化SNP进程。
一、SNP参数说明参数
job_queue_interval的粒度不能太大,不要大于JOB执行的间隔(由参数interval来决定),否则的话可能造成有的作业无法执行.粒度也不能太细,否则会使系统频繁调用SNP而增加了系统的吞吐量,所以一定要根据具体环境中JOB而设定.
参数job_queue_interval的设定了系统中最多可运行的SNP数量。
二、当SNP开始执行一个任务时,其过程如下:
1.以任务所有者的用户名开始一个新的数据库会话。
2.当任务第一次提交或是最后一次被修改时,更改会话NLS设置和目前就绪的任务相匹配。
3.通过interval日期表达式和系统时间,计算下一次执行时间。
4.执行任务定义的PL/SQL。
5.如果运行成功,任务的下一次执行日期被更新,否则,失败则日志文件中的计数加1。
6.经过JOB_QUEUE_INTERVAL秒后,又到了另一个SNP运行时间,重复上边的过程。
三、作业失败如何处理
网上和书本上理论讲,当作业失败后,系统会在1分钟后重新运行这个JOB,如果还是失败,就在和第1次失败间隔2分钟的时候继续运行这个JOB,如果还是失败,就在和第2次失败相隔4分钟后运行这个JOB(可以用T=2t-1表示,t表示第1次失败后检测的次数),直到T≥interval(JOB正常工作的时间设置参数)后,系统检测的时间间隔就为interval.直到第16次失败就会将这个job置为broken.但是这些介绍都很粗略,如果需要真正设计一些合理的job的时候就会忽略一些细微的问题,而这些细微的问题恰好是关键的地方.
提出问题:说明在oracle后台有这样的机制,就是需要判断T是否T≥interval,那么在job失败后是先判断呢,还是等1分钟后检测之后才判断.
实验之后得出结果:先判断,然后才检测,其中由于操作误差,和理论值稍有轻微偏差.
snp 分子标记的检测技术
基因分型:是指利用数据库中已有的SNP进行特定人群的序列和发生频率的研究,主要包括因芯片技术,Taqman技术,分子信标技术和焦磷酸测序法等。
(一)、基因芯片技术
基因芯片技术:是在固相支持介质上进行分子杂交和原位荧光检测的一种高通量SNP分析方法。
优缺点:
优点是高通量,一次可对多个SNP进行规模性筛选,被捡起始材料也很少,操作步骤简单。缺点是芯片设计成本高,由于DNA样品的复杂性,有些SNP不能被捡起。
(二)、Taqman技术
在pcr反应系统中加入2种不同荧光标记的探针,他们分别与两个等位基因完全配对。探针运用了荧光共振能量转换技术,探针的5’端和3’端分别用特殊染料标记,称为供体-受体染料对或爆-猝灭燃料对。
(三)、分子信标技术
与Taqman技术相似,分子信标技术也是在PCR反应体系种加入荧光标记的探针与靶序列杂交,通过仪器检测荧光值的变化,进行基因分型。
优缺点:
分子信法在选择荧光染料时,不必像Taqman法那样考虑染料之间光谱的重叠性,一次可以使用4种或4种以上染料,同时对多个SNP进行分析。Taqman法和分子信标法优点都是简单操作,可以自动化;缺点是不能达到高通量分析,荧光探针费用高。
(四)、焦磷酸测序法
焦磷酸测序法是一种不依赖平板胶或毛细管电泳,不依赖DNA的荧光标记/激发/检测体系的序列分析技术,适用于已知SNP的序列验证及基因分型。焦磷酸测序法主要是由4种酶催化同一反应体系中的酶级联反应,包括DNA聚合酶、硫酸化酶、荧光素酶和双磷酸酶,反应底物为adenosine5’phosphosulfate和荧光素
TCGA数据库介绍
肿瘤基因组图谱(TCGA)计划由美国 National Cancer Institute(NCI)和 National Human Genome Research Institute(NHGRI)于 2006年联合启动的项目,目前共计研究 36种癌症类型。
TCGA利用大规模测序为主的基因组分析技术,通过广泛的合作,理解癌症的分子机制。提高人们对癌症发病分子基础的科学认识及提高我们诊断、治疗和预防癌症的能力。最终完成一套完整的与所有癌症基因组改变相关的「图谱」。
TCGA临床数据有两种:
数据文件有(HTSeq count/ FPKM/ FPKM-UQ)3种
介绍链接
生成raw read counts数据记录==在mirnas.quantification.txt==文件中。多比对用cross-mapped列标注。文件中包括associates miRNA IDs with read count and a normalized count in reads-per-million-miRNA-mapped。
RPM counts记录在==isoforms==.quantification.txt文件中。文件中包括miRNA表达量定量分析中的所有列,除此之外还增加了isoforms的基因组坐标信息以及miRNA信息(前体或成熟&accession)
使用Affymetrix SNP 6.0芯片,基于TCGA level 2数据,最终生成txt文件,包含5列(片段名称,染色体,基因组位置,结合到芯片上的探针数量,seqment_mean)
包括以下几个平台:
文件包括以下这些列:
如果你还想了解更多这方面的信息,记得收藏关注本站。