首页数据库geo数据库分析?GEO数据库有哪些分析工具各有哪些用途

geo数据库分析?GEO数据库有哪些分析工具各有哪些用途

编程之家2023-10-21107次浏览

大家好,今天来为大家分享geo数据库分析的一些知识点,和GEO数据库有哪些分析工具各有哪些用途的问题解析,大家要是都明白,那么可以忽略,如果不太清楚的话可以看看本篇文章,相信很大概率可以解决您的问题,接下来我们就一起来看看吧!

geo数据库分析?GEO数据库有哪些分析工具各有哪些用途

GEO数据库有哪些分析工具各有哪些用途

【答案】:主要分析工具有:①Find genes工具:帮助快速寻找指定基因的功能;②Cluster heatmap工具:聚类图分析工具;③Query Group A versus B工具:两个子集比较下的查询工具。④Experiment design and Value distribution:实验设计和数据分布查看工具,用户可大概了解一个数据集的数值分布状态。⑤GEOBLAST,GEO数据比对工具,供用户使用BLAET搜索感兴趣的核苷酸序列的相似序列的GEO基因表达谱。⑥Subset effects:子集效应。如果不同子集间的基因表达值或秩次存在显著性差异,那么这些表达谱会被自动标记,用户可以通过这个特性检索所有相关的表达谱。

geo数据库数据如何标准化

标准化的方法就是Counts值:

对给定的基因组参考区域,计算比对上的read数,又称为raw count(RC)。

aw count作为原始的read计数矩阵是一个绝对值,而绝对值的特点是基因长度、测序深度不同不可以比较。所以我们要进行标准化把count矩阵转变为相对值,去除基因长度、测序深度的影响,我们采用分析的。

标准化的三种方法得出的三种值:

RPM(Reads per million mapped reads):RPM方法:10^6标准化了测序深度的影响,但没有考虑转录本的长度的影响。

geo数据库分析?GEO数据库有哪些分析工具各有哪些用途

RPKM/FPKM方法:

103标准化了基因长度的影响,106标准化了测序深度的影响。TCGA的数据分析多采用这种结果。

TPM(Transcript per million):TPM的计算方法也同RPKM/FPKM类似,TPM可以看作是RPKM/FPKM值的百分比。

具体判断方法:

表达量是否需要重新标准化。

可以通过boxplot函数观察一下样本表达丰度值的分布是否整齐进行判断。

geo数据库分析?GEO数据库有哪些分析工具各有哪些用途

是否需要log2:根据数据值的大小。

如果表达丰度的数值在50以内,通常是经过log2转化的。如果数字在几百几千,则是未经转化的。

geo数据库的优点

免费且只要是目前已经发表的论文,论文中涉及到的基因表达检测的数据都可以通过这个数据库中找到。

GEO数据库是一个储存芯片、二代测序以及其他高通量测序数据的一个数据库。利用这个数据库,我们可以检索到其他一些人上传的一些实验测序数据。

不涉及任何检测原理的角度来说的话,所谓的高通量检测,其实就是一次性检测很多指标变化的技术。例如我们说的表达谱数据,就是来检测基因表达水平。比如我们要对一个人来进行高通量检测的话,就能知道这个人上万个基因的表达水平了。

由于GEO数据库和我们之前介绍的gene数据库 [数据库推荐]gene:基因相关信息查询以及我们常用来搜索文献的pubmed都是一个机构的。使用这个数据库,我们需要做的就是就是就是提供检索式。检索式可以是简单的几个关键词,也可以是制定特殊的检索式。

如何使用geo数据库分析基因表达与预后的关系

在NCBI的GEO数据库中,系列(series)中matrix目录下的GSExxx_series_matrix.txt.gz文件,其中的数据是什么含义。是不是别人已经标准化好的数据(而且是log2处理过的),我可以用来直接求倍数然后看表达差异?

GSExxx_series_matrix.txt.gz数据格式和楼主的数据截图类似,差别在于列标题,楼主的列标题是GSMxxxxxx.CEL,而从GEO下载的GSExxx_series_matrix.txt.gz的数据,列标题是GSMxxxxxx,无“.CEL”。

ID_REF GSM413894 GSM413895 GSM413896 GSM413897 GSM413898 GSM413899 GSM413900 GSM413901

AFFX-BioB-3_at 8.472861 7.58379 7.726437 7.808923 8.604332 8.60782 8.343771 8.628157

AFFX-BioB-5_at 8.65537 7.696443 7.996466 7.719412 8.770542 8.652599 8.404749 8.911979

AFFX-BioB-M_at 8.813823 7.890245 8.127718 8.306655 9.011187 8.91993 8.566244 9.06862

AFFX-BioC-3_at 9.633732 9.024885 9.136383 9.120244 10.2995 10.15661 10.00954 10.25113

AFFX-BioC-5_at 9.756588 9.118516 9.137075 9.544678 9.945514 9.793713 9.544567 9.861975

AFFX-BioDn-3_at 12.0726 11.67344 11.62215 11.9874 12.16764 11.97144 11.81811 12.0963

如果你还想了解更多这方面的信息,记得收藏关注本站。

sql查询所有数据库(怎样用SQL语句查询一个数据库中的所有表)app数据库(手机app用什么数据库比较好)