行业讯息

欧易云平台表达量计算详细教程

背景知识介绍

 

基因表达量常见的衡量指标有:FPKM、TPM、RPKM

FPKM:Fragments Per Kilobase Million或者Fragments Per Kilobase Per Million Reads。

即每一百万条Reads中,比对到该基因的1000个base的fragments总数。

 

 

F1表示mapping到该基因的fragments总数

L1表示该基因长度

FT表示mapping到参考基因组的总fragments数

 

RPKM:Reads Per Kilobase Million或者Reads Per Kilobase Per Million Reads,即每一百万条Reads中,比对到该基因1000个base的Reads数。

 

R1 表示mapping到该基因的reads总数

L1表示该基因长度

RT表示mapping到基因组的总reads数

FPKM意义与RPKM的区别仅在于,Fragment 与 Read。


RPKM的诞生是针对早期的SE测序,FPKM则是在PE测序上对RPKM的校正。


Reads即是指下机后fastq数据中的每一条Reads,Fragments则是指每一段用于测序的核酸片段,在SE中,一个Fragments只测一条Reads,所以,Reads数与Fragments数目相等;在PE中,一个Fragments测两端,会得到2条Reads,但由于后期质量或比对的过滤,有可能一个Fragments的2条Reads最后只有一条进入最后的表达量分析。总之,对某一对Reads而言,这2条Reads只能算一个Fragments,所以,Fragment的最终数目是Reads的1到2倍之间。

 

TPM:Transcripts Per Kilobase of exon model per Million mapped reads (每千个碱基的转录每百万映射读取的Transcripts)。

 

R1表示mapping到该基因的Transcripts总数

L1表示该基因长度

Rtotal表示矫正后的所有基因的counts总和。

 

计算TPM分为3步:
step1:根据基因/转录本长度校正count值;假设某基因count值为R1,则校正后count值为:R1/(L1/1000),L1为该基因的长度;
step2:计算total 校正后count值;即所有基因的校正后count值总和,Rtotal;
step3:根据公式计算TPM;

 

欧易云平台-表达量计算

 

2.1 表达量计算小工具用于将转录组的counts数据转换成FPKM或者TPM标准化的数据。

参考右侧的使用说明,正确整理数据格式即可实现数据转换。

 

注:表头含义,第一列列名为id,第2-n列为样本名称,没有的填写为0,这里不允许不填,不填写会报错。

 

2.2页面参数选择

将整理完的表格,上传至表达量矩阵表位置

进行转换之前要先选择物种,选择的物种要与研究的目标物种一致,不同物种所选择的基因的长度是不一样的,这里要特别注意,如果选错物种则计算出的结果是错的。

 

 

2.3 标准化方法的选择:

主要有两种方法FPKM和TPM,适用于当前欧易转录组报告数据标准化方法。

 

 

2.4 结果展示:

点击结果下载,自动下载标准化后的数据。

 

 


长按扫码
咨询欧易生物技术工程师

 

猜你想看

1、科研轻而“易”举——欧易生物云平台焕新归来!

2、探"云"指南 | 欧易云ROC分析曲线

3、技术指南 | CUT&Tag技术大放送,Q&A助力了解详情

4、免疫研究工具天花板—IOBR包说明书来啦~

原创声明:本文由欧易生物(OEBIOTECH)学术团队报道,本文著作权归文章作者所有。欢迎个人转发及分享,未经作者的允许禁止转载。

上一页:云平台 | 欧易云ROC分析曲线下一页:谈一谈单细胞转录组测序细胞组成分析方法