行业讯息

云平台 | 欧易云ROC分析曲线

背景知识介绍

根据特征数据丰度,如差异物种或生物标记物等,将数据拆分为训练集及验证集,先对训练集构建随机森林模型,再用此模型预测验证集,构建ROC曲线。

ROC曲线的横坐标是false positive rate(FPR),纵坐标是true positive rate(TPR)。用于展示构建的分类器模型在验证集上的表现,从而评估该模型的效能。

 

欧易云平台-ROC分析曲线

 

2.1 ROC分析曲线小工具。

将特征数据表文件(包括微生物丰度表,基因表达谱,临床数据表)结合分组文件,可以对单一特征或复合特征绘制对应的ROC曲线。可选择进行10折交叉验证,后对10折进行平均处理得最终ROC曲线。具体输入文件格式,请参考页面右侧的使用说明。

 

图1 | 特征数据表文件示例

(行名为单个特征,列名为样本名)

 

2.2绘图特征选择。

选择复合特征,则构建单个模型,该模型构建基于数据表中的全部特征,因此结果中含有单个ROC曲线。若选择单特征绘图,则针对数据表内每个特征构建模型,且绘制对应的ROC曲线。

 

 

2.3 其他常用参数选择。

用户可以自行选择是否进行10折交叉验证。同时提供了多种绘图相关参数,包括选择是否在ROC结果图中展示具体的AUC值。字体类型选择。若选择进行了10折交叉验证,则可选择在结果图上展示全部10折交叉验证结果与标准差。同时参考线与ROC曲线的颜色也支持用户自定义。

 

 

2.4 结果说明。

ROC曲线横坐标为假阳性率,纵坐标为真阳性率,蓝色曲线为10折后取的平均曲线,AUC为曲线下面积,阴影部分为上下1个标准差。AUC值越接近1代表模型效能越好。越接近于0.5,则代表该模型真实性较低,更趋近与随机分类。

 


长按扫码
咨询欧易生物技术工程师

 

猜你想看

1、超强攻略!欧易云平台miRanda靶基因预测绘图工具你值得拥有!

2、谁不爱?一个运行更快的云平台

3、鼠标一点,轻松完成各种常见序列处理!

4、技术指南 | CUT&Tag技术大放送,Q&A助力了解详情

原创声明:本文由欧易生物(OEBIOTECH)学术团队报道,本文著作权归文章作者所有。欢迎个人转发及分享,未经作者的允许禁止转载。

上一页:刚刚!2022新SCI影响因子正式发布!下一页:欧易云平台表达量计算详细教程