最新要闻
- 汽车大灯清洗功能有用吗_汽车大灯清洗功能什么作用
- 每日关注!韩系车中国市场遇冷!悦达起亚被曝管理岗轮休 一休就一年
- 理想L8成中保研碰撞史最佳SUV:“堡垒车身”功不可没_世界速递
- TCL发布Mini LED电视Q10H:疯狂3000尼特亮度 98寸售价29999元
- 贵南县气象台发布暴雪蓝色预警信号【2023-05-09】|天天观察
- 越南央行可能会在银行挤兑现象中尽早采取行动。
- 播报:机械盘真的没人买了 HDD出货量再次暴跌:价格神奇上涨
- SSD价格见底了!再下降后果危险:闪存厂商要破产 世界热讯
- 环球观天下!海洋气息渐浓 新款比亚迪宋PLUS DM-i申报: 装上海豹同款大灯
- 真的在做了!任天堂官方回应新一代Switch消息:细节无可奉告_全球新要闻
- 首发4999元 KTC新款电竞显示器上架:2K OLED高刷屏 四轴调色|每日热讯
- 全球今日讯!祥鑫科技:5月8日接受机构调研,信达证券、华安基金等多家机构参与
- 天天日报丨谷爱凌:90%网络传言都是假的 不会为负面评价难过
- 午睡过久会长胖吗?研究发现:午睡时长影响健康 30分钟是关键点-全球最新
- 曾被称为格力接班人!格力直播间孟羽童视频被删除 天天动态
- 淄博90后女店主2个月瘦了10斤:1天烤鸡腿上千个 世界快讯
手机
iphone11大小尺寸是多少?苹果iPhone11和iPhone13的区别是什么?
警方通报辅警执法直播中被撞飞:犯罪嫌疑人已投案
- iphone11大小尺寸是多少?苹果iPhone11和iPhone13的区别是什么?
- 警方通报辅警执法直播中被撞飞:犯罪嫌疑人已投案
- 男子被关545天申国赔:获赔18万多 驳回精神抚慰金
- 3天内26名本土感染者,辽宁确诊人数已超安徽
- 广西柳州一男子因纠纷杀害三人后自首
- 洱海坠机4名机组人员被批准为烈士 数千干部群众悼念
家电
R数据分析:生存数据预测模型的建立和评价(二)timeROC与决策曲线
上篇文章依照jama surgery的一篇文章给大家写了生存数据预测模型评价的C指数、校准曲线和模型验证结果的做法,其实生存数据预测模型的评价方法还有很多,本期接着往下看。
Time-dependent ROC
当结局是一个二分类变量的时候,考虑模型性能的两个指标一个叫灵敏度和特异度,我们希望两个都大,模型在不同的cutoff点时这两个指标如何变化的图示就是ROC曲线。详细参考之前的逻辑回归分类器的文章。
上面的说法是没有考虑时间因素的,认为结局是固定的,这个在大多数情况下都是适用的,就是说一般情况下我们的结局都是测一次或者说结局是不随着时间变化的,比如结局只有一个点,可以直接用ROC曲线评估模型。
(相关资料图)
The classical (standard) approach of ROC curve analysis considers event (disease) status and marker value for an individual as fixed over time, however in practice, both the disease status and marker value change over time
但是遇到生存数据,比如随访的病人这个时间点没死,随访时间延长可能就死了,这个时候模型的灵敏度和特异度在各个时间都不一样,光说ROC就没有意义,需要加上时间,就叫做time-dependent ROC。
捋一捋生存分析模型判断生存情况的原理:
模型会给每一个个案预测一个风险x(文献中叫做个体的marker),t时刻归类到死亡或者存活需要一个标准c,模型根据这个风险x和标准c的大小比较结果判定个案是否死亡(阳性阴性)。
模型判断的是否死亡与个案的实际状况进行对比就有了混淆矩阵和灵敏度特异度。
Di(t)是t时间的实际状态,t时刻的敏感度和特异度的计算公式就是下图:
就是说t时刻个案确实是阳性Di(t)=1的同时模型也说我是“阳性”、“死亡”(marker比标准c大)叫做模型的真阳性率也就是敏感度,模型能将阳性个案识别为阳性的能力。
同理sp(c,t)就是特异度,是真阴率,模型能将无病识别为无病的能力。
本质上ROC曲线可以根据灵敏度和特异度两个指标来绘制的,我们知道了时间依赖的灵敏度和特异度,曲线也就可以做出来了。
上面的过程简化下就是:时间依赖的ROC就是不同时刻的结局计算出来的灵敏度和1-特异度构成的ROC。理论上生存结局可以有无数个ROC。
研究目的的不同,Time-dependent ROC又可以进行细分:
(1) cumulative/dynamic (C/D),
(2) incident/dynamic (I/D)
(3) incident/static (I/S)
看下图,ABCDEF6个个案进行随访,模型的判定是否死亡的标准是c:
这三种ROC的计算就在于如何界定某时刻t的阳性个案,比如(C/D)就是t时刻所有累计的阳性都算数,所以此时算灵敏度的分母按照下图就是ADE,随着时间的增大,阳性数量会增大,在计算特异度的时候只考虑DF的概率,所以叫做累计动态cumulative/dynamic (C/D),这种方法也是临床使用最多的,它可以评价到t时刻为止模型的表现。
第二种叫做发病动态incident/dynamic (I/D),在这种情况下只有A作为t时刻的实际阳性,BE都不是(在计算的时候BE直接扔掉了),然后CDF当作阴性,在算特异度的时候只考虑DF的概率;第三种叫做发病静态incident/static (I/S),这种情况下依然是看t时刻发病,依然只有A作为阳性,超过某个区间(0,t*)都没有发病的作为阴性,即图中的DF作为阴性。这两种情况文章应用很少,不做重点记忆。
实操
画时间依赖ROC用到的包叫做timeROC,主要参数如下所示:
timeROC函数接受的第一个参数T是时间,delta参数是生存状态,删失一定要设定为0。还有marker参数,这个是模型的预测的自变量,我现在有数据如下,想做一个以
bili,chol,albumin为自变量形成的COX模型的时间依赖ROC,并且将时间设定在时间的每个5分位数上,我就可以写出如下代码:
timeROC(T=data$time, delta=data$status,marker=data$bili, other_markers=as.matrix(data[,c("chol","albumin")]), cause=1,weighting="marginal", times=quantile(data$time,probs=seq(0.2,0.8,0.1)), iid=TRUE)
输出结果如下,并且可以用confint得到AUC的置信区间:
然后就可以出图了,我们用plot函数设定好time参数(time一定要和timeROC的参数对应起来)就可以直接出图了如下:
plot(ROC.bili.cox,time=999.2)
输出如下,time改动的话图也会相应改动:
这样出来的画其实是很占空间的,因为你每个时间点都得画个图。常见的在文献中都会将几个时间点的ROC画在一个图上,然后加上图例进行区分,比如下面这篇来自Diabetes Care的时间依赖ROC图就是这样表示的:
那么对于我们的图,我们也可以进行修改成像文献中一样,直接用plot函数将add参数改为TRUE,然后依次画出各个时间点的ROC就可以,参考代码及输出如下:
plot(ROC.bili.cox,time=999.2)plot(ROC.bili.cox,time=1307.4,add = T,col="blue")plot(ROC.bili.cox,time=2555.7,add = T,col="green")legend(.7, .2, legend=c("关注", "公众号","Codewar"), col=c("red", "blue","green"), lty=1, cex=0.7,bty = "n")
以上就是Time-dependent ROC的所有内容,我们接着往下看决策曲线的做法。
决策曲线
关于预测模型的决策曲线和校准曲线之前我有专门一篇文章做详细的解释,那么具体到生存分析中,我们依然来回忆一下:
Diagnostic and prognostic models are typically evaluated with measures of accuracy that do not address clinical consequences. Decision-analytic techniques allow assessment of clinical outcomes but often require collection of additional information may be cumbersome to apply to models that yield a continuous result.
就是我们知道模型的评估指标,比如对于生存分析来讲我们的模型Brier score和C-index表现的再好,其实也只能告诉你,模型本身不错。
但是指导临床决策我们还要考虑受益的问题,比如对于癌症来讲不必要的活检的危害其实是比没发现癌症的危害小很多的,我们宁愿病人多做一个检查也绝不愿意漏诊一个癌症。那么多少个额外活检的危害抵得上一次漏诊的危害,这个值是可变的,也是我们不知道的,但是我希望的的这个值无论如何变,通过我们的模型做出临床决策都是受益比瞎猜要好的,这个是我们的终极目的。而决策曲线就是看实际情况是不是符合刚刚的终极目的。
内在的逻辑请参看我之前文章。还有JAMA Guide to Statistics and Methods中的相应介绍,贴在下面就不给大家翻译了:
文献中常见的决策曲线图长这样
上图是来自jama子刊的一篇文章,它是将两个模型的dca画在了一个图上,我们依然是在R中进行对照复现。
做决策曲线用到的函数是dca函数,具体到cox模型我们需要指定时间点time:
同时经常出错的地方还在formula参数的写法,形成模型整体的决策曲线需要写模型的marker就是模型的预测风险,范围必须在0-1。这个是很多同学做错的地方。
比如我对做好的cox模型将time设定为15然后做决策曲线的示例代码如下:
dca(Surv(status, time) ~ cancerpredmarker, data = mydata, time = 15)
其中cancerpredmarker是我拟合的cox模型对个案的风险预测值,上图就显示了我的预测模型的决策曲线,多数文章也会对多个预测模型的DCA放一起进行比较,比如我做了模型1得到marker命名为向量“关注”,模型2命名为“公众号Codewar”,下面代码即刻让两个模型的DCA同时显示:
dca(Surv(status, time) ~ 关注+公众号Codewar, data = mydata, time = 15, thresholds = 1:50 / 100)
形成的图示如下:
具体图的各种风格大家还可根据ggplot的语法进行图里位置和图片主题风格的修饰。此文略过。还要给大家提醒的是如果模型是竞争风险做法依然是一样的,但是一定要将结局编码为因子同时删失水平编码为“censor”,其余做法都一样。
Competing risks endpoints are handled similarly to survival endpoints. The outcome must be defined as a factor, with the lowest level called "censor", and the other levels defining the events of interest. The dca() function will treat the first outcome listed as the outcome of interest
好啦,生存数据的预测模型的做法和评价系列到这儿就告一段落了,整体还是比较全面的,全部吃透发个jama应该在做法上不成问题了,有idea的话尽快联系我实施吧
关键词:
R数据分析:生存数据预测模型的建立和评价(二)timeROC与决策曲线
汽车大灯清洗功能有用吗_汽车大灯清洗功能什么作用
诺贝尔经济学奖得主称美国可能债务违约
每日关注!韩系车中国市场遇冷!悦达起亚被曝管理岗轮休 一休就一年
理想L8成中保研碰撞史最佳SUV:“堡垒车身”功不可没_世界速递
TCL发布Mini LED电视Q10H:疯狂3000尼特亮度 98寸售价29999元
贵南县气象台发布暴雪蓝色预警信号【2023-05-09】|天天观察
Linux 处理CPU和内存参数的方式总结
越南央行可能会在银行挤兑现象中尽早采取行动。
播报:机械盘真的没人买了 HDD出货量再次暴跌:价格神奇上涨
SSD价格见底了!再下降后果危险:闪存厂商要破产 世界热讯
环球观天下!海洋气息渐浓 新款比亚迪宋PLUS DM-i申报: 装上海豹同款大灯
真的在做了!任天堂官方回应新一代Switch消息:细节无可奉告_全球新要闻
首发4999元 KTC新款电竞显示器上架:2K OLED高刷屏 四轴调色|每日热讯
【开源游戏】Legends-Of-Heroes 基于ET 7.2的双端C#(.net7 + Unity3d)多人在线英雄联盟风格的球球大作战游戏。|全球简讯
世界快看:数据结构与算法大作业:走迷宫程序(C语言,DFS)(代码以及思路)
全球今日讯!祥鑫科技:5月8日接受机构调研,信达证券、华安基金等多家机构参与
天天日报丨谷爱凌:90%网络传言都是假的 不会为负面评价难过
午睡过久会长胖吗?研究发现:午睡时长影响健康 30分钟是关键点-全球最新
曾被称为格力接班人!格力直播间孟羽童视频被删除 天天动态
淄博90后女店主2个月瘦了10斤:1天烤鸡腿上千个 世界快讯
天天热点评!苹果在iPhone 14上挤牙膏!果粉立马用脚投票:好评率跌了
前法鹰主管:当年签镰田大地时他还很年轻,但能力让我想到齐达内
华为云数据库首席专家谈分布式数据应用挑战和发展建议 天天报资讯
如何完整地掌握一个机器学习模型 世界观点
数据结构与算法大作业:走迷宫程序(实验报告)_快资讯
Ubuntu20
你还在纠结怎么选IDE吗?常用IDE工具分享|环球观热点
赛轮轮胎:公司开具的电子商业承兑汇票均已结清|世界速看料
00后男生取名江胡传奇:妈妈姓胡 爸爸喜欢玩《传奇》 每日速读
取代安卓14!OpenHarmony 4.0即将公测:华为鸿蒙4.0“母系统”
世界看点:任天堂开始乱杀!看《塞尔达传说:王国之泪》合法游戏画面也被封
京东APP大升级!12.0上线:应简尽简 营销和弹窗少了_最资讯
1799元 九号平衡车L8奥特曼定制版明日首销:隔壁小孩羡慕哭了
当前速看:金华市东苑小学新生入学网上模拟报名详情2023
SaaS化开源项目之HouseKeeper云上部署实践_每日动态
加要求中方一领事官员离境_中方反制|今日讯
世界视讯!今日欧元/美元汇率行情预测(2023年5月9日)
造车新势力转守为攻!小鹏汽车法务部上线:网络不是法外之地
公司无双休求职者礼貌回拒 HR:想躺平就回老家种地
每日视点!朝日台资深员工游戏氪金过度 年薪1500万仍盗窃公司电脑倒卖
环球今日讯!景区回应功德箱贴收款码:考虑到年轻人很少带现金 与时俱进
乘联会:特斯拉涨价是很好的信号!避免消费者过度期待降价_世界视点
世界快报:广东五华县政府控制的屋顶光伏资源特许经营项目开工
js中的变量 环球速看
JSP_5.8_课堂笔记|世界视点
由浅入深学MySQL之事务全攻略|天天微资讯
微头条丨今天看到博客园的捐款求助,园龄17年6个月的我有些感慨
运营商三要素验证原理,这篇文章就够了!
对话上海国企 | 因科而起、由科而兴、科有所为,上海建科赋能城乡建设新服务
阿坝县气象台发布雷电黄色预警信号【III级/较重】【2023-05-09】 热消息
90元大额券:雪中飞高端含桑蚕丝商务POLO衫49元到手_世界今热点
世界热消息:电脑不怕丢了?鲁大师推出电脑防盗助手:支持定位、丢失锁机
当前报道:中文通用大模型评测基准SuperCLUE发布:讯飞星火认知大模型国内第一 文心一言垫底
《漫长的季节》"爹味"上热搜 部分女性观众:无法共情 全球看热讯
当前视讯!票价20元 全国首条旅游云巴线今日开通:比亚迪100%自主知识产权
精彩看点:广州地铁回应“一夜醒来欠地铁600多万”:乘客及时出站,正查原因
Keycloak 创建和修改自定义用户信息
KubeEdge在边缘计算领域的安全防护及洞察
【吐槽贴】项目经理如何进行高效沟通?_每日消息
【三维CAD软件】上海道宁为您带来国际一流的国产自主可控的三维CAD软件——天工CAD_环球资讯
《边境》之后 中国玩家的国产情怀还能被消费几次?_天天看热讯
周杰伦入职中国移动:工号0716 动感地带至今20年终于“转正”_天天热消息
免费授权歌曲给刘畊宏跳操超大方!周杰伦回应:谈钱伤感情-独家焦点
豆瓣9.4分!《漫长的季节》被吐槽“爹味”浓-当前关注
2023年非京籍四证审核不通过,这些自救方案你一定要提前了解
签名介绍
当前热门:外贸产业集群“掘金”劲头足
峰米激光电视C3来了:ALPD激光显示技术 亮度高达400nit
有望下跌0.33元/升!国内油价下周二晚将迎来调整
当前快报:史上最小发光二极管面世:可让手机摄像头秒变全息显微镜
广东省2023年高校招生平行志愿投档及录取实施办法
SpringBoot的@Configuration注解
安装nginx--银河麒麟V10Kylin Linux
C#自定义异常就这么简单
网关神器traefik的,etcd和https配置例子
一行代码搞定 font-size 响应式
痛别!百岁抗日英雄张友仁逝世
环球热文:比亚迪老对手发威!哈弗枭龙系列上市定档:四驱体验两驱价格
5月上映!迪士尼《小美人鱼》世界首映礼:黑小美人鱼主演亮相
小米稳居中国电视市场第一 国外品牌份额合计不到5%_今日讯
付费会员该在截止日当天几点过期?法院判了
三星、谷歌联手优化:Android 14要彻底告别杀后台了
当前资讯!北斗西虹桥基地:积极打造具有全球影响力的产业集聚高地
快看:品类超全的免费 API 大全整理
五种开源协议的比较(BSD,Apache,GPL,LGPL,MIT)
开源.NetCore通用工具库Xmtool使用连载 - 散列算法篇|世界视点
Centos7安装MySQL详细步骤(配置开机自启)|天天关注
“五一”假期后机票价格大幅回落 端午出游开始发力 环球热资讯
诺基亚账户怎么注册?诺基亚账户忘记了怎么找回?
【世界独家】入口软糯爽滑 冻颜密码燕窝椰汁3.1元清仓
天天简讯:五一成绩单出炉!河南成为最大赢家
《巨齿鲨2》新海报出炉:吴京、斯坦森直面深海巨鲨 超霸气
上海展会外国人插队领冰淇淋被拒 网友:宝马MINI脸红吗
全球最资讯丨电动“吉姆尼”背个“大手表”!五菱宝骏悦也5月25日上市
怎么将MP4格式转换成RM格式?rm格式用什么播放器打开?
3dmark11怎么看通过率?3dmark11注册码有哪些?
华为p30上市时间和价格是什么?华为p30怎么升级鸿蒙系统3.0?
联想Thinkpad x200什么时候上市的?联想Thinkpad x200电脑参数
烤乳猪是哪个菜系的?烤乳猪的做法与配料是什么?