研究背景 重症烧伤是一种严重的创伤,其病情凶险,并发症多,治疗难度大。其中脓毒症 (sepsis)和多器官功能不全综合症(multiple orgall dys矗mction s),11drome,MODS)是 重症烧伤患者治疗中最常出现的并发症,也是导致重症烧伤患者死亡的重要原因。近 年研究发现,MODS的本质就是严重脓毒症或脓毒性休克。早期诊断并预警脓毒症休 克或MODS是重症烧伤患者临床救治中的关键问题之一。随着信息技术的发展,大数 据已经开始逐渐进入到医学领域,特别是在临床医学研究中。大数据技术对繁杂临床 数据的分析及处理能力十分出色,有助于深入了解重症烧伤患者的病程变化规律,辅 助临床决策。 研究目的 采用大数据处理的基本思想及技术对重症烧伤患者的临床数据进行挖掘和分析, 探索重症烧伤患者临床数据的模式特征,寻找脓毒症休克的预测模型。 研究方法 通过电子病历系统及纸质病历收集纳入107例重症烧伤患者的临床数据。对数据 进行预处理后,首先采用无监督的算法(如分层聚类、基于主成分分析的分层聚类等) 和机器学习等方法对数据进行分析,探索患者聚类亚组分类和临床结局之间的关系。 而后使用质心算法对数据进行降维处理,提取患者发生脓毒症休克前的特征性数据变 化趋势,建立脓毒症休克的预测模型并进行验证。采用R i386 3.1.2、Matlab 7.0和SPSS 18.O等软件对数据进行数学计算和统计分析。通过比较F值筛选主要变量,使用线性 随机效应模型分析、提取数据变化趋势。最后使用C语言开发能够预测脓毒症休克发 生的通用软件。 结果: 1、本课题采集的重症烧伤患者临床数据时相点共2257个,每个时相点有58个观 察指标,共130906个数据值。 2、重症烧伤患者的临床数据可使用HCPC方法分为10个亚类。 6 万方数据第三军医大学硕士学位论文 3、通过比较不同亚类的组间均值差异,得出:体温(T)、呼吸频率(R)、舒 张压(DP)、收缩压(SP)、尿量(血ne)、血肌酐(CR)、血尿素氮(BUN)、 总胆红素(TBIL)、血小板(PLT)、肌酸激酶(CK)、氧分压(p02)、二氧化碳 分压(pC02)、乳酸(1actate)、碳酸氢根(HC03。)、氧合指数(oxygenation)为差 异性最明显的指标。使用上述15个指标替代原来的58项指标,可对聚类分类的标准 进行简化。 4、重症患者聚类分组与其临床结局关系密切。其中clusterl、cluster2、cluster4、 cluster8、cluSter9和clusterl0分类中患者好转的几率分别为91.00%、89.70%、60.50%、 66.40%、71.70%和80.70%。C1uster3和cluster5分类中患者死亡的几率分别为70.50% 和82.10%。cluster6和cluster7分类中患者发生脓毒症休克的几率分别为77.90%和 70.40%。 5、通过对患者质心值随时间变化的趋势图分析可知,死亡患者的质心变化大体呈 下降趋势,而存活患者相反,呈总体上升趋势。 6、通过提取重症烧伤患者发生脓毒症休克前的质心值变化特征,建立了脓毒症休 克的预测模型: 少{『=(0.2527280+N(0,6.450e-05))+(-0.0251963+N(0,1.273e-05))x+占i, 其中勺为随机因素,均为第i个患者第j个时相点的质心值,x为住院时间。 (0.2527280+N(0,6.450e.05))为模型的截距部分,(.O.0251963+N(O,1.273e.05)) 为模型的斜率,二者为一组服从正态性分布的数组。 7、对预测模型进行验证得到其:灵敏度为75.8%,特异度为67.3%,总体诊断准 确率为78.5%。 8、在上述研究的基础上,采用计算机C语言开发出相应的重症烧伤患者脓毒症 休克预测分析软件,分为网页版及单机版两种。可在线使用或与医疗系统耦合后直接 提取临床数据进行分析,以方便临床应用。 结论 1、重症烧伤患者的临床数据可使用聚类分析方法进行分类,不同的分类与不同的 临床结局之间关系密切。通过确定患者临床数据的实时分类,可对患者预后进行预测。 2、使用大数据技术可以将重症患者的58项临床数据近似地使用其中的15项数据 进行简化替代。 7 万方数据第三军医大学硕士学位论文 3、重症烧伤患者的临床数据可以使用质心算法进行降维,并且发生脓毒症休克前 重症烧伤患者的质心值会出现特征性变化, 者是否具有发生脓毒症休克的风险。此外, 床结局进行预测。