以概念为中心的自标准数据和标准化数据统一规范化体系模型研究

绝大多数企业的数据字典具有“裸”字典的特性,字典的语义很“弱”,究其原因是这些数据字典与企业 概念体系相脱离,企业不重视或忽视了概念体系模型的建设。一般来讲,绝大多数企业仅仅将概念体系模型当作 提取字典的一个中间产品,一旦字典建成,概念体系模型生命周期也随之结束。数据标准建设的目的是为数据共 享服务,实践证明:企业数据标准建设的速度往往落后于应用对标准的需求速度,结果导致了对数据标准的供需矛 盾。为此,文献[1]首次提出了采用自标准数据与标准数据联合解决这一问题的思路,并将自标准数据作为标准数 据的有效补充。通过对逻辑学中的概念、语义学中的语义以及Is0/IEc lIl79(ED3)等诸多技术研究的基础上得 出结论:认为自标准数据与标准数据规范化过程没有本质区别,并提出了将二者规范化方法融为一体的以概念为 中心的数据规范化体系框架。该模型认为规范化过程包括两项核心内容:一个是建立规范的概念体系模型,目的 是增强数据语义:另一个是规范描述这些概念的属性(元数据).加强元数据规范性。二者是一切数据标准的“源 点”或“根”。因此,企业在进行数据标准建设的过程中一定不要忽视企业概念体系模型标准的建设。并极力主张 这些数据标准都是企业的重要资产,企业必须对它们进行统一注册、管理、发布及应用。

  • 2021-06-24
  • 阅读54
  • 下载0
  • 8页
  • pdf

基于大数据的数字图书馆信息服务研究

随着云计算、物联网、社交网络等新兴技术的发展,数据呈现爆炸式的增长, 海量数据的出现表示大数据时代的到来。数字化信息广泛存在于人们身边,如何从 海量信息中获取更多、更好、更准确、更及时、更有用的信息越来越成为人们关注 的问题,而作为人们获取信息的重要渠道之一的图书馆有义务将用户需要的信息提 供给用户。然而在如今如何从海量数据中获取有用信息,再将有用的信息反馈给用 户,已成为图书馆信息服务发展的趋势。析将大数据与数字图书馆联系在一起成为 一种必然趋势,将大数据技术融入数字图书馆信息服务为用户提供更细致,更个性 化的信息服务。 本文在前人的研究的基础上,针对大数据对数字图书馆信息服务的影响进行分 析。从比较全面的角度探讨基于大数据的数字图书馆信息服务的目标、内容和方法, 希望在将大数据应用到数字图书馆的信息服务方面起到一定研究价值。并为数字图 书馆在大数据环境下如何进行信息服务提供理论参考。 文章主要分为四部分。 第一部分介绍了大数据和数字图书馆的相关理论,对大数据和数字图书馆的概 念和特征进行描述,比较发现它们之间的契合点,从数字图书馆的发展着手描述了 将大数据和数字图书馆结合的可行性。 第二部分描述了数字图书馆的信息服务,包括数字图书馆信息服务的概念,特 点,服务的模式,归纳出现有的数字化图书馆信息服务的不足和未来发展趋势,将 大数据服务引进到数字图书馆的信息服务中。 第三部分阐述了基于数字图书馆信息服务的内容基础上,在大数据时代数字图 书馆如何进行信息服务。主要包括基于大数据的数字图书馆资源发现,资源存储, 资源组织,资源检索的内容并对其进行具体分析。 第四部分探讨了在大数据环境下数字图书馆的信息服务的内容上建立基于大 数据的数字图书馆服务的模式,描述了大数据的数字图书馆服务的特点,达到的目 标和服务的类型。

  • 2021-06-24
  • 阅读52
  • 下载0
  • 51页
  • pdf

基于大数据研究模式对重症烧伤患者临床数据的挖掘与分析

研究背景 重症烧伤是一种严重的创伤,其病情凶险,并发症多,治疗难度大。其中脓毒症 (sepsis)和多器官功能不全综合症(multiple orgall dys矗mction s),11drome,MODS)是 重症烧伤患者治疗中最常出现的并发症,也是导致重症烧伤患者死亡的重要原因。近 年研究发现,MODS的本质就是严重脓毒症或脓毒性休克。早期诊断并预警脓毒症休 克或MODS是重症烧伤患者临床救治中的关键问题之一。随着信息技术的发展,大数 据已经开始逐渐进入到医学领域,特别是在临床医学研究中。大数据技术对繁杂临床 数据的分析及处理能力十分出色,有助于深入了解重症烧伤患者的病程变化规律,辅 助临床决策。 研究目的 采用大数据处理的基本思想及技术对重症烧伤患者的临床数据进行挖掘和分析, 探索重症烧伤患者临床数据的模式特征,寻找脓毒症休克的预测模型。 研究方法 通过电子病历系统及纸质病历收集纳入107例重症烧伤患者的临床数据。对数据 进行预处理后,首先采用无监督的算法(如分层聚类、基于主成分分析的分层聚类等) 和机器学习等方法对数据进行分析,探索患者聚类亚组分类和临床结局之间的关系。 而后使用质心算法对数据进行降维处理,提取患者发生脓毒症休克前的特征性数据变 化趋势,建立脓毒症休克的预测模型并进行验证。采用R i386 3.1.2、Matlab 7.0和SPSS 18.O等软件对数据进行数学计算和统计分析。通过比较F值筛选主要变量,使用线性 随机效应模型分析、提取数据变化趋势。最后使用C语言开发能够预测脓毒症休克发 生的通用软件。 结果: 1、本课题采集的重症烧伤患者临床数据时相点共2257个,每个时相点有58个观 察指标,共130906个数据值。 2、重症烧伤患者的临床数据可使用HCPC方法分为10个亚类。 6 万方数据第三军医大学硕士学位论文 3、通过比较不同亚类的组间均值差异,得出:体温(T)、呼吸频率(R)、舒 张压(DP)、收缩压(SP)、尿量(血ne)、血肌酐(CR)、血尿素氮(BUN)、 总胆红素(TBIL)、血小板(PLT)、肌酸激酶(CK)、氧分压(p02)、二氧化碳 分压(pC02)、乳酸(1actate)、碳酸氢根(HC03。)、氧合指数(oxygenation)为差 异性最明显的指标。使用上述15个指标替代原来的58项指标,可对聚类分类的标准 进行简化。 4、重症患者聚类分组与其临床结局关系密切。其中clusterl、cluster2、cluster4、 cluster8、cluSter9和clusterl0分类中患者好转的几率分别为91.00%、89.70%、60.50%、 66.40%、71.70%和80.70%。C1uster3和cluster5分类中患者死亡的几率分别为70.50% 和82.10%。cluster6和cluster7分类中患者发生脓毒症休克的几率分别为77.90%和 70.40%。 5、通过对患者质心值随时间变化的趋势图分析可知,死亡患者的质心变化大体呈 下降趋势,而存活患者相反,呈总体上升趋势。 6、通过提取重症烧伤患者发生脓毒症休克前的质心值变化特征,建立了脓毒症休 克的预测模型: 少{『=(0.2527280+N(0,6.450e-05))+(-0.0251963+N(0,1.273e-05))x+占i, 其中勺为随机因素,均为第i个患者第j个时相点的质心值,x为住院时间。 (0.2527280+N(0,6.450e.05))为模型的截距部分,(.O.0251963+N(O,1.273e.05)) 为模型的斜率,二者为一组服从正态性分布的数组。 7、对预测模型进行验证得到其:灵敏度为75.8%,特异度为67.3%,总体诊断准 确率为78.5%。 8、在上述研究的基础上,采用计算机C语言开发出相应的重症烧伤患者脓毒症 休克预测分析软件,分为网页版及单机版两种。可在线使用或与医疗系统耦合后直接 提取临床数据进行分析,以方便临床应用。 结论 1、重症烧伤患者的临床数据可使用聚类分析方法进行分类,不同的分类与不同的 临床结局之间关系密切。通过确定患者临床数据的实时分类,可对患者预后进行预测。 2、使用大数据技术可以将重症患者的58项临床数据近似地使用其中的15项数据 进行简化替代。 7 万方数据第三军医大学硕士学位论文 3、重症烧伤患者的临床数据可以使用质心算法进行降维,并且发生脓毒症休克前 重症烧伤患者的质心值会出现特征性变化, 者是否具有发生脓毒症休克的风险。此外, 床结局进行预测。

  • 2021-06-24
  • 阅读61
  • 下载0
  • 52页
  • pdf