肿瘤、心血管重大疾病临床与组学大数据存储及挖掘技术研究

随着医疗信息技术和生物科技的迅猛发展,生物医疗行业的数据量呈爆炸式 增长。作为生物医疗数据最重要的组成部分,临床与组学数据是指在疾病的诊治 和组学分析中产生的电子病历、检查报告、影像、信号数据、基因序列数据等。 在某些重点专科医院,临床数据的积累已达到百 TB 的规模,而在组学研究领域更 是达到了 PB 级。这些数据的挖掘应用将对研究疾病发生发展规律、提高诊治水平 等具有重大潜在价值。然而,随着海量数据的不断累积和应用需求的更加复杂化, 临床与组学数据存储和挖掘面临着许多新的问题,制约了其更好地实际应用。 为研究适合临床与组学大数据存储和挖掘的高效方法,本文以对人类危害极 大的肿瘤、心血管疾病为例,深入分析了两类疾病在诊治和愈后管理过程中,如 何充分利用已有数据提高诊断正确率、确定科学的治疗方案,使大多数医生均成 为“有丰富医疗经验的高价值”医生。对数据应用过程中面临的多源异构集成存 储,高速并行访问及高效挖掘算法等问题提出了一些解决方案。 首先,在深入分析临床与组学大数据组成和技术特性的基础上,本文将分散、 异构、多源、非结构化的数据分为文档数据、小文件和大文件三类,并以 NoSQL 作为存储底层,MapReduce 作为计算引擎,构建了面向并行数据挖掘的分布式存 储模型 MSPM(Medical Storage Platform for Mining)。该模型实现了三类数据的 一体化集成存储和统一规则访问,并适于并行化的数据分析和挖掘。同时,借助 NoSQL 的自动分片和副本集机制,可满足应用对高可扩展性、高可靠性的需求。 然后,针对 MSPM 模型存在的两个主要性能瓶颈进行了优化。为应对集群系 统失衡问题,提出了综合应用组合调优片键和 FDO-DT(Double Threshold based on Frequence of Data Operation)算法的改进策略,解决了数据自动分片耗时长、开销 大的问题,并实现了数据存储与读写的双均衡;为解决频繁访问原始大文件造成 的系统性能不佳问题,设计了大文件特征库,通过医学文档关键信息抽取、元信 息提取、挖掘结果动态俘获等将大文件的各类常用信息集成在库中,并由对库的 访问转移一部分对大文件的直接操作,显著节约了系统总开销。 最后,为解决经典 Apriori 算法在医疗大数据挖掘中,面临的类型复杂、属性 高维,开销大,结果针对性差等问题,设计了改进的 Apriori-M-DB 算法。通过以 键值对形式统一存储,实现了对复杂异构类型数据的挖掘。并通过 MapReduce 化, 一次扫描选取所有候选项集和兴趣集约束计数等,提高了挖掘的效率和针对性。

  • 2021-06-24
  • 阅读64
  • 下载0
  • 94页
  • pdf

泛在电力物联网下虚拟电厂的研究现状与展望

可再生能源的规模化接入与应用是泛在电力物联网的基础性特征之一,其固有的不确定性一方面会给电 网的安全稳定运行带来影响,另一方面导致其无法直接加入电力市场运营。虚拟电厂作为一种多能源的聚合模 式,可对分布式可再生能源进行协同控制,并以一个集合体的形式参与电力市场,对于实现泛在电力物联网建设 内容中提升电网安全经济运行水平以及促进清洁能源消纳具有重要意义。国内外对虚拟电厂的研究由来已久, 欧洲FENIX项目虚拟电厂以实现分布式电源可靠并网和电力市场运营为目标,而北美的虚拟电厂主要基于需求 响应计划,所以虚拟电厂聚合了大量可控负荷。在中国,国网冀北电力公司虚拟电厂示范工程兼顾考虑“源–网– 荷–储”的互动,将泛在可调资源聚合为可与电网柔性互动的互联网电厂。在此基础上,首先分析了虚拟电厂在协 调控制、优化调度、参与电力市场交易3个方面的研究现状。虚拟电厂的协调控制对象主要包括各种分布式电源、 储能系统、可控负荷以及电动汽车,协调控制方式主要分为集中式控制和分散式控制。在集中式控制下,虚拟电 厂的全部决策由中央控制单元制定;在分散式控制下,虚拟电厂的决策由各个代理系统取代。虚拟电厂的优化调 度是指在满足各机组出力约束和网络约束的前提下,以收益最大化、运行成本最小、碳排放最小为目标,对自身 内部多个电源的容量配置或出力进行优化调度,或者将虚拟电厂作为一个整体参与电网调度。此外,虚拟电厂利 用其先进的通信技术在参与电力市场交易时能够快速响应市场电价变化、负荷需求变化,对促进电力市场自由 化、增加市场灵活度、引导用户调峰调频等方面起到重要的作用。其次,详细阐述了泛在电力物联网下虚拟电厂 的关键技术,包括“边缘–云”计算架构、区块链技术和大数据技术。“边缘–云”计算架构,一方面,通过云主站对 虚拟电厂内部参与需求响应的负荷进行选择;另一方面,通过边缘计算感知用户用电行为,使得虚拟电厂在制定 投标策略时能够更加精准。区块链技术去中心化和透明化的特点与虚拟电厂在地域上的分散性和调度过程中的 协调控制有一定的相似之处,同时区块链技术也可保证虚拟电厂参与电力市场交易时的公平性和信息安全。大 数据技术一方面可用于对各分布式电源的出力进行更为精确的预测;另一方面也可用于处理虚拟电厂内部的各 种信息,提高各单元数据交换与处理的速度与精度。最后,对泛在电力物联网下虚拟电厂的研究进行了展望。考 虑了全成本节点电价下虚拟电厂的模型与优化调度方法以及虚拟电厂的信息物理安全问题与对策。

  • 2021-06-24
  • 阅读88
  • 下载0
  • 10页
  • pdf

基于工业物联网的智能制造服务主动感知与分布式协同优化配置方法研究

经济全球化进程的加快、市场竞争的日益加剧,日趋多样性、个性化的产品制造需求,制造业呈现的信息化、服务化、专业化的发展趋势,对现代生产过程中制造资源的互联化、业务流程的协同化、参与主体的自主化、制造模式的服务化等方面提出了更高的要求。在此背景下,随着云计算、工业物联网、信息物理系统等先进制造信息技术的迅猛发展,新型智能制造模式(如云制造、物联制造、社群化制造等)应运而生,并迅 速引起了学术界和工业届的广泛关注。然而,当前研究主要针对传统制造系统中静态优化模型和方法的研究,较少对底层制造资源服务主动感知、动态优化配置等核心关键方 法深入探索。为此,本研究针对资源服务的透明化感知、自主式优化配置需求,将工业物联技术引入传统制造系统,形成底层制造资源端生产信息的主动感知,以研究“智能制造服务的主动感知与优化配置方法”为突破口,构建了基于工业物联网的智能制造服务主动感知与优化配置方法的体系架构和运行逻辑,并对制造资源实时信息的主动感知与集成、制造资源服务化封装与云端化接入、智能制造服务优化配置方法等方面的关键技术展开深入研究,为促进智能制造系统向敏捷化、服务化、绿色化和智能化的方向发展提供一种重要的理论和技术参考。

  • 2021-06-24
  • 阅读115
  • 下载0
  • 156页
  • pdf