大数据集成中确定数据准确属性值的WR方法

数据集成是提供高质量数据以进行决策的基础．集成的一个关键环节是根据实体在数据库中的不同元组确定其准确属性值．最新的R—topK方法在数据上实施人工设计的规则确定属性值问的准确程度，得到了相对准确的属性值．然而这种方法在处理多个可能的准确值或设计的规则存在冲突等情况下需要较多人工交互．为此提出基于权重规则的wR（weighted—rule）方法确定大数据集成中数据的准确属性值．该方法为属性值间准确程度的判断规则扩充了权重，在准确值发生冲突时避免了R—topK方法中人工交互干预．基于追逐过程设计了约束条件推理算法，并证明它能够在0（n2）内推导出每对属性值间的带权重的准确程度，形成推导准确属性值的约束条件．面对约束条件中可能的冲突，提出了目标求解算法，在0（行）时间内从所有属性值组合中搜索最可能的准确属性值．在真实和合成数据集中进行了充分的实验，验证了WR方法的效果和效率．WR方法较R—topK方法在性能上提高了3～15倍，在效果上提升7％～80％．

 2021-06-23
收藏0
阅读88
下载0
10页
pdf

2.04M

分享至:

声明：该方案内容由用户上传，其观点仅代表作者本人；中服云系信息发布平台，仅提供方案内容存储空间服务。如因作品内容、版权和其它问题需要同本站联系的，请联系029-88386725。

评价

暂无评论！

相关方案

2025工业大模型白皮书

本书在实践积累与行业洞察基础上，试图对一系列关键问题做出解答:工业大模型与通用大模型有何不同?工业大模型的技术体系与关键技术何在?工业大模型赋能的重点领域和主要场景包括哪些?我国和全球工业大模型的产业生态如何?

阅读751
下载2

清华大学：中国企业数字化转型研究报告2023

技术开发的迭代推进和技术应用的规模化积累，在推进数字技术不断取得新突破的同时，也使数字技术变得更加成熟和可靠。数字技术的先进性、复杂性、集成性与数字化系统覆盖面更广、界面更直观、操作更简单同步发展。人们能够随时随地访问功能越来越强大的数字化系统。

阅读1386
下载1

易观分析：中国特色智能工厂领航制造业升级分析报告

从260年前的第一次工业革命，到以人工智能、大数据、物联网为代表的数字技术驱动的第四次工业革命，人类社会经历了蒸汽时代、电气时代、信息时代，并正在处于智能时代之中。每一次的跨越式的进步，都是由技术变革带来生产力的大幅提升，并催生出全新的行业，全新的生态，推动着时代不断向前。

阅读3817
下载13

最新上线

报告｜适应能源电力法治化要求的新能源高质量发展研究

公司服务新能源高质量发展，核心是要推动业法融合，就是要用法治化思维方式，在法治化轨道上服务推动新能源高质量发展。

阅读13
下载0

三峡大学潘鹏程等｜基于有源和无源阻尼协同控制的光伏直流升压汇集系统谐振抑制

光伏直流升压汇集系统中，DC/DC换流器内部LC电路与开关电路因阻抗匹配而产生谐振问题，从而导致系统稳定性变差甚至崩溃。针对换流器因阻抗匹配产生的谐振问题，提出了有源和无源阻尼协同控制以消除谐振的方法。首先，建立了在不同工况下的换流器运行小信号阻抗模型。其次，利用阻抗比判据对比分析系统稳定性差异，并讨论了不同虚拟电阻对系统稳定性的影响。最后，通过将产生谐振峰值处的角频率点与其相邻正常角频率点的等效阻抗幅值之比限定为[0.95, 1.15]，将阻尼电阻值在最大功率点跟踪（maximum power point tracking，MPPT）控制下换流器的闭环输出阻抗幅值提高了约1.5倍。研究结果表明，相比仅采用有源或无源阻尼法，所提协同控制策略使得产生谐振处的幅值由–15 dB增加到40.5 dB，提高约4倍，且系统具有较大的幅值和相角裕度，可有效提高系统的稳定性。