谈谈数据建模的作用

背景越来越多的公司正在建设数据仓库或数据湖,并开始集中他们的数据或者已经完成了数据集中项目,并正在努力使整个组织的数据服务自助化。这种方法有很多好处:?更灵活的分析和解释数据。?构建用户的完整画像。?数据堆栈变得更加模块化。当组织的数据越来越复杂时,灵活性是关键。我们希望将业务逻辑应用到数据中,例如构建自定义属性模型、仪表板和报告,以反映业务中最重要的指标,而不是基于供应商的行业的僵化模型。模块化为组织提供了选择和控制的能力,更主要是限制了供应商的锁定,组织可以为堆栈的每一层选择更好的工具,而不是依赖于一个供应商进行收集、存储和可视化数据。同时也带来了新的挑战:大量原始的、事件级的数据来自于大量的来源,这也就是数据建模的作用所在。二 什么是数据建模数据建模是使用业务逻辑聚合事件级数据以生成便于查询的“建模”数据的过程。当我们进行数据建模时,通常会聚合事件级数据。虽然每一行事件级数据代表一个单独的事件,但每一行建模数据代表一个更高阶的实体,例如工作流或会话,它本身由一系列事件组成。数据建模包括清理数据,例如删除测试记录或由IP地址识别的内部流量。它还包括创建关于数

  • 2021-09-20
  • 阅读111
  • 下载0
  • 9页
  • docx