大数据采集与清洗

大数据( Big Data)是指用传统和常用的软件和工具在一定时间内成获取、 管理和处理的数据集。数据预处理就是将采集来的数据从多种数据库导入到大型的分布式数据库中(目前主要是hfds或hive ) ,并同时做一些简单的清洗LOGOTYPE INSERT却精小理工作。

  • 2021-04-27
  • 收藏0
  • 阅读123
  • 下载0
  • 36页
  • pdf
  • 3.64M

评价

评分 :
   *