58同城大数据实践方案

首先看一下58大数据平台架构。大的方面来说分为三层:数据基础平台层、数据应用平台层、数据应用层,还有两列监控与报警和平台管理。 数据基础平台层又分为四个子层: 接入层,包括了Canal/Sqoop(主要解决数据库数据接入问题)、还有大量的数据采用Flume解决方案; 存储层,典型的系统HDFS(文件存储)、HBase(KV存储)、Kafka(消息缓存); 再往上就是调度层,这个层次上我们采用了Yarn的统一调度以及Kubernetes的基于容器的管理和调度的技术; 再往上是计算层,包含了典型的所有计算模型的计算引擎,包含了MR、HIVE、Storm、Spark、Kylin以及深度学习平台比如Caffe、Tensorflow等等。 数据应用平台主要包括以下功能: 元信息管理,还有针对所有计算引擎、计算引擎job的作业管理,之后就是交互分析、多维分析以及数据可视化的功能。 再往上是支撑58集团的数据业务,比如说流量统计、用户行为分析、用户画像、搜索、广告等等。 针对业务、数据、服务、硬件要有完备的检测与报警体系。 平台管理方面,需要对流程、权限、配额、升级、版本、机器要有很全面的管理平台。

  • 2021-02-26
  • 收藏0
  • 阅读422
  • 下载1
  • 12页
  • pdf
  • 2.01M

评价

评分 :
   *