军长-Flink Python API入门及实践

? 1.读写外部存储。从kafka读取乘车原始数据并写到kafka。 ? 2.数据过滤。筛选特定的打车记录。 ? 3.数据统计。统计纽约市每个区域的乘车记录数。 ? 4.数据关联。对乘车开始记录和终止记录进行关联,并计算乘车时长。 ? 5.Python UDF编写和使用。用Python UDF实现4中计算时长的逻辑

  • 2021-07-08
  • 收藏0
  • 阅读47
  • 下载0
  • 29页
  • pdf
  • 2.16M

评价

评分 :
   *