基于视觉推理的视频理解

基于视觉和语言的跨媒体问答与推理是人工智能领域的研究热点之一,其目的是基于给定的视觉内容和相关问题,模型能够返回正确的答案.随着深度学习的飞速发展及其在计算机视觉和自然语言处理领域的广泛应用,基于视觉和语言的跨媒体问答与推理也取得了较快的发展.

  • 2021-06-29
  • 收藏0
  • 阅读46
  • 下载0
  • 26页
  • pdf
  • 22.43M

评价

评分 :
   *