清华刘知远硬核解读 DeepSeek:大模型强化学习技术原理与大模型技术发展研判

刘知远表示,OpenAI o1 相当于引爆了一颗原子弹,但没有告诉大家秘方。DeepSeek 则可能是全球首个能够通过纯粹的强化学习技术复现 OpenAI o1 能力的团队,他们通过开源并发布相对详细的介绍,为行业发展做出了重要贡献。由于开源,DeepSeek R1 让全世界意识到深度思考的能力,相当于让整个人工智能领域迎来了类似于 2023 年初的 ChatGPT 时刻。大家感受到大模型的能力又往前迈进了一大步。我们应该学习的是他们的技术理想、坚持与方法论。

  • 2025-02-10
  • 收藏0
  • 阅读66
  • 下载0
  • 12页
  • pdf
  • 1.45M

评价

评分 :
极好
   *