DeepSeek自学手册

DeepSeekV3 是一个强大的MoE语言模型(非推理型模型)。它在数学、代码等任务上吊打其它开源模型,甚至能和闭源大佬 GPT-40、Claude-3.5-sonnet掰手腕,但训练花的钱还不到 600 万美元。

  • 2025-02-21
  • 收藏0
  • 阅读63
  • 下载2
  • 32页
  • pdf
  • 3.83M

评价

评分 :
极好
   *