DeepSeek-V3技术报告解读

DeepSeek-V3 是一款性能卓越的混合专家(MoE) 语言模型,整体参数规模达到 671B,其中每个 token 激活的参数量为 37B

  • 2025-02-09
  • 收藏0
  • 阅读276

方案详情

评价

评分 :
   *