大模型技术能力漫谈

由于联合概率 P (W,W...w)的参数量十分巨大,直接计算 P(w,W...w)非常困难。如果把W,W...w看作一个变量,那么它具有I| 种可能。 按照《现代汉语词典(第七版)》包含7万词条,句子长度按照20个词计算,模型参数量达到7.9792*1095的天文数字。

  • 2025-04-29
  • 收藏0
  • 阅读120
  • 下载1
  • 15页
  • pdf
  • 1.64M

评价

评分 :
   *