DeepSeek开启AI算法变革元年
DeepSeek-R1的惊艳之处是通过重新设计训练流程、以少量SFT数据+多轮强化学习的办法,在提高了模型准确性的同时,也显著降低了内存占用和计算开销。
Deepseek-R1提供了一种低成本训练的方法,而不是说只能通过低成本来进行训练。
反而通过优化,DeepSeek-R1可能实现了算力与性能的近似线性关系。每增加一张 GPU,模型推理能力可稳定提升,无需依赖复杂的外部监督机制。这一特性直接验证了"算力暈性能”的 Scaling Law,为AI芯片市场及AIInfra市场提供了明确的增量需求逻辑。
- 2025-02-11
- 阅读41
- 下载0
- 8页
- pdf