全球科研团队竞逐低成本AI模型研发新范式

【大中小】【打印】

【第1页第2页第3页】

	全球科研团队竞逐低成本AI模型研发新范式
	http://www.CRNTT.com 2025-02-23 16:36:04

AI模型未来如何进化

在2025年美国消费电子展上，美国英伟达公司高管为AI的进化勾画了一条路线图：以智能水平为纵轴、以计算量为横轴，衡量AI模型的“规模定律”呈现从“预训练扩展”、到“训练后扩展”，再到“测试时扩展”的演进。

“预训练扩展”堪称“大力出奇迹”——训练数据越多、模型规模越大、投入算力越多，最终得到AI模型的能力就越强。目标是构建一个通用语言模型，以GPT早期模型为代表。而“训练后扩展”涉及强化学习和人类反馈等技术，是预训练模型的“进化”，优化其在特定领域的任务表现。

随着“预训练扩展”和“训练后扩展”边际收益逐渐递减，“测试时扩展”技术兴起。田丰说，“测试时扩展”的核心在于将焦点从训练阶段转移到推理阶段，通过动态控制推理过程中的计算量（如思考步长、迭代次数）来优化结果。这一方法不仅降低了对预训练数据的依赖，还显着提升了模型潜力。

三者在资源分配和应用场景上各有千秋。预训练像是让AI模型去学校学习基础知识，而后训练则是让模型掌握特定工作技能，如医疗、法律等专业领域。“测试时扩展”则赋予了模型更强推理能力。

AI模型的迭代还存在类似摩尔定律的现象，即能力密度随时间呈指数级增强。刘知远说，2023年以来，大模型能力密度大约每100天翻一番，即每过100天，只需要一半算力和参数就能实现相同能力。未来应继续推进计算系统智能化，不断追求更高能力密度，以更低成本，实现大模型高效发展。

　【第1页第2页第3页】

【大中小】【打印】扫描二维码访问中评社微信

相关新闻：