2025年AI产业发展十大趋势报告
同时,也需要注意到,尽管Self-play 方法已经开始在一定范围内得到应用,但是,也 仍然存在挑战需要进一步研究和解决,包括收敛性问题、环境非平稳性问题、可扩展性 与训练效率等问题。另外,强化学习注重设计良好的“奖励模型”,但是除了数学、代 码等理科领域,强化学习在其他领域仍然难以泛化。5 激发科技与创新活力 总体上而言,在复杂推理阶段,大模型需要具备更高层次的逻辑推理、因果推断和问题 解决能力,进而可以扩展 Marco-o1 Marco-o1不仅关注具有标准答案的学科(例如代码、数学等) 领域,而且更加强调开放式问题的解决方案。研究团队的目 标是解决:“o1这类模型能否有效的推广到难以量化且缺乏 明确奖励的其他领域上”这一问题 部分中国大模型企业推出推理模型 信息来源:网络公开信息,易观分析整理6 激发科技与创新活力 趋势2:多模态模型能力持续升级,朝向多 模态理解和生成的统一发展 当前自然20 魔豆 | 51 页 | 5.30 MB | 9 月前3
共 1 条
- 1