百川智能宣布超千亿大模型Baichuan3发布,中文评测超GPT-4

百川智能宣布发布超千亿参数的大语言模型Baichuan3。在CMMLU、GAOKAO、AGI-Eval等多个权威测评中,Baichuan3在中文任务评测性能上超越了GPT-4,在数学和代码专项评测中也取得了出色表现。与百亿、几百亿级别参数模型训练不同,超千亿参数模型在训练过程中对高质量数据,训练稳定性、训练效率的要求都高出几个量级。据介绍,为更好解决相关问题,百川智能在训练过程中针对性地提出了“动态数据选择”、“重要度保持”以及“异步CheckPoint存储”等多种创新技术手段及方案,有效提升了Baicuan3的各项能力。(新浪科技)

本站内容来源于网络或网友发布,如有侵权请点此联系

(0)

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注