商汤发布日日新5.0大模型

商汤科技今日发布日日新5.0大模型,采用MOE混合专家架构,基于超过10TBtokens训练,推理上下文窗口200K,全面对标GPT-4Turbo。

本站内容来源于网络或网友发布,如有侵权请点此联系

(0)

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注