AI早报 | 英伟达开源多个代码大模型；腾讯混元视频生成工具全新开源|界面新闻 · 科技 - 吃瓜合集 - 52黑料

英伟达开源多个代码大模型，以阿里通义千问为底座

5月9日，据科创板日报报道，英伟达近日开源其代码推理模型（Open Code Reasoning model），包括32B、14B和7B三个参数。该模型以阿里通义千问Qwen2.5-32B 、Qwen2.5-14B、Qwen2.5-7B为底座模型。

模型继承了阿里混合推理模型的设计理念。Qwen系列通过 “快思考” 与 “慢思考 ” 双模式架构，既能快速响应简单需求，又能通过多步推理解决复杂问题。

腾讯混元视频生成工具全新开源

5月9日，腾讯混元宣布正式推出并开源全新的多模态定制化视频生成工具HunyuanCustom 。该模型基于混元视频生成大模型（HunyuanVideo）打造，主体一致性效果超过现有的开源方案。

Hunyuan Custom通过引入身份增强机制和多模态融合模块，实现了 “图像提供身份，文本定义一切”，可以满足视频创作者、短视频博主、电商从业者、广告创意人等不同用户和场景的需求。

科大讯飞公布领域问答大模型训练专利

天眼查财产线索信息显示，5月9日，科大讯飞股份有限公司申请的“领域问答大模型训练及问答方法、相关设备及程序产品”专利公布。

摘要显示，本申请引入了裁判模型，能够对输入的答案进行偏好打分，评估答案的质量。基于领域知识库提取领域问答数据，在对初始大模型进行迭代训练时由裁判大模型对初始大模型生成的领域问题对应的第一答案，和领域问答数据中的第二答案分别打分，基于打分结果选取满足偏好要求的答案与领域问题组成目标训练数据，利用目标训练数据对初始大模型进行训练，得到最终的领域问答大模型，其采用了高质量的领域问答训练数据进行训练。本申请不需要人工对提取的领域问答数据进行校对即可得到高质量的目标训练数据，节省了人工成本，提高了训练效率。

人工智能公司Anthropic计划扩大传播团队规模三倍

5月9日消息，人工智能公司Anthropic宣布计划将其传播团队规模扩大三倍。此举旨在加强公司在全球市场的品牌影响力和公众沟通能力，以应对快速发展的行业需求。

浪潮信息：已与20余家国产AI芯片厂商合作

5月9日，浪潮信息在2024年度及2025年第一季度网上业绩说明会上表示，公司实施“多元算力 ”战略，服务于多元化的市场需求。公司近年来一直积极与国内厂商持续沟通联络，推进合作，目前已经与20余家国产AI芯片厂商合作，AI Station软件平台实现30余款国产AI芯片兼容纳管，持续推进OAM 、OCM、液冷整机柜等开放计算标准演进，加速构建国产智算生态，更多国产AI厂商的合作也在持续推进过程中。