英伟达开源多个代码大模型 ,以阿里通义千问为底座
5月9日,据科创板日报报道,英伟达近日开源其代码推理模型(Open Code Reasoning model) ,包括32B、14B和7B三个参数。该模型以阿里通义千问Qwen2.5-32B 、Qwen2.5-14B、Qwen2.5-7B为底座模型 。
模型继承了阿里混合推理模型的设计理念。Qwen系列通过 “快思考” 与 “慢思考 ” 双模式架构,既能快速响应简单需求,又能通过多步推理解决复杂问题。
腾讯混元视频生成工具全新开源
5月9日 ,腾讯混元宣布正式推出并开源全新的多模态定制化视频生成工具HunyuanCustom 。该模型基于混元视频生成大模型(HunyuanVideo)打造,主体一致性效果超过现有的开源方案。
Hunyuan Custom通过引入身份增强机制和多模态融合模块,实现了 “图像提供身份 ,文本定义一切”,可以满足视频创作者、短视频博主 、电商从业者、广告创意人等不同用户和场景的需求。
科大讯飞公布领域问答大模型训练专利
天眼查财产线索信息显示,5月9日,科大讯飞股份有限公司申请的“领域问答大模型训练及问答方法、相关设备及程序产品”专利公布 。
摘要显示 ,本申请引入了裁判模型,能够对输入的答案进行偏好打分,评估答案的质量。基于领域知识库提取领域问答数据 ,在对初始大模型进行迭代训练时由裁判大模型对初始大模型生成的领域问题对应的第一答案,和领域问答数据中的第二答案分别打分,基于打分结果选取满足偏好要求的答案与领域问题组成目标训练数据 ,利用目标训练数据对初始大模型进行训练,得到最终的领域问答大模型,其采用了高质量的领域问答训练数据进行训练。本申请不需要人工对提取的领域问答数据进行校对即可得到高质量的目标训练数据 ,节省了人工成本,提高了训练效率 。
人工智能公司Anthropic计划扩大传播团队规模三倍
5月9日消息,人工智能公司Anthropic宣布计划将其传播团队规模扩大三倍。此举旨在加强公司在全球市场的品牌影响力和公众沟通能力 ,以应对快速发展的行业需求。
浪潮信息:已与20余家国产AI芯片厂商合作
5月9日,浪潮信息在2024年度及2025年第一季度网上业绩说明会上表示,公司实施“多元算力 ”战略,服务于多元化的市场需求。公司近年来一直积极与国内厂商持续沟通联络 ,推进合作,目前已经与20余家国产AI芯片厂商合作,AI Station软件平台实现30余款国产AI芯片兼容纳管 ,持续推进OAM 、OCM、液冷整机柜等开放计算标准演进,加速构建国产智算生态,更多国产AI厂商的合作也在持续推进过程中 。
国内首个具身智能康复示范基地落地上海
据第一财经消息 ,上海机器人企业傅利叶5月9日与上海国际医学中心举行了“具身智能康复港”揭牌仪式。双方将围绕具身智能机器人在康复医疗场景的应用标准建设、康复方案共创 、科研攻关等展开全面合作,携手打造国内首个具身智能康复示范基地。
大模型开源卷至视频生成领域:阿里开源万相2.1,性能超Sora|界面新闻 · 科技
科技早报|OpenAI正式推出AI视频生成模型Sora;英伟达涉嫌违反反垄断法,市场监管总局立案调查|界面新闻 · 科技
AI早报 | 马斯克称下周推出Grok 3.5;腾讯重构混元大模型研发体系|界面新闻 · 科技
AI早报 | 全球首场人形机器人马拉松今日开跑;小米大模型团队提出新图像生成方式|界面新闻 · 科技
AI早报 | OpenAI预测2029年营收将超1250亿美元;智谱多款大模型调价|界面新闻 · 科技
火山视频:吃瓜黑料网站-黑料网吃瓜-谷歌放出最强大模型狙击OpenAI,重心转向AI智能体|界面新闻 · 科技
AI早报 | Meta发布最新AI大模型Llama 4;谷歌Gemini 2.5 Pro API价格公布|界面新闻 · 科技
还没有评论,来说两句吧...