2月25日 ,从知情人士处获悉,阿里巴巴将于今日晚间全面开源旗下视频生成模型万相2.1模型 。今年1月,阿里旗下万相刚宣布推出2.1版本模型升级,视频生成 、图像生成两大能力均获得提升。在视频生成方面 ,万相2.1通过自研的高效VAE和DiT架构增强了时空上下文建模能力,支持无限长1080P视频的高效编解码,首次实现了中文文字视频生成功能 ,登上VBench榜单第一。
【机会前瞻】
2月25日,阿里巴巴集团宣布将旗下文生视频模型“万相2.1”全面开源。作为全球首个支持中英双语、首个实现无限长1080P视频编解码的开源模型,万相2.1的开放不仅打破了专业视频创作的技术壁垒 ,更可能重构全球AIGC产业的竞争格局 。
万相2.1采用最宽松的Apache2.0协议,14B和1.3B两个参数规格的全部推理代码和权重全部开源,全球开发者可在Github、HuggingFace和魔搭社区下载体验。其中1.3B版本仅需8.2GB显存就可以生成高质量视频 ,适用于二次模型开发和学术研究。
今年1月,阿里旗下万相刚宣布推出2.1版本模型升级,视频生成、图像生成两大能力均获得提升 。在视频VAE方面 ,万相2.1设计了创新的视频编解码方案,通过将视频拆分成若干块并缓存中间特征的方式,代替直接对长视频的E2E编解码过程,实现显存使用与原始视频长度无关 ,支持无限长1080P视频的高效编解码。万相2.1在视频生成领域的权威评测集VBench上以总分84.7%的成绩登顶,在运动幅度 、多对象生成、空间关系等16个评分维度中的多个关键能力上拿下最高分。
万相团队的实验结果显示,在运动质量、视觉质量 、风格和多目标等14个主要维度和26个子维度测试中 ,万相均达到了业界领先表现,并且斩获5项第一 。尤其在复杂运动和物理规律遵循上的表现上大幅提升,万相能够稳定展现各种复杂的人物肢体运动 ,如旋转、跳跃、转身 、翻滚等;能够精准还原碰撞、反弹、切割等复杂真实物理场景。
自2023年8月起,阿里云相继开源Qwen系列大语言模型,覆盖从0.5B到110B的全尺寸参数 ,形成全球最大的开源模型家族,衍生模型数量已突破10万。此次万相2.1的开源延续了这一战略 。
盘前机会前瞻|蚂蚁与华为阿里联合推出医疗大模型一体机,这几家公司在AI医疗细分领域已经实现商业化落地(附概念股)|界面新闻 · 证券
盘前机会前瞻|特朗普宣布5000亿美元AI基建计划,电力需求有望不断上扬,这几家公司在AI电力、虚拟电厂等领域深度布局(附概念股)|界面新闻 · 证券
盘前机会前瞻|字节推出实时语音大模型,AI应用场景有望爆发,这几家公司已有多款产品接入豆包大模型(附概念股)|界面新闻 · 证券
盘前机会前瞻|医用机器人行业迎来重磅利好!这几家公司在外骨骼机器人领域布局较早有望率先受益(附概念股)|界面新闻 · 证券
盘前机会前瞻|中国银行宣布万亿级金融支持,人工智能产业链迎来新机遇,这几家公司在AI智能体、智算中心建设领域深度布局(附概念股)|界面新闻 · 证券
盘前机会前瞻|OpenAI压轴大作o3模型亮相,算力需求有望快速释放,这几家公司在智算中心和AIDC领域国内领先(附概念股)|界面新闻 · 证券
火山视频:网红黑料吃瓜网站抖音-劲爆黑料吃瓜-盘前机会前瞻|三部门发文重点培育智能家居等消费端场景,这几家公司在高品质智慧家居领域布局较早值得关注(附概念股)|界面新闻 · 证券
盘前机会前瞻|AI新宠Manus刷屏了!AI智能体爆发在即,这几家公司智能体产品已在垂直领域落地值得关注(附概念股)|界面新闻 · 证券
还没有评论,来说两句吧...