当前的位置: 首页 > 文章列表 > 手机平板 > 腾讯混元大模型上线并开源文生视频能力 拥有130亿参数

— 腾讯混元大模型上线并开源文生视频能力 拥有130亿参数 —

更新时间:2024-12-04 09:35:02 编辑:丁丁小编

【太平洋科技快讯】12月3日,腾讯公司宣布,其混元大模型成功上线视频生成能力,标志着继文生文、文生图、3D生成之后,腾讯在AI领域再次实现重大技术突破。该模型的参数量高达130亿,成为当前最大的视频开源模型。

混元大模型支持中英文双语输入,并具备“超写实”的视频生成能力,画面质量高,不易变形。在镜面或镜子场景中,模型能实现镜面反射动作与外部场景的完全同步,光影反射效果符合物理规律。

据悉,混元大模型采用了DiT架构,并结合新一代文本编码器,有效提升了语义遵循能力。这使得模型在描绘多个主体时更加精准,能够实现更细致的指令和画面呈现。

感兴趣的用户可在腾讯元宝App中的“AI应用”板块选择“AI视频”申请试用。同时,企业客户可通过腾讯云提供服务接入,目前API已同步开放内测申请,此次开源行动涵盖了模型权重、推理代码、模型算法等完整模型,免费提供给企业和个人开发者使用。

本文转载于:https://www.sohu.com/a/832876055_223764 如有侵犯,请联系dddazheyh@163.com删除

热门优惠券

更多