腾讯混元发布并开源图生视频模型上线音频与动作驱动等才能-锐评时讯

当前位置：首页 > 咨询 > 腾讯混元发布并开源图生视频模型上线音频与动作驱动等才能正文

腾讯混元发布并开源图生视频模型上线音频与动作驱动等才能

时间：2025-05-22 05:09:14 来源：锐评时讯作者：经济阅读：803次

据悉，腾讯混元宣告图生视频模型已上线，并对外开源。用户可通过腾讯云请求运用API接口或在混元AI视频官网体会。该模型支撑上传一张图片并描绘期望画面论争运动和镜头论争调度，即可生成5秒的短视频，并主动生成布景音效。此外，还可以上传人物图片并输入文字或音频完成“对口型”作用，以及运用“动作驱动”才能生成跳舞视频。现在，在Github、HuggingFace等干流开发者社区均可下载体会该开源模型。

依据混元开源技能陈述发表，该图生视频模型具有灵敏的扩展性，在坚持超写实画质和流通演绎大幅度动作的基础上，结合多种输入条件完成对生成视频的多维度操控。混元开源系列模型现已完好掩盖文本、图画、视频和3D生成等多个模态，在Github累计取得超2.3万开发者重视和star。

内容来源：https://nlsngoisaoviet.com/app-1/tan thuy hu tap 82,http://chatbotjud-teste.saude.mg.gov.br/app-1/jogos-iso-ps2

(责任编辑：经济)

系统发生错误

您可以选择 [ 重试 ] [ 返回 ] 或者 [ 回到首页 ]

[ 错误信息 ]

页面发生异常错误，系统设置开启调试模式后，刷新本页查看具体错误！

腾讯混元发布并开源图生视频模型 上线音频与动作驱动等才能

内容来源：https://nlsngoisaoviet.com/app-1/tan thuy hu tap 82,http://chatbotjud-teste.saude.mg.gov.br/app-1/jogos-iso-ps2

系统发生错误

腾讯混元发布并开源图生视频模型上线音频与动作驱动等才能