会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 腾讯混元发布并开源图生视频模型 上线音频与动作驱动等才能!

腾讯混元发布并开源图生视频模型 上线音频与动作驱动等才能

时间:2025-05-22 05:09:14 来源:锐评时讯 作者:经济 阅读:803次

据悉,腾讯混元宣告图生视频模型已上线,并对外开源。用户可通过腾讯云请求运用API接口或在混元AI视频官网体会。该模型支撑上传一张图片并描绘期望画面论争运动和镜头论争调度,即可生成5秒的短视频,并主动生成布景音效。此外,还可以上传人物图片并输入文字或音频完成“对口型”作用,以及运用“动作驱动”才能生成跳舞视频。现在,在Github、HuggingFace等干流开发者社区均可下载体会该开源模型。

依据混元开源技能陈述发表,该图生视频模型具有灵敏的扩展性,在坚持超写实画质和流通演绎大幅度动作的基础上,结合多种输入条件完成对生成视频的多维度操控。混元开源系列模型现已完好掩盖文本、图画、视频和3D生成等多个模态,在Github累计取得超2.3万开发者重视和star。

内容来源:https://nlsngoisaoviet.com/app-1/tan thuy hu tap 82,http://chatbotjud-teste.saude.mg.gov.br/app-1/jogos-iso-ps2

(责任编辑:经济)

    系统发生错误

    系统发生错误

    您可以选择 [ 重试 ] [ 返回 ] 或者 [ 回到首页 ]

    [ 错误信息 ]

    页面发生异常错误,系统设置开启调试模式后,刷新本页查看具体错误!