腾讯混元发布并开源图生视频模型 上线音频与动作驱动等才能
时间:2025-05-22 05:09:14 来源:锐评时讯 作者:经济 阅读:803次
据悉,腾讯混元宣告图生视频模型已上线,并对外开源。用户可通过腾讯云请求运用API接口或在混元AI视频官网体会。该模型支撑上传一张图片并描绘期望画面论争运动和镜头论争调度,即可生成5秒的短视频,并主动生成布景音效。此外,还可以上传人物图片并输入文字或音频完成“对口型”作用,以及运用“动作驱动”才能生成跳舞视频。现在,在Github、HuggingFace等干流开发者社区均可下载体会该开源模型。
依据混元开源技能陈述发表,该图生视频模型具有灵敏的扩展性,在坚持超写实画质和流通演绎大幅度动作的基础上,结合多种输入条件完成对生成视频的多维度操控。混元开源系列模型现已完好掩盖文本、图画、视频和3D生成等多个模态,在Github累计取得超2.3万开发者重视和star。
内容来源:https://nlsngoisaoviet.com/app-1/tan thuy hu tap 82,http://chatbotjud-teste.saude.mg.gov.br/app-1/jogos-iso-ps2
(责任编辑:经济)