AI 数字人 – 图片配音唇同步视频 | Vidxo

AI 数字人 – 图片 + 配音生成唇同步视频

参考图 + MiniMax 配音 · FAL Kling Avatar · YouTube 横版

上传真人或卡通参考图，搭配配音音频，一键生成唇同步说话数字人视频。

基于 FAL Kling AI Avatar v2，支持写实、卡通、肉叔杂谈等多种风格，输出 16:9 横版 MP4。

音频可本地上传，也可从 TTS 历史选用；生成结果自动保存到「我的作品」。

FAL API Key 保存在服务端，按生成秒数计费，提交前会显示积分预估。

为何使用 AI 数字人

无需真人出镜
用卡通或虚拟形象代替真人录制，降低制作门槛。
配音与口型同步
MiniMax TTS 配音 + Kling 唇同步，一次完成口播视频。
YouTube 横版输出
16:9 参考图生成横版视频，适合 YouTube 科普频道。

功能亮点

Kling AI Avatar v2
FAL 最新 Talking Avatar 模型，唇同步自然。
TTS 历史联动
直接选用 MiniMax 生成的配音，工作流无缝衔接。
多种风格预设
写实 / 卡通 / 肉叔杂谈 / 自定义提示词。
保存到我的作品
生成完成自动入库，支持在线预览与下载。

使用步骤

上传参考图
上传 16:9 人像或卡通形象，或使用肉叔预设。
选择配音
从 TTS 历史选择或上传 MP3/WAV 音频。
选择风格并生成
选择写实/卡通/肉叔风格，点击生成。
下载视频
在页面或「我的作品」预览、下载 MP4。

数字人常见问题

1音频最长支持多少？

单次建议 30 秒以内效果最佳，最长 120 秒。更长文案请分段生成 TTS 后分别制作。

2需要什么图片？

正面清晰人像或卡通形象，建议 16:9 横版，中性表情。

3肉叔预设是什么？

内置杂谈风格卡通大叔参考图，可在 public/presets/laorou-avatar.png 替换为你的形象。

4消耗多少积分？

标准版 25 积分起 + 按时长递增；Pro 版单价更高。提交前会显示预估。

5生成要多久？

通常 1–5 分钟，取决于音频长度与 FAL 队列。

6视频保存在哪？

自动保存到「我的作品」，模型标记为 AI 数字人。

加载工具中…

AI 数字人 – 图片 + 配音生成唇同步视频

参考图 + MiniMax 配音 · FAL Kling Avatar · YouTube 横版

上传真人或卡通参考图，搭配配音音频，一键生成唇同步说话数字人视频。

基于 FAL Kling AI Avatar v2，支持写实、卡通、肉叔杂谈等多种风格，输出 16:9 横版 MP4。

音频可本地上传，也可从 TTS 历史选用；生成结果自动保存到「我的作品」。

FAL API Key 保存在服务端，按生成秒数计费，提交前会显示积分预估。

为何使用 AI 数字人

无需真人出镜
用卡通或虚拟形象代替真人录制，降低制作门槛。
配音与口型同步
MiniMax TTS 配音 + Kling 唇同步，一次完成口播视频。
YouTube 横版输出
16:9 参考图生成横版视频，适合 YouTube 科普频道。

功能亮点

Kling AI Avatar v2
FAL 最新 Talking Avatar 模型，唇同步自然。
TTS 历史联动
直接选用 MiniMax 生成的配音，工作流无缝衔接。
多种风格预设
写实 / 卡通 / 肉叔杂谈 / 自定义提示词。
保存到我的作品
生成完成自动入库，支持在线预览与下载。

使用步骤

上传参考图
上传 16:9 人像或卡通形象，或使用肉叔预设。
选择配音
从 TTS 历史选择或上传 MP3/WAV 音频。
选择风格并生成
选择写实/卡通/肉叔风格，点击生成。
下载视频
在页面或「我的作品」预览、下载 MP4。

数字人常见问题

1音频最长支持多少？

单次建议 30 秒以内效果最佳，最长 120 秒。更长文案请分段生成 TTS 后分别制作。

2需要什么图片？

正面清晰人像或卡通形象，建议 16:9 横版，中性表情。

3肉叔预设是什么？

内置杂谈风格卡通大叔参考图，可在 public/presets/laorou-avatar.png 替换为你的形象。

4消耗多少积分？

标准版 25 积分起 + 按时长递增；Pro 版单价更高。提交前会显示预估。

5生成要多久？

通常 1–5 分钟，取决于音频长度与 FAL 队列。

6视频保存在哪？

自动保存到「我的作品」，模型标记为 AI 数字人。

AI 数字人 – 图片 + 配音生成唇同步视频

为何使用 AI 数字人

无需真人出镜

配音与口型同步

YouTube 横版输出

功能亮点

Kling AI Avatar v2

TTS 历史联动

多种风格预设

保存到我的作品

使用步骤

上传参考图

选择配音

选择风格并生成

下载视频

相关 AI 工具

数字人常见问题

AI 数字人 / 唇同步

素材与设置

生成结果

AI 数字人 – 图片 + 配音生成唇同步视频

为何使用 AI 数字人

无需真人出镜

配音与口型同步

YouTube 横版输出

功能亮点

Kling AI Avatar v2

TTS 历史联动

多种风格预设

保存到我的作品

使用步骤

上传参考图

选择配音

选择风格并生成

下载视频

相关 AI 工具

数字人常见问题

AI 数字人 / 唇同步

素材与设置

生成结果