支持真人、卡通、动物等多类型形象,覆盖肖像、半身、全身等任意画幅,单视频最长可生成分钟级,被誉为数字人创作革命工具。

#人工智能,开源软件,音频视频,数字人

2025-08-30

核心技术突破在于通过稀疏帧视频配音框架实现无限时长生成,并首创全身动作同步能力。

#人工智能,开源软件,音频视频,数字人

2025-08-29

一款结合音频驱动多人对话视频生成框架,及多语言实时翻译聊天功能的跨领域AI工具。

#人工智能,开源软件,数字人

2025-08-26

B站语音团队开发的工业级文本转语音系统,专注于解决中文语音合成的核心痛点,并通过持续迭代推动零样本语音合成技术的实用化。

#人工智能,开源软件,音频视频,声音克隆

2025-08-25

Kontext是由黑森林实验室开发的AI 图像生成与编辑工具,核心技术为 FLUX.1 Kontext,主打上下文感知能力。

#人工智能,实用资源,图片素材,开源软件

2025-08-12

展现了其在办公汇报、创意写作、图片生成、语言翻译等多场景下的实用价值,为用户提供高效的智能辅助支持。

#在线工具,人工智能,图片素材,开源软件,音频视频,办公写作

2025-08-12

是阿里云通义千问团队于 2025 年 8 月发布的革命性图像生成基础模型,拥有 200 亿参数规模,专为解决复杂文本渲染和精确图像编辑难题而设计。

#人工智能,实用资源,图片素材,开源软件

2025-08-09

阿里巴巴集团于2025年7月28日开源的电影级视频生成模型,属于通义万相系列的最新版本。

#人工智能,图片素材,开源软件

2025-08-07

支持文本转视频、图像转视频、视频转视频以及关键帧动画,满足从短片创作到复杂叙事视频的多样化需求。

#在线工具,人工智能,开源软件,音频视频

2025-08-01

用于生成视频、图像、音频,核心目标是为用户提供对创作过程的全面控制和充分的创造力。

#在线工具,人工智能,图片素材,开源软件,音频视频

2025-08-01