Wan2.2 s2v 支持真人、卡通、动物等多类型形象,覆盖肖像、半身、全身等任意画幅,单视频最长可生成分钟级,被誉为数字人创作革命工具。 #人工智能,开源软件,音频视频,数字人 2025-08-30 Infinite Talk 核心技术突破在于通过稀疏帧视频配音框架实现无限时长生成,并首创全身动作同步能力。 #人工智能,开源软件,音频视频,数字人 2025-08-29 Multitalk 一款结合音频驱动多人对话视频生成框架,及多语言实时翻译聊天功能的跨领域AI工具。 #人工智能,开源软件,数字人 2025-08-26 Index TTS B站语音团队开发的工业级文本转语音系统,专注于解决中文语音合成的核心痛点,并通过持续迭代推动零样本语音合成技术的实用化。 #人工智能,开源软件,音频视频,声音克隆 2025-08-25 Kontext整合包 Kontext是由黑森林实验室开发的AI 图像生成与编辑工具,核心技术为 FLUX.1 Kontext,主打上下文感知能力。 #人工智能,实用资源,图片素材,开源软件 2025-08-12 智谱清言 展现了其在办公汇报、创意写作、图片生成、语言翻译等多场景下的实用价值,为用户提供高效的智能辅助支持。 #在线工具,人工智能,图片素材,开源软件,音频视频,办公写作 2025-08-12 Qwen Image V1.1 是阿里云通义千问团队于 2025 年 8 月发布的革命性图像生成基础模型,拥有 200 亿参数规模,专为解决复杂文本渲染和精确图像编辑难题而设计。 #人工智能,实用资源,图片素材,开源软件 2025-08-09 Wan2.2 阿里巴巴集团于2025年7月28日开源的电影级视频生成模型,属于通义万相系列的最新版本。 #人工智能,图片素材,开源软件 2025-08-07 LTX Video 支持文本转视频、图像转视频、视频转视频以及关键帧动画,满足从短片创作到复杂叙事视频的多样化需求。 #在线工具,人工智能,开源软件,音频视频 2025-08-01 Comfy 用于生成视频、图像、音频,核心目标是为用户提供对创作过程的全面控制和充分的创造力。 #在线工具,人工智能,图片素材,开源软件,音频视频 2025-08-01