vidu 是中国首个长时长、高一致性、高动态性的视频大模型。它采用原创的 diffusion 与 transformer 融合的架构 u-vit,支持一键生成长达16秒、分辨率高达1080p 的高清视频内容。该模型不仅能够模拟真实物理世界,还拥有丰富想象力,具备多镜头生成、时空一致性高等特点。

添加新评论