AI视频生成这么强？带你快速了解发展概况和应用场景！

2023/10/27 推荐： Bay的设计奥德赛阅读 3.5w 评论有奖阅读本文需 10 分钟

AIGC

AI绘画

AI视频

Runway

本文收录于专题

AI视频

共收录33篇

轻松搞定！AI视频+微动效生成神器 PixVerse 生成秘籍

重磅发布！Stable Video 零基础使用教程及应用案例

清华出品！AI视频神器 Vidu 横空出世，效果直追 Sora！

查看本专题

首页
设计文章
AI创作
详情

AI视频生成这么强？带你快速了解发展概况和应用场景！

AI 生成视频发展到什么程度了，效果如何？有哪些可用的产品方案？网上炫酷的效果如何实现？AI 视频的应用场景和案例有哪些？

本着对以上问题的探索，我开启了 AI 视频系列的探索。上篇将着重介绍技术发展概况和应用场景思考。

更多 AI视频生成神器介绍：

Pika！又一个AI短视频生成神器，免费使用！

大家好，这里是和你们一起探索 AI 的花生~ 之前为大家推荐过一款知名的 AI 视频生成工具 Runway，它的 Gen-2 模型可以直接根据文本生成视频，效果稳定。

阅读文章 >

一、技术发展概况

长期以来，人们对 AI 视频技术应用的认知停留在各种“换脸”和视频特效上。随着 AI 图像领域的技术发展，AI 视频技术也逐渐取得了突破。本节内容结合 Claude、Perplexity 查询、项目论文整理而成。

1. 生成方法

从交互方式来看，当前 AI 视频生成主要可分为文本生成视频、图片生成视频、视频生成视频三种形式。

一些视频生成方法是先生成静态关键帧图像，然后构建为视频序列。也存在直接端到端生成视频的技术，无需进行多阶段处理即可生成视频，如基于 GAN、VAE、Transformer 的方法。

当视频在手机上无法加载，可前往PC查看。

微软 NUWA-XL：通过逐步生成视频关键帧，形成视频的“粗略”故事情节，然后通过局部扩散模型（Local Diffusion）递归地填充附近帧之间的内容。

2. 关键帧 + 补间技术方式间的差异

代表产品：Deforum、AnimateDiff、Rerender a Video

（1）关键帧生成方式很多，主要通过各种 AI 生成图片的方式解决，最主流的方式是 Stable Diffusion，可最大程度的保证不同帧风格一致，在下文中会详细介绍实操案例。

（2）补帧算法:主要用于平滑关键帧之间的动作和细节。

光流补帧：通过计算两帧图像之间每个像素的运动向量，根据光流场生成中间帧。优点是计算量较小，速度快。代表产品是 EbSynth。

基于姿态补帧：利用人体关键点检测计算姿态信息（关节位置、角度等信息），进行中间帧图像合成。适合为具有复杂运动的复杂对象或角色制作动画。

重参考补帧：使用相邻的后向和前向帧作为参考，通过双向帧信息进行像素级补帧。

（3）完善策略: 进一步提升生成视频的整体质量和连贯性，协同补帧算法，弥补关键帧生成可能存在的各类缺陷。不同模型使用的方法有所差异。

渐进补帧：通过迭代多次补帧完善视频质量，逐步提升分辨率和连贯性。

递归框架：递归完善每一帧，直到达到质量要求。

增强后处理：使用图像增强 GAN 等技术，对生成的视频进行修复和提升，特别提升存在模糊、残影等问题的区域，增强整体质量。

对比学习：指学习和对比真实高质量视频数据，从中提取提升生成视频细节的模式。

模糊处理：使用滤波、平滑等算法处理生成视频，减少帧间的不连贯引起的毛刺和锯齿问题，增强视觉流畅性。

融合多个模型：不同模型生成相同视频，进行模型融合。

3. 端到端视频生成的技术差异

代表产品： Runway

Runway！AI技术+视频制作的新一代视频内容生成工具

大家好，这里是和你们聊设计的花生~ 之前和大家聊过不少 AI 图像生成工具，有的可以根据文本生成图像，有的则是将 AI 技术运用到图像处理中，让扣除背景、消除画面元素成为非常轻松快速的事情，大大提升了设计师的工作效率。

阅读文章 >

GAN 生成对抗网络:

是一种无监督的生成模型框架，通过让两个神经网络相互博弈来进行机器学习。可以生成视觉逼真度高的视频，但控制难度大、时序建模较弱。

VAE 变分自编码器:

它是一种可以学习数据分布的网络结构。就像把视频文件压缩成较小的文件再解压一样，它可以重建视频数据。VAE 可以根据条件输入控制生成过程，但质量较 GAN 略低。

GAN、VAE 生成视频速度快，缺点是生成质量和分辨率较低，长度短，控制能力弱。

Transformer 自注意力机制:

通过学习视频帧之间的关系，理解视频的长期时间变化和动作过程，这种方式对长视频建模更好，时序建模能力强，可实现细粒度语义控制，缺点是计算量大。

4. AI 视频生成当前面临的问题

当前仍面临生成时间长、视频质量不稳定，生成的视频语义不连贯、帧间存在闪烁、分辨率较低等问题。解决方案有：

使用渐进生成、增强时序一致性的模型等方法解决。

上述的补帧算法、视频完善策略也可在一定程度上缓解问题。

二、应用场景思考

1. 现阶段应用场景

在盘点完全部产品后，我感受到 AI 视频产品目前面向的主要受众群体有：

（1）专业创作者（艺术家、影视人等）：

AI 生成能够为作品赋予独特风格和想象力，为创作者提供灵感，配合高超的剪辑技巧和叙事能力，便可以制作出超乎想象的效果。低成本动捕更是能够大幅降低后期制作的门槛和成本，自动识别背景生成绿幕、视频主体跟随运动等能够辅助视频编辑，为后期制作增加更多空间。

目前该应用主要集中在音乐 MV、短篇电影、动漫等方向。

一些 AI 视频平台也积极寻求创意合作，为创作者提供免费支持。

当视频在手机上无法加载，可前往PC查看。

@valleeduhamel 使用现有的素材、Gen-1 和大量合成创作了新电影《After Light》的过程分享

当视频在手机上无法加载，可前往PC查看。

Ammaar Reshi 的团队使用 Stable WarpFusion + Davinci Resolve 制作完整的动漫剧情，制作过程分享

（2）自媒体、非专业创作者：

这部分人群通常有着非常具体且明确的视频剪辑痛点。

a. 比如科技、财经、资讯类重脚本内容的视频在制作时需花费大量时间寻找视频素材、还需注意视频版权问题。一些产品（Invideo AI、Pictory）已经在发力脚本生成分镜、视频，帮助创作者降低视频素材制作门槛。

Gamma AI 已经实现了文章高效转 PPT 的能力，若能结合 Synthesia、HeyGen AI、D-ID 等产品的 Avatar、语音生成能力也可快速转化为视频内容。

当视频在手机上无法加载，可前往PC查看。

b.不同平台适合不同内容形式，创作者想要将同一个素材在不同平台分发就意味着制作成本的升高。而 OpusClip 提供的长视频转短视频致力于解决这一痛点。

当视频在手机上无法加载，可前往PC查看。

（3）企业客户：

对于没有足够视频制作资金的小企业、非盈利机构来说，AI 视频生成可以为其大幅缩减成本。

想要制作低成本的营销视频、企业宣传视频、培训课程，可以使用 Synthesia、HeyGen AI、D-ID 等产品，用 Avatar 代替真人出镜。

又如出海企业需要给产品（商品）推广、介绍使用体验，早在 21 年，诗云马良平台就推出了给视频中模特换脸、切换语言的能力，方便电商营销商家进行产品的本地化推广。近期 HenGen AI 也公布了 AI 切换视频内语言的能力，并且能够将 Avatar 口型与视频相匹配。

AI视频生成这么强？带你快速了解发展概况和应用场景！

在互联网设计工作流中的应用畅想

在互联网产品设计领域，设计师的工作主要涉及宣传视频、3D 动画、页面动画、图标动画制作，且产出内容需具备具体需求场景下落地的要求。

目前 Move AI 这样的产品让我看到了在游戏和产品设计工作中大幅降低 3D 动画制作成本的可能。未来设计师可能只需要拍摄特定动作并映射到制作好的 3D 模型中，快速制作动画方案。

AI视频生成这么强？带你快速了解发展概况和应用场景！

By Mark Peart

目前，Figma、Protopie 等产品支持的智能动画功能已经能够基于补间算法，在用户仅定义动画的开始和结束状态的情况下自动生成中间帧。未来不排除实现通过文字更加精确的控制动画的可能。

AI视频生成这么强？带你快速了解发展概况和应用场景！

下一篇中，我们将着重了解每个产品的特点和具体使用方法，也会通过实践案例展示效果。

应用场景思考中提到的视频工具均会在下篇出现，敬请期待～

Bay的设计奥德赛

文章 8 人气 32.0w

腾讯 产品体验设计

+关注作者

复制本文链接文章为作者独立观点不代表优设网立场，未经允许不得转载。

继续阅读本文相关话题

AIGC

AI绘画

AI视频

Runway

全部

AIGC

网页

平面

手绘

电商

交互

产品

下载

神器

职场

学AI

AI导航

Bay的设计奥德赛

32.0w人气 8文章

+关注

查看主页

1 AI&PPT重磅更新！Figma 最新版本有哪些值得关注的细节？
2 AI 到底有多强？万字干货盘点最新大模型应用和动态！

发表评论已发布4条

以上留言仅代表用户个人观点，不代表优设立场

评论就这些咯，让大家也知道你的独特见解立即评论

Rask.AI ！颠覆性的视频翻译+配音神器，打破语言障碍！

Rask 是一款 AI 视频制作神器，它能将一个视频转换为 60 多种不同的语言并自动配音，甚至可以克隆原视频的声音，让视频内容创作者可以打破语言的隔阂，用较低的成本让自己...

AIGC AI创作

6分钟阅读

D-ID ！数字人视频制作神器，只需5分钟让照片开口说话

今天为大家推荐的 D-ID 就是一款能帮助我们迅速制作出数字人视频的神器，只需在里面上传你的人物照片，输入视频介绍文本，就能在几分钟内让图像开口说话，并且人物口型与音频能精准...

AIGC AI创作

5分钟阅读

Poe！集齐4大 AI 聊天工具的神器，再也不同担心用不上 ChatGPT 了~

今天就为大家推荐一款 AI 聊天应用 Poe，它集成了 ChatGPT、GPT-4、Claude 等多款目前最强大的聊天机器人，让我们轻松实现在一个平台上同时与多个不同的机...

ChatGPT Claude

7分钟阅读

菜单 优设网uisdc.com 优设网 - 学设计上优设

您还未登录

登录后即可体验更多功能

AI视频生成这么强？带你快速了解发展概况和应用场景！

2023/10/27 推荐： Bay的设计奥德赛阅读 3.5w 评论有奖 阅读本文需 10 分钟

本文收录于专题

AI视频

共收录33篇

轻松搞定！AI视频+微动效生成神器 PixVerse 生成秘籍

重磅发布！Stable Video 零基础使用教程及应用案例

清华出品！AI视频神器 Vidu 横空出世，效果直追 Sora！

Pika！又一个AI短视频生成神器，免费使用！

一、技术发展概况

Runway！AI技术+视频制作的新一代视频内容生成工具

二、应用场景思考

Bay的设计奥德赛

文章 8 人气 32.0w

继续阅读本文相关话题

Bay的设计奥德赛

32.0w人气 8文章

本文3套知识9图

Prompt 灵感！Midjourney 3D 游戏四季卡通地图

Midjourney 美学风格代码！8 组抓绒多彩可爱风

肝爆预警！全网最详尽角色线稿上色秘籍！

文章目录

文章目录

你即将学会 AIGC 的知识

Midjourney 上线新版网站！搜索功能大提升，使用体验更流畅

4.8w 人阅读

上一篇

你即将学会 B端设计 的知识

B端基础科普！4个章节帮你掌握栅格系统与设计尺寸

3.5w 人阅读

下一篇

发评论！每天赢奖品

点击 登录 后，在评论区留言，系统会随机派送奖品

2012年成立至今，是国内备受欢迎的设计师平台，提供奖品赞助 联系我们

用户体验设计核心问答

已累计诞生 602 位幸运星

发表评论 已发布4条

↓ 下方为您推荐了一些精彩有趣的文章热评 ↓

夏花生

AI创作

Rask.AI ！颠覆性的视频翻译+配音神器，打破语言障碍！

夏花生

AI创作

D-ID ！数字人视频制作神器，只需5分钟让照片开口说话

夏花生

AI创作

Poe！集齐4大 AI 聊天工具的神器，再也不同担心用不上 ChatGPT 了~

夏花生

AI创作

Pika！又一个AI短视频生成神器，免费使用！

新浪MDC

AI创作

万字干货！Sora 如何如何转化为实际生产力？

优设推荐官精选热门话题

设计规范

文章 270

Midjourney

文章 966

干货合集

文章 282

设计趋势

文章 251

评论

收藏

分享

AI趋势

入站必看

设计入门

进阶提升

热门资源

最新AI工具

300+实用AI工具全收录

Midjourney

会上瘾的AI绘画工具

AI智能绘画

让AI助你一臂之力

Blender

菜单优设网 - 学设计上优设

2023/10/27 推荐： Bay的设计奥德赛阅读 3.5w 评论有奖阅读本文需 10 分钟

你即将学会 B端设计的知识

点击登录后，在评论区留言，系统会随机派送奖品

2012年成立至今，是国内备受欢迎的设计师平台，提供奖品赞助联系我们

发表评论已发布4条