搜索
  • 首页
  • 快讯
  • 资讯
    • 推荐
    • 财经
    • AI
    • 创新
    • 城市
    • 最新
    • 创投
    • 汽车
    • 科技
    • 专精特新
  • 直播
  • 视频
  • 专题
  • 活动
搜索
寻求报道
我要入驻
城市合作
首页> 人工智能>正文

从AI作画到AI做视频,这一跳改变了什么?

脑极体·2022-10-18 19:26
AI到达不了的领域,才是人类创作的价值

九月初的时候,AI绘画作品《太空歌剧院》在美国获得了人类艺术竞赛一等奖的新闻让许多人震惊不已。许多人没有想到,画沙雕图的AI竟然这么快就技能进步到超越了人类。AI作画的时间从年初以小时为单位到现在短到秒级别,并且绘出的图像质量越来越高,几乎接近人类专业画家的水平。我们在社交媒体中也看到越来越多的人分享他们在各种AI作画平台上的作品。

AI作画的风头正盛,用AI做视频的应用也悄然而至。九月底Meta小扎公布了自家Make-A-Video的AI视频制作工具。这款工具可以生成高质量的短视频。Meta AI做视频的新闻还没有焐热,谷歌也不甘示弱,推出了两款AI生成视频的工具:Imagen Video 和 Phenaki。前者倾向于打造视频质量,后者倾向于视频的逻辑与时长。这几款AI视频制作工具各有特色。

文本生成图像的AI技术大火才不过几个月,就直接跃升至文本生成动态视频。从画图到做视频,AI的发展速度令人讶异,同时令人对未来的数字媒体憧憬。那么,这种跨越到底会给未来带来什么呢?

AI做视频是AI作图的延伸

在讨论AI生成视频会给未来带来哪些改变前,我们先梳理下,AI生成视频的技术原理和应用场景。

先从Meta家的Make-A-Video看起。在小扎公布的视频中,我们可以看到一场AI制作的视频秀,其中一幕是泰迪熊正在画自画像。仅仅通过文本描述,Make-A-Video就可以生成一段视频。官网的案例中,我们会发现还有一些会飞的超人狗狗、喝水的马等,这些视频都是由AI生成的。

谷歌的Phenaki工具也类似Make-A-Video,可以通过一系列的文本提示生成有故事性的连贯视频。如官网展示的骑马太空人、游泳的小熊等。

从AI作画到AI制作视频,静态的图像创作又转化为动态的视频演绎一些简单的情节片段,这些是如何依靠技术达成的呢?

AI绘画的原理,简单来说是通过神经网络模型将图像与文本连接,基于大规模的图文训练集对比学习训练,提取文本与图像特征互相匹配,最终生成关联程度较高的图像。

与AI作画相比,AI生成视频需要多个AI模型的配合来完成视频的制作。作画与做视频的第一步都需要预训练文本-图像模型,先由文本生成大量的图像。而后续的步骤就出现较大的差别。AI生成视频,在完成基本的图像生成之后,还需要将这些图片连起来,变成动态清晰有逻辑的视频。这就需要额外增加插值模型来处理图片变成一帧帧流畅的视频动作,用超分辨率模型来提升图像的像素。通过这些模型的处理,让前后帧之间的过渡动作更加平滑,画质的像素质量更高,最终生成高分辨率和帧率的视频。

相较于AI作画,从技术上来看,视频可以认为是多张“图片”有逻辑、连贯的组成。视频帧是一张张图像,各帧之间有画面、逻辑等层面的关联。因此,由文生图与由文生视频完全是两种难度级别。AI生成视频,是AI生成图像的深度延伸。

AI生成视频相对更难实现。为什么AI研究人员会向视频领域的创作进发?AI做视频到底有什么应用价值呢?

AI做视频价值几何?

移动互联网的繁荣,催生出了各类社交和流媒体平台。这些平台中丰富的图文、视频内容,成为当代人碎片时间的精神食粮。伴随短视频平台和直播行业的兴起,人们对内容的需求越来越旺盛。这也筑造了规模庞大的泛内容产业。

对于内容的创作,核心的是创意与效率。但以人为核心模式的创作模式在高速迭代的内容产业中似乎越来越赶不上趟。应用AI技术来辅助内容创作的AIGC模式,开始渗入到泛内容领域中。

从视频的创作角度来说,在脚本外,寻找匹配适合的视频素材是创作的核心。虽然行业内有大量的素材库,但寻觅素材的过程耗费时间,并且也不一定能找到符合脚本内容的视频素材。

面对提升效率与贴合脚本内容的需求,AI生成视频工具可以很好地解决这类问题。谷歌和Meta的AI视频工具都可以基于文本描述生成视频。

Make-A-Video目前可以实现文字转视频、图片转视频、视频生成视频三种功能场景。谷歌Imagen Video不仅能生成高清视频,而且能理解并生成不同艺术风格的作品。而谷歌Phenaki目前可以做到文字转视频,并且根据文字描述可以生成较长、情节连贯的作品。Phenaki瞄准的是长视频的制作。

无论是短视频领域,还是长视频领域,面向这些行业,AI生成视频都会为视频内容行业的发展赋予价值。

1.提升视频制作效率的同时降低制作成本。传统的视频制作需要脚本、收集素材、剪辑等流程,每一项工作都需要耗费大量的时间与成本。AI生成视频可以通过文本生成视频,或者由图片、视频等素材生成视频,可以降低拍摄或搜集视频素材的成本。AI可以对应着脚本文本的描述,就能生成视频,大幅提高视频制作的效率。

2.增加丰富的创意。AI大模型可以遍历学习所有的创意与风格。从内容的丰富度来说,人类无法企及。通过不同风格、创意素材的喂养,AI视频生成可以创作出多种风格融合的作品,补充人类制作视频的创意。

3.增加内容产业价值。AI视频生成对视频内容领域的革新,为行业带来新的应用场景与新工种。AI作画已经诞生出了新的职业AI画师。类似AI作图,AI做视频也会诞生出新的职业,AI剪辑师,应用AI工具创作视频。未来AI生成视频将会与游戏、影视、媒体等多行业结合,与元宇宙、AR、VR等场景碰撞,创造出更多的场景与产业价值。

不过现下AI生成视频的发展处于非常初级的阶段,并不能完全生成出较完善的视频。我们在谷歌和Meta中看到的视频,仍然存在许多问题。比如视频动作过渡不自然、理解角度诡异、视频分辨率不高等。这些情况的出现原因在于AI工具模型的能力不高,对模型投喂的素材数据质量有一定的要求。如果这些问题得不到较好的解决,也会限制未来一些场景的应用可能,如对于像素和逻辑要求较高的商业影视剧。而短平快的小视频根据分发渠道的不同,质量的参差带来的影响不同。但归根结底,高质量的视频内容商业化的可能性会更大。

未来的商业模式

AI生成视频,未来的商业模式取决于不同的应用场景。面对一些制作短视频为主的小B端企业,如媒体、广告、电商等行业。谷歌、Meta等AI企业会为这些小B端企业提供AI视频制作应用服务。类似AI作画的商业逻辑,可能提供按次收费、按时长付费或者是按照不同功能与需求的制作收费,助力这些行业提升内容创造的效率,增加在线视频领域的流量。不过这种商业模式的发展必须以规模化支撑,这样才能有可持续发展的可能,毕竟AI厂商的视频工具开发与运维成本较高。

对于以流媒体平台分发为主,制作中长视频的影视行业来说,需求的频次与质量要求较高,因此AI厂商需要提供的是解决方案为主的服务,甚至是定制化的服务,提供专属的创作模块,比如特效、运镜、转场等模块化工具。这种商业模式的价值高,但对于整个影视行业以及上下游产业链来说,是巨大的变革。产业需要花费较长时间地过渡与适应。

除了影视企业以外,游戏行业与AI视频制作也会有可能碰撞出火花。游戏行业的视频内容开发可以借助AI生成视频来提高创意与效率,降低开发的成本。对于游戏行业的商业模式也会类似影视行业提供专门的行业解决方案。

当然,整个产业领域中,也有一些企业对视频生成的需求并不高,但也不是完全没有需求。比如大多数小企业都需要简单的企业宣传视频,或是年度的几场活动需要视频内容宣传支持。一年可能就两三次的需求,频次较低。这些企业并没有专业的视频制作人员,可能会选择应用AI生成视频工具。

如果观察的视角从企业转向个体的话,大部分个人消费者也可以应用AI生成视频来娱乐。就像AI作图一般,AI生成的视频也会成为新的社交媒体话题。网友可以通过输入文本指令生成各种各样的视频,交流创意。我们或许会从被投喂的角色,转化为创作者互相分享,交流创意与思想。

这些商业模式的可能性建立在视频内容优良与成本合理的前提下。未来AI视频商业化的过程中,可能依然会面临版权和伦理的问题。无论是素材库还是AI生成视频的风格养成,都离不开人类创作的图像、视频等内容。AI工具需要这些人类创作的图像数据训练迭代。这也意味着在版权方面依然存在归属争议的灰色地带。伦理方面,当输入暴力、血腥、黄色等敏感信息,生成的内容可能会陷入伦理道德的困境。这些问题会伴随着视频生成长期存在,需要设置更好的机制与模式去减少这类事情的发生。

与AI做视频不同,AI作图最终内容可以抽象。这种图像内容可能艺术价值更高。但对于视频来说,内容必须连贯、有逻辑。这也对AI生成视频的能力提出了要求。AI生成长视频是否有逻辑,可以根据文本表达出故事性,仍然是个未知数。尤其是一些深度的内容制作,AI是否能够创作出这类内容需要打个问号。而这些AI到达不了的领域,就是人类创作的价值地所在。

内容的创作,艺术的创作最终导向的是连接,或者是连接智慧,或者是连接灵魂。人们借由艺术表达共鸣,而这些都是AI去不了的场域。未来,或许在AI的内卷下,是人类高质量内容创作的高峰。

本文来自微信公众号 “脑极体”(ID:unity007),作者:燕良,36氪经授权发布。

人工智能 谷歌 视频制作
+1
8

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
登录后参与讨论
提交评论0/1000
你可能也喜欢这些文章
OpenAI o1金牌团队揭秘AI超越人类惊人时刻!22分完整版视频全公开
最强卷王3个月进化9次!可灵AI上新1.5模型,国外网友:太疯狂
AI大模型站在十字路口,持续突破or陷入低谷?
一小时翻译整部《甄嬛传》,AI面试官发offer……在杭州看AI落地的1000种玩法
不只是炒菜,AI正在全面渗透餐饮
OpenAI 将 o1 AI 模型扩展到企业和教育领域,与Anthropic直接竞争
Open o1不会“消灭”程序员
张俊林:OpenAI o1的价值意义及强化学习的Scaling Law
售价高达100万的AI产品,有钱人排队求买,为什么?

最新文章推荐

又一芯片公司,被GPU改变命运 世界上第一个成功返老还童的男人 智氪 | 买现实、卖预期的A股会因海外降息而改变吗? LVMH/雅诗兰黛联投一香水品牌 张大奕,留在了10年前的网红时代 公话亭变身最小公路酒吧 不夜城上海有了新城市符号 耐克换帅不意外,为何职业经理人在运动品牌难有好结局?|BrandBeat 苹果、讯飞、腾讯同日宣布重磅消息,这一市场终于要爆了 OpenAI o1金牌团队揭秘AI超越人类惊人时刻!22分完整版视频全公开 大手笔套现,巴菲特2个月减持570亿元!目前最好的投资是囤现金?伯克希尔囤积现金近2万亿元,此前已甩卖数千亿元苹果股票
脑极体
特邀作者

写让你脑洞大开且能看懂的人工智能、流媒体、海外科技。

最近内容

《黑神话:悟空》真的带火云电脑了吗?
三问AI手机:什么意图?怎么识别?何种框架?
大模型,不是消费电子的救星

提及的项目

查看项目库

视辰信息

美视云科技

下一篇

为什么说东方甄选,是俞敏洪的最后战役?

那些模仿新东方直播带货的企业,后来都怎样了?

2022-10-18

热门标签

雷雷 伽玛 职位分析 基尼系数 瘾君子 王野 瘦身 猛犸象 北京花店 运动医学 林宁 十年之约 京东家电专卖店 女性电影 陆风 江铃 云渲染 网络小说作家 曲线锯 鬼冢 鬼冢虎 鲍尔曼 2016西安草莓音乐节 场地出租 二元对立 生态学 消费贷款 天下秀 魅族真旗舰 赢商网
意见反馈
36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业

玻璃钢生产厂家玻璃钢老虎雕塑深圳商场玻璃钢雕塑设计厂家春季商场dp点美陈周口标牌校园玻璃钢景观雕塑武汉室内玻璃钢花盆怎么区分玻璃钢雕塑做工湖北玻璃钢卡通雕塑草莓加工哪有玻璃钢雕塑设计与制作广州欧式玻璃钢雕塑定做上海常用商场美陈批发价丽江玻璃钢雕塑批发商淄博市玻璃钢雕塑定制陕西肖像校园玻璃钢景观雕塑肖像玻璃钢彩绘雕塑生产厂家呈贡玻璃钢雕塑定做厂家哪里好杭州玻璃钢雕塑优势东营小品系列玻璃钢雕塑厂家玻璃钢公园景观雕塑宁夏玻璃钢卡通雕塑迷你多少钱内蒙古玻璃钢榴莲雕塑白银动物玻璃钢雕塑价格玻璃钢雕塑完整版商场天井森系美陈铜川卡通玻璃钢雕塑生产厂家绍兴玻璃钢花盆怎么样贵州节日商场美陈安庆环保玻璃钢雕塑设计宣城创意玻璃钢雕塑设计福建公园玻璃钢雕塑开封商场美陈绿植墙香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声单亲妈妈陷入热恋 14岁儿子报警汪小菲曝离婚始末遭遇山火的松茸之乡雅江山火三名扑火人员牺牲系谣言何赛飞追着代拍打萧美琴窜访捷克 外交部回应卫健委通报少年有偿捐血浆16次猝死手机成瘾是影响睡眠质量重要因素高校汽车撞人致3死16伤 司机系学生315晚会后胖东来又人满为患了小米汽车超级工厂正式揭幕中国拥有亿元资产的家庭达13.3万户周杰伦一审败诉网易男孩8年未见母亲被告知被遗忘许家印被限制高消费饲养员用铁锨驱打大熊猫被辞退男子被猫抓伤后确诊“猫抓病”特朗普无法缴纳4.54亿美元罚金倪萍分享减重40斤方法联合利华开始重组张家界的山上“长”满了韩国人?张立群任西安交通大学校长杨倩无缘巴黎奥运“重生之我在北大当嫡校长”黑马情侣提车了专访95后高颜值猪保姆考生莫言也上北大硕士复试名单了网友洛杉矶偶遇贾玲专家建议不必谈骨泥色变沉迷短剧的人就像掉进了杀猪盘奥巴马现身唐宁街 黑色着装引猜测七年后宇文玥被薅头发捞上岸事业单位女子向同事水杯投不明物质凯特王妃现身!外出购物视频曝光河南驻马店通报西平中学跳楼事件王树国卸任西安交大校长 师生送别恒大被罚41.75亿到底怎么缴男子被流浪猫绊倒 投喂者赔24万房客欠租失踪 房东直发愁西双版纳热带植物园回应蜉蝣大爆发钱人豪晒法院裁定实锤抄袭外国人感慨凌晨的中国很安全胖东来员工每周单休无小长假白宫:哈马斯三号人物被杀测试车高速逃费 小米:已补缴老人退休金被冒领16年 金额超20万

玻璃钢生产厂家 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化