2024年2月15日,ChatGPT母公司OpenAI最新推出的视频生成模型Sora直接引发全球热议。出道即王炸,据OpenAI官方形容,Sora它能够根据用户的一句话生成长达一分钟的高清视频,且这些视频非常逼真,看起来就如同真实拍摄一般,视频的流畅度和稳定性皆在水准之上。
Sora究竟是什么?
Sora采用了扩散型变换器(diffusion transformer)架构,这是一种基于深度学习的模型,能够将随机噪声逐渐转化为有意义的图像或视频内容。Sora 能够生成具有多个角色、特定类型的运动以及主体和背景的准确细节的复杂场景。 该模型不仅了解用户在提示中提出的要求,还了解这些东西在物理世界中的存在方式。
不同于Runway Gen 2、Pika等AI视频工具,都还在突破几秒内的连贯性,而OpenAI推出的Sora已经达到了史诗级的纪录,Sora进化到了可以通过文字描述直接生成高度拟真的视频。
相当于其他AI视频工具还处于刚学会走路的阶段,Sora已经可以直接毕业又跑又跳了。
对比AI视频生成工具,Sora的特别之处在于:
能够生成具有多个角色、特定类型动作和主题背景的复杂视频,时长可达到1分钟。
可以在单个生成的视频中创建多个镜头,模拟复杂的摄像机运镜,同时准确地保持角色和视觉风格。
最重要的是,它不仅理解用户在提示中要求的内容,还能自己理解这些事物在现实世界中的存在方式。
简单概括下来,Sora功能包括“文生视频、图生视频、扩展原视频”,长度最高可达60秒,视频更高清,细节更逼真,表现力更丰富。
目前官网上已经更新了48个视频demo,在这些demo中,Sora不仅能准确呈现细节,还能理解物体在物理世界中的存在,并生成具有丰富情感的角色。该模型还可以根据提示、静止图像甚至填补现有视频中的缺失帧来生成视频。
我们可以看看OpenAI官网的示例:
1.几只巨大的毛茸茸的猛犸象踏着白雪皑皑的草地走近
2.郊区房屋窗台上长出一朵花
3.相机正对意大利布拉诺岛色彩缤纷的建筑。 一只可爱的斑点狗透过一楼建筑的窗户向外张望。 许多人沿着建筑物前的运河街道步行和骑自行车。
看看这些AI生成的影片,用来做大片广告,甚至做电影都毫不违和。不少人已经惊叹Sora的推出将直接对视觉艺术、电影制作、教育、娱乐等领域引发巨大冲击。
Sora在不同领域的应用:
无论是教育教学、产品演示还是内容营销等领域,Sora都能为用户提供便捷、高效的视频创作解决方案。Sora的强大功能可以帮助用户节省时间和资源,实现高质量的视频创作。
用于教育教学领域,帮助教师创作生动有趣的教学视频。
用于产品演示,帮助企业展示产品的功能和特点。
用于内容营销,帮助品牌创作引人注目的广告视频。
“Sora对宣传片、广告片的影响会更大”“电影还有剧本、情节、台词等复杂因素,而在广告、宣传片行业,冲击可能会更快到来。如果提示词可以细节到分镜,那AI不仅仅是帮助导演画分镜和视觉参考图了,而是直接可以做成更高效的动态分镜预览,或者等技术更成熟时可以直接用来做成影视作品。”
或许对于影视行业的冲击可能还需要一定的技术成长时间,但对于Youtube、TikTok等国内外各大短视频平台来说,这绝对是导致创作生态的神器。首先便是大大降低了制作视频的成本,只需要输入一句话便能生成具有大片质感的视频。其次便是或许可以提升视频社区的画面质量,造成内容更加多元化。
Sora怎么获取账号
目前参与了Sora内测的用户所透露的信息来看,Sora账号的获取依然需要美国IP、美国信用卡、非主机类IP地址等,尽管Sora还处于内测阶段,但根据目前的技术完成情况和话题讨论度来看,相信很会便会开放公测与大家见面,若想要早日使用上Sora,可以提前把注册信息准备好,抓取先机。
本文来自网络投稿,不代表kookeey立场,如有问题请联系我们