OpenAI发布重磅武器Sora大模型:文本生成超逼真视频

OpenAI推出了一个新的视频生成模型,名为Sora。

这家人工智能公司表示,Sora“可以根据文字指令创建真实而富有想象力的场景”。这个文本到视频的模型允许用户根据他们编写的提示创建长达一分钟的逼真视频。

示例;

关键词:“Beautiful, snowy Tokyo city is bustling. The camera moves through the bustling city street, following several people enjoying the beautiful snowy weather and shopping at nearby stalls. Gorgeous sakura petals are flying through the wind along with snowflakes.”

根据OpenAI的介绍性博客文章,Sora能够创建“复杂的场景,包含多个角色,特定类型的动作以及主题和背景的精确细节”。该公司还指出,该模型可以理解物体如何“存在于物理世界中”,以及“准确解释道具并生成表达生动情感的引人注目的角色”。

该模型还可以根据静止图像生成视频,以及在现有视频中填补缺失的帧或延伸视频长度。OpenAI博客文章提供了Sora生成的演示视频,如加利福尼亚淘金热时期的空中场景,看起来像是从东京火车内部拍摄的视频,还有一些其他的。

许多视频具有人工智能的一些显着特征,比如博物馆视频中的地板可疑地移动,而OpenAI表示,该模型“可能在准确模拟复杂场景的物理学方面遇到困难”,但总体结果仍然相当令人印象深刻。

热门相关:懒散初唐   上古传人在都市   护花猎王   锦衣   君归矣