文字变视频!OpenAI发布新AI模型Sora

OpenAI去年凭借ChatGPT的流行而进入主流,现在该公司正将其人工智能技术应用到视频行业。

OpenAI于周四推出了其新的生成式AI模型Sora。Sora的工作方式类似OpenAI的图像生成AI工具DALL-E。用户输入所需场景,Sora将返回一个高清视频片段。Sora还可以生成受静态图像启发的视频片段,或扩展现有视频或填充缺失帧。

文字变视频!OpenAI发布新AI模型Sora

Sora是一个扩散式人工智能模型,与ChatGPT一样,它使用谷歌研究人员在2017年论文中提出的Transformer架构。OpenAI在其声明中写道:“Sora为能够理解和模拟现实世界的模型奠定了基础。”

Sora目前只能生成一分钟或更短的视频。作为微软支持的OpenAI,其发展目标之一是多模态——将文本、图像和视频生成结合起来,从而提供更广阔的人工智能模型套件。

目前,Sora只提供给一小部分安全测试人员 (又称“红队”) 使用,他们负责测试模型在错误信息和偏见等方面的漏洞。该公司表示,其配套的技术论文将在周四晚些时候发布。

OpenAI还表示,他们正在构建一个可以识别由Sora生成的视频的“检测分类器”,并计划在其输出中包含某些元数据,以帮助识别人工智能生成的内容。这与Meta在今年大选期间用来识别人工智能生成图像的元数据类型相同。

现在聊天机器人和图像生成器已经进入消费和商业世界,视频可能是生成式AI的下一个前沿。

借助Sora,OpenAI正在寻求与Meta和谷歌等公司的视频生成AI工具竞争,后者于 1月宣布了Lumiere。其他初创公司也提供了类似的人工智能工具,例如Stability AI,其产品名为Stable Video Diffusion。亚马逊还发布了Create with Alexa,这是一个专门生成基于提示的短格式动画儿童内容的模型。

OpenAI官网发布的Sora生成视频:

Tokyo in the snow

Gold Rush

Ships in coffee

文字变视频!OpenAI发布新AI模型Sora

Big Sur

未经允许不得转载:萌头条 » 文字变视频!OpenAI发布新AI模型Sora

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏