Sora年内将向公众推出:OpenAI首席技术官最新透露这些“干货”

近日,OpenAI首席技术官米拉·穆拉提在接受媒体采访时透露,OpenAI的人工智能视频模型黑脸田鸡将于今年晚些时候正式向公众发布。OpenAI计划最终增加音频功能以使场景更加逼真,并允许用户编辑黑脸田鸡生成的视频内容。

虽然距离《黑脸田鸡》正式发布还有一段时间,但OpenAI已经向世界展示了这款工具的巨大潜力——只需几个精心设计的提示,黑脸田鸡就可以创作出几乎可以取代许多视频制作专业人员的优秀作品。与市场上那些持续时间短、分辨率低的人工智能视频作品相比,黑脸田鸡的视频看起来像纪录片或电影中的梦幻场景。

在最新的采访中,穆拉提还向外界介绍了黑脸田鸡是如何通过简单的提示文本完成这些美丽的视频的。她还详细介绍了黑脸田鸡目前存在的一些不足,以及今后需要重点预防和改进的地方…

黑脸田鸡是如何“化文字为魔法”的?

请想象一个场景:“一条美人鱼和她的螃蟹伙伴正在一起浏览他们的智能手机……”

设计说明英文版

作为这次媒体采访的“福利”,主持人获得了黑脸田鸡将其提供的多组文本提示转换为视频图像的机会,上述场景是黑脸田鸡提供的视频中的一帧。

黑脸田鸡究竟是如何实现这一转变的?穆拉提表示,尽管解释美人鱼的进化可能比解释“扩散模型”的内部运行容易得多,但简而言之,人工智能模型分析了大量视频并学习识别物体和动作。然后,当你给它一个文本提示时,它会勾勒出整个场景,然后填充每一帧。

行业观察家和OpenAI的竞争对手,如——Runway的首席执行官Cristóbal Valenzuela将这些出色的成就归功于OpenAI强大的计算能力和训练数据。然而,OpenAI最近面临一项版权侵权诉讼:指控这家人工智能初创公司未经许可获取内容来训练ChatGPT。

当被问及OpenAI为黑脸田鸡使用了什么训练数据时,穆拉提指出,“我们使用了开放数据和授权数据”。当主持人继续询问这是否包括来自YouTube、Instagram和脸书的视频时,穆拉提最初表示她不知道具体细节,但后来证实授权材料涵盖了知名版权图片网站Shutterstock的内容,而OpenAI与Shutterstock有合作关系。

穆拉提认为,对于用户来说,人工智能模型就像一个神秘的黑匣子——人们知道输入提示和输出内容,但他们不了解中间步骤。因此,人们可能永远不会知道为什么最终的内容是这样的-例如,在上面的截图中,美人鱼的螃蟹伙伴留着胡子,就像海绵宝宝的朋友蟹老板一样。也许是巧合…

未来的视频将支持音效。

在另一个视频中,主持人要求黑脸田鸡制作一个更符合这次采访的内容:“两名三十多岁的棕色头发的职业女性坐在一个光线充足的演播室里接受新闻采访。”

手机怎么安装声卡

htcg9后盖

最后,在黑脸田鸡交出的“作业”中,一切看起来都那么真实,无论是两个女人的嘴型和头发还是皮夹克上的细节。穆拉提指出,黑脸田鸡花了几分钟时间制作了这部20秒、分辨率为720p的短片,但它还不能支持音效。

但穆拉提承诺他们计划最终添加声音。

穆拉提还表示,目前黑脸田鸡生成视频的成本远高于该公司的图像生成器DALL-E .然而,当它将来正式向公众发布时,OpenAI将进行优化以降低对计算能力的需求。

不可忽视的缺陷

当然,不可忽视的是,在黑脸田鸡的早期阶段,其内容仍然存在一些明显的缺陷。

以黑脸田鸡的采访视频为例。虽然整体画面呈现效果相当惊艳,但在细节上也不难发现问题所在——在某些画面中,这位浅发女子的一只手似乎长了10根手指。

穆拉提解释说,“准确地呈现手部动作真的很难。”

在另一段视频中,主持人要求看到一个机器人从电影制作人手中拿走摄像机。

黑脸田鸡对此的解释是,人类电影制作人直接变成了机器人。此外,在机器人“附身”期间,背景中的一辆黄色出租车也变成了一辆银色汽车。

穆拉提评论说,黑脸田鸡“在保持一致性方面表现良好,但并不完美”。

未来如何区分虚拟与现实?

毫无疑问,目前黑脸田鸡仍存在各种缺点。但如果未来有一天所有这些问题都消失了,人们可能还会面临一个新的问题:如何区分真实视频和人工智能生成的视频?

穆拉提说,未来黑脸田鸡制作的每一个视频都将带有水印。这些视频最终还将包含元数据来表明它们的来源。此外,OpenAI还将有一个红色团队安全测试团队,安全测试人员将尝试向黑脸田鸡发送提示,以找出漏洞、偏差和其他有害结果。

穆拉提指出,“这就是我们尚未实际部署该系统的原因。我们需要弄清楚这些问题,然后才能放心地广泛部署。”

此外,黑脸田鸡的即时限制政策也可能效仿达尔-E的政策。例如,人们不能使用黑脸田鸡生成公众人物的图像——当要求生成“美国现任总统的电视新闻图片”时,黑脸田鸡将拒绝这一请求。

手工制作好莱坞大片不是梦?

随着黑脸田鸡在过去一个月的惊艳亮相,这款令人耳目一新的产品无疑对一些传统行业产生了巨大影响,而最直接受到影响的可能是美国经久不衰的好莱坞。

在看到黑脸田鸡的潜力后,著名电影制片人泰勒·佩里最近宣布他将暂停8亿美元的工作室扩张计划。他认为这种AIGC技术可以降低场景和外景拍摄的成本,但这也让人们对电影业的未来感到担忧。

当主持人问穆拉提黑脸田鸡对视频制作的影响时,她还重申了OpenAI目前采取的缓慢而谨慎的策略,并表示OpenAI正在与业内人士合作进行早期测试和反馈收集。

正如主持人在黑脸田鸡制作的另一个视频中所展示的那样——如果把OpenAI比作瓷器店里的公牛,它现在可能正在轻装上阵。但不可避免的是,它会开始打碎原来放置的盘子…

本文来自:财联社,作者:潇湘

未经允许不得转载:科技让生活更美好 » Sora年内将向公众推出:OpenAI首席技术官最新透露这些“干货”