OpenAI 并不满足于仅仅被称为 ChatGPT 甚至 LLM 公司:今天它公布了其新的 AI 文本到视频生成模型 Sora 的演示,联合创始人兼首席执行官 Sam Altman 在 X(前身为 Twitter)上发帖称这是一个“非凡的时刻”。
虽然由于 Altman 在他的帖子中所说的“开始红队”,或对其安全防御、缺陷和滥用进行反对测试,该产品尚未正式被大众使用,但创始人确实指出,它正在提供给“有限数量的创作者”,并在以后进行公开扩展。
视频 AI 模型的竞争空间非常激烈
Sora 正在进入一个竞争激烈的领域,现有的竞争对手初创公司 Runway、Pika 和 Stability AI 提供专用的 AI 视频生成模型,以及谷歌等中坚力量展示其 Lumiere 模型功能。
但 OpenAI 今天分享的 Sora 示例视频因其分辨率的清晰度、运动的流畅性、人体解剖学和物理世界的准确性以及最重要的是运行时间而脱颖而出。
与 Runway 和 Pika 不同,它们一次只能提供 4 秒的生成时间,并可选择扩展,而 OpenAI 的 Sora 立即提供 60 秒的视频生成。
Altman 和 OpenAI 领导层和 Sora 团队的其他成员,包括研究员 Will Depue 正在 Twitter/X 上收集用户的提示,他们现在正在通过 Sora 运行,作为模型新功能的一种实时、众包演示,所以如果你有兴趣,请过去向他们提交一些(我做到了)。
这些视频甚至比奇幻视频更令人震惊地逼真,展示了 Sora 复制人类生活中平凡但可识别的时刻的能力——例如从高架火车上观看城市景观,或者一个女人和一只猫在床上的家庭电影。
同样令人印象深刻且可能令人担忧的是,OpenAI研究员比尔·皮布尔斯(Bill Peebles)正在致力于开发“人工广义智能”(定义为在最具经济价值的任务中表现优于大多数人的人工智能),他指出,Sora将通过“模拟一切”来帮助寻求AGI。
在美国联邦机构不断推动对人工智能进行监管,特别是针对其欺诈和真人深度伪造的潜力,Sora 的出现似乎不仅是 OpenAI 的一个里程碑,而且是整个科技和媒体行业以及整个人类的里程碑——尽管是好是坏,还有待观察。
暂无评论内容