近日OpenAI发布视频生成模型Sora成为全世界关注的焦点,关于这一模型是否懂得物理规律的争论也一直在出现。Sora能够加速通用人工智能的发展,在短视频、教育以及广告制作等场景具有广阔的应用前景,可以给行业领域的生产模式带来变革。

Sora视频模型最多可以生成60秒的视频,它仅靠使用者提供的文字进行生成,还能读懂人和物体在物理世界中的真实存在方式,这是和其他视频生成模型最大的不同,以经典的“海盗船在咖啡杯中缠斗”为例,Sora能够克服其中的物理难点,先将海盗船缩小到能够在咖啡杯中的尺寸,同时保持这一物体的细节构造;此外还要考虑到流体动力学,因为咖啡杯里面的液体会对海盗船的运动状态产生影响,Sora还要模拟波浪和水花的溅射;对光线和阴影进行处理,现在生成的模型还有一定瑕疵,但和其他模型相比已经有了革命性的进步。

简单地对大数据进行拟合并不是发展视频生成模型的最佳方式,它难以领悟到真实世界存在的物理法则,有限的数据不可能让模型学习到这一点。有人指出,Sora其实是一个数据驱动的物理引擎,它是对许多个世界进行模拟之后的整合,现在Sora还有些让人觉得不够完美的地方,但之后它还有很大的发展空间。

有业内人士表示,Sora将会推动软件产业的变革,这种技术革新会倒逼软件开发者对软件的功能进行革新,以适应日渐发展的视频制作技术;Sora的出现让AI视频迎来了“GPT”的时刻,未来这一模型将会在更多的领域应用,一旦通用人工智能出现,现在的生产模式将会出现很大改变。