Sora到底懂不懂物理世界 Sora有何实用意义

近日OpenAI发布视频生成模型Sora成为全世界关注的焦点，关于这一模型是否懂得物理规律的争论也一直在出现。Sora能够加速通用人工智能的发展，在短视频、教育以及广告制作等场景具有广阔的应用前景，可以给行业领域的生产模式带来变革。

Sora视频模型最多可以生成60秒的视频，它仅靠使用者提供的文字进行生成，还能读懂人和物体在物理世界中的真实存在方式，这是和其他视频生成模型最大的不同，以经典的“海盗船在咖啡杯中缠斗”为例，Sora能够克服其中的物理难点，先将海盗船缩小到能够在咖啡杯中的尺寸，同时保持这一物体的细节构造；此外还要考虑到流体动力学，因为咖啡杯里面的液体会对海盗船的运动状态产生影响，Sora还要模拟波浪和水花的溅射；对光线和阴影进行处理，现在生成的模型还有一定瑕疵，但和其他模型相比已经有了革命性的进步。

简单地对大数据进行拟合并不是发展视频生成模型的最佳方式，它难以领悟到真实世界存在的物理法则，有限的数据不可能让模型学习到这一点。有人指出，Sora其实是一个数据驱动的物理引擎，它是对许多个世界进行模拟之后的整合，现在Sora还有些让人觉得不够完美的地方，但之后它还有很大的发展空间。

有业内人士表示，Sora将会推动软件产业的变革，这种技术革新会倒逼软件开发者对软件的功能进行革新，以适应日渐发展的视频制作技术；Sora的出现让AI视频迎来了“GPT”的时刻，未来这一模型将会在更多的领域应用，一旦通用人工智能出现，现在的生产模式将会出现很大改变。

Sora到底懂不懂物理世界 Sora有何实用意义

相关推荐

本周阅读排行榜