人工智能:Sora 随感
Sora 做了什么
基于目前公开的信息 Sora 模型奠基于两大原理之上:Transformer 与 Scaling Law。前者本质就是换个角度看问题,使得跨领域建模及其处理更为一致、高效,一如:频率和概率,直角坐标系和极坐标系,大数据常用的矩阵变换等等;后者就是大力出奇迹的规模效应:模型大,数据多,算力强,那效果就更好(是否能达到涌现的程度存疑)。个人感觉前者使“通用”成为可能,后者使“智能”成为可能。Sora 强大之处是仅通过学习人类产生的视频(仅视觉、听觉、字幕),就能产生世界模拟器的四维视频。但我不认为它从中推理出牛顿定律或能量守恒定律等,进而根据这些理论来构建四维世界视频,它仅仅是通过大数据分析在可能性空间中选择相关关系最大的情景。