2022年年末,OpenAI发布的chatGPT一举在全世界范围内开启了一轮AI热潮。在各行各业的不断加码下,AI已经逐渐融入进当下不少职业的工作流程中。而在2024年年初,OpenAI又再度通过名为“Sora”的文生成视频大模型引爆舆论,进一步提升了人们对AI的兴趣。


视频生成模型的重要性从来不止是在“视频”创作本身上,而是其能够模拟现实世界一系列物理规则,在虚拟网络中构建一个“新世界”。不过,受限于技术水平,很多号称视频大模型所生成的视频内容在质量上存在明显缺陷,这也让公众对这一技术的讨论并未像chatGPT那样被进一步引爆。


不过,这并不代表业界对这项技术不敢兴趣。相反,像谷歌、NVIDIA还有国内的字节等,都对相关技术投入了不少研发资金。


通过大模型来将现实世界数字化,然后再在其中模拟预测各项内容,不论在效率还是时间成本上都有明显优势。当下在民用层面的大模型,多数仍旧是以文字生成方面功能为主,连图片生成的能力都比较有局限性。想要真正地模仿物理世界,显然还具有很大的技术鸿沟。


导致这一现状的主要原因之一,就是因为大模型缺乏对客观世界的完备认知。而世界大模型的开发,除了表面上的视频生成功能外,让AI能够形成更加完备的客观世认知,也是开发其模型的目的之一。


不止是以视频创作为代表的文化行业,像机器人、自动驾驶、建筑行业等,世界模型的开发都具有相当重要的意义。如果世界大模型能够得到进一步开发,对于现实中的诸多行业将带来颠覆性的变化。届时,我们将亲身体会到AI给社会运行带来的巨大变革。

点赞(0)

评论列表 共有 0 条评论

暂无评论

微信小程序

微信扫一扫体验

立即
投稿

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部