据报道,埃隆·马斯克的人工智能初创公司xAI已加强其开发被称为"世界模型"的下一代人工智能系统的努力。
这些先进系统旨在帮助人工智能理解、设计并与物理环境互动,这是对现有大型语言模型(如OpenAI的ChatGPT和xAI自己的聊天机器人Grok)能力的重大飞跃。
据知情人士透露,xAI已招募了两位顶尖的英伟达研究员,Zeeshan Patel和Ethan He,他们在使用视频和机器人数据训练人工智能系统方面拥有丰富经验。他们的专业知识与马斯克创建不仅能处理文本,还能实时感知和响应现实世界的人工智能的雄心相符。
这一新方向使xAI直接与科技巨头如OpenAI和谷歌DeepMind展开竞争,这些公司也在探索人工智能如何从3D环境和多模态数据中学习,将文本、图像、视频和物理模拟整合成连贯的理解。
世界模型一词指的是模拟物理世界以预测行动如何展开的人工智能系统,这是机器人技术、自动驾驶汽车和能够驾驭现实的智能代理的基本基础。
Patel和He之前工作的英伟达,凭借其Omniverse和Isaac Sim平台一直处于该领域的前沿,这些模拟工具用于在数字环境中训练和测试机器人。通过借鉴英伟达的模拟技术,xAI希望在虚拟空间中复制现实世界学习的复杂性,可能加速机器人技术和实时人工智能系统的发展。
与这一愿景一致,xAI已组建了所谓的"Omni团队",这是一个专门研究能处理和生成图像、视频和音频格式内容的人工智能模型的专业单位。此举表明马斯克希望构建能看、能听、能行动的人工智能系统,弥合数字智能与现实世界能力之间的差距。
尽管有着大胆的抱负,xAI面临着重大障碍。最大的挑战之一是计算能力,即训练大规模模型所需的原始硬件能力。
据报道,该公司因对时间安排和能源供应存在分歧,终止了与甲骨文就一项价值100亿美元的云基础设施交易的讨论。相反,xAI现在正在使用英伟达H100 GPU构建自己的人工智能计算集群,这些芯片也是当今大多数最先进人工智能系统的动力来源。
然而,与行业领导者相比,xAI的计算资源仍然有限。OpenAI已表示,到今年年底将有超过一百万个GPU上线,而ByteDance等其他公司也在积极扩展其GPU集群,用于类似的大规模人工智能训练。对于xAI来说,赶上不仅需要人才,还需要大规模的基础设施投资。
文章《xAI招募英伟达工程师开发下一代'世界模型'平台》首次发表于CoinCentral。