您所在的位置:首页 - 手机 - 正文手机

「大算投」全球最大超算中心开始运转,马斯克的野心显露

admin admin 09-16 【手机】 765人已围观

摘要马斯克的最终目标是在今年12月前训练出“按每项指标衡量都是世界上最强大的人工智能”——Grok3。对于AI聊天机器人Grok的新版本Grok3而言,需要使用10万块英伟达H100AI芯片进行训练,这将使Grok3“非常特别”。H100芯片专为处理大型语言模型设计,单价约3万~4万美元,这意味着仅芯片成本就高达30亿至40亿美元。马斯克对Grok3的巨额投资显示了其对AI技术潜力的坚定信念,预示着AI领域可能即将迎来重大突破。超级计算集群:xAI的AI加速器马斯克领导的xAI在孟菲斯启动了“Sup

马斯克的最终目标是在今年12月前训练出“按每项指标衡量都是世界上最强大的人工智能”——Grok3。

对于AI聊天机器人Grok的新版本Grok3而言,需要使用10万块英伟达H100AI芯片进行训练,这将使Grok3“非常特别”。H100芯片专为处理大型语言模型设计,单价约3万~4万美元,这意味着仅芯片成本就高达30亿至40亿美元。

马斯克对Grok3的巨额投资显示了其对AI技术潜力的坚定信念,预示着AI领域可能即将迎来重大突破。

超级计算集群:xAI的AI加速器马斯克领导的xAI在孟菲斯启动了“Supercluster”,全球最大的超级AI训练中心,配备10万个NvidiaH100GPU,超越OpenAI的规模。

在美国田纳西州的孟菲斯,一个具有里程碑意义的事件已经发生——全球最大的超级计算中心“Supercluster”在7月22日正式启动。这一宏伟项目由埃隆·马斯克领导的xAI公司负责。

马斯克在社交平台“X”上兴奋地宣布了Supercluster的运行消息:

强调xAI已经开始利用这个由10万个液冷NvidiaH100GPU组成的超级计算集群进行AI训练。这个集群建立在单一的RDMA结构之上,被马斯克誉为“世界上最强大的AI训练集群”。

与OpenAI训练GPT4所使用的25000块A100GPU相比,Supercluster的规模是其20倍。

马斯克自信地表示,Supercluster将深度参与并加速培育出世界上最强大的人工智能。

在GPU规模上,Supercluster超越了Top500榜单上所有的超级计算机,包括配备37888个AMDGPU的Frontier、60000个IntelGPU的Aurora,以及14400个NvidiaH100GPU的MicrosoftEagle。

这一成就标志着xAI在规模和训练效率上成为全球AI训练的领头羊。

xAI的创始成员TobyPhln回忆道,公司成立之初便旨在实现数据、人才和计算三大优势。如今,随着Supercluster的加入,这些优势已经集齐。马斯克也对这一成就感到自豪,并在社交媒体上分享了这一消息。

原计划于2025年秋季启动的Supercluster,xAI提前一年达成了目标。据大孟菲斯商会主席TedTownsend透露,马斯克在一周内就决定在孟菲斯建设xAI的新超级计算机,看中了该地区充足的电力供应和快速的建设能力。

尽管项目被称为“巨人项目”(ProjectColossus),寓意着其巨大的潜力和影响力,但它的进展并非没有挑战。

一些孟菲斯市议会的议员对项目的秘密性质和对水电需求表示担忧,并敦促暂停投资。此外,xAI在孟菲斯的超级计算机项目还涉及税收减免和其他商业激励措施的讨论,尽管具体细节尚未确定。

尽管面临争议,马斯克的人工智能愿景仍在迅速推进。

尽管xAI在模型参数上可能不是最大的,但马斯克相信,xAI的核心竞争力在于其快速发展速度。

AI能耗挑战:电力与水资源的重负xAI孟菲斯工厂耗电巨大,每日需大量水资源冷却。尽管承诺提升当地基础设施,但对马斯克的履行能力存在疑虑。

随着人工智能技术的飞速发展,它对欧美国家电力系统的影响日益显著。国际能源署的统计数据显示,单个ChatGPT查询耗费的电力高达2.9瓦时,远远超出了谷歌搜索的0.3瓦时。

高盛的研究报告预计,在2023年至2030年这七年时间里,全球由人工智能驱动的数据中心的电力消耗将激增,每年将增加约200太瓦时的电量;到了2028年,人工智能在数据中心的电力需求中所占比例可能接近五分之一。

在具体实例中,xAI公司位于孟菲斯的工厂,其电力消耗量巨大,每小时可能达到150兆瓦,这相当于为10万个家庭提供电力所需的电量。

此外,为了维持数据中心的适宜温度,该工厂每天至少需要100万加仑的水用于冷却。这样的能源和资源需求,无疑给当地社区带来了前所未有的压力。

为了缓解这种压力并推动项目顺利进行,xAI公司已经向孟菲斯市承诺,将投资改善当地的公共基础设施,特别是建设一个新的变电站和污水处理设施,以支持数据中心的运营和发展。

尽管如此,一些当地居民和市议会成员对这些承诺持怀疑态度,因为马斯克在其他地区的一些基础设施项目并未完全兑现。

同时,xAI公司也面临着人才流失的问题。例如,从OpenAI公司高薪挖角来的KyleKosic,在今年4月选择离开xAI,重新回到了OpenAI。

尽管遭遇了种种挑战和争议,马斯克对于人工智能的宏伟蓝图并未放慢脚步,他的AI梦想持续以迅猛的速度向前发展。

融资与合作:xAI的资本与技术布局xAI宣布完成60亿美元B轮融资,为其AI发展提供动力。Grok-2模型利用甲骨文的2.4万个NvidiaH100芯片训练,即将发布。

在5月26日的一次公告中,xAI公司自豪地宣布已经成功完成了60亿美元的B轮融资,这一成就标志着公司在人工智能领域的进一步深入发展。

埃隆·马斯克还透露了关于xAI的Grok-2模型的最新进展,该模型正利用来自甲骨文公司的2.4万个NvidiaH100芯片进行密集训练,并有望在下个月发布。

此外,xAI此前已经成为甲骨文H100芯片的最大租赁客户,租赁数量约为1.6万颗。

6月19日,马斯克在社交平台上宣布,戴尔正在负责组装xAI超级计算机的一半机架,而另一半则由日本的SMC公司负责。

到了7月9日,xAI与甲骨文就扩大现有协议、增加芯片租赁的谈判已经结束。

甲骨文曾于去年9月表示愿意为xAI提供云基础设施支持AI模型训练,尽管合同的具体价值和期限未曾公开。

据5月的报道,两家公司接近达成一项价值约100亿美元的多年期云服务器租赁协议。

马斯克进一步透露,xAI已经将10万个H100GPU投入到Grok3模型的训练中,并计划在年底前完成这一训练任务。

xAI已经陆续发布了包括Grok-1和Grok-1.5在内的多个版本的AI模型,其中Grok-1.5模型具备了处理长上下文的能力,而Grok-1.5V模型则新增了图像理解功能。

公司计划在8月推出Grok2,并在12月之前推出马斯克所描述的“按每项指标衡量都是世界上最强大的人工智能”——Grok3。

尽管xAI相较于行业内其他公司起步较晚,且在模型参数上并不占优势,但马斯克坚信,xAI的核心竞争力在于其快速发展速度,「大算投」全球最大超算中心开始运转,马斯克的野心显露他强调:“我们的根本竞争力在于比其他任何人工智能公司都要快。

Tags: 「大算投」全球最大超算中心开始运转马斯克的野心显露

icp沪ICP备2023034384号-20 icp粤公网安备 44030902003287号
取消
微信二维码
支付宝二维码

目录[+]