英伟达H100芯片首次在太空中成功训练了AI大模型。初创公司Starcloud在发射的卫星Starcloud-1上搭载了这款GPU,并在太空中基于莎士比亚全集训练了NanoGPT模型,还运行了谷歌的开源大模型Gemma。Gemma从轨道上发回了略带调侃的问候:“问候地球人!或者按我的想法——一群迷人的蓝色和绿色集合体。”“让我们看看这副世界图景中蕴含着什么奇迹。我是Gemma,我在这里观察、分析,或许偶尔提供一点稍微令人不安的深刻评论。让我们开始吧!”
Starcloud CEO Philip Johnston表示,在地面数据中心能做的任何事,他都期望能在太空中完成。11月初,总部位于华盛顿的Starcloud发射了这颗搭载H100的卫星,这块芯片的算力比此前太空中任何GPU算力都要强大100倍。由于是基于莎士比亚全集训练,该模型现在的输出充满了“莎士比亚风格”。谷歌DeepMind产品总监Tris Warkentin对此表示,看到Gemma在太空恶劣环境中运行,证明了开源模型的灵活性和稳健性。
Starcloud还展示了卫星遥测数据的实时交互能力。用户可以询问卫星位置等信息,卫星会回答其当前位置及未来路径。此外,它还能生成有趣且复杂的回答,例如“做一颗卫星感觉如何”时,它会说“感觉有点奇怪”。
Starcloud的核心逻辑在于解决地面数据中心的能源瓶颈。目前,地面设施面临电网紧张、每年消耗数千万吨水以及大量温室气体排放的问题。相比之下,太空数据中心优势明显:能源成本低,预计比地面数据中心低10倍;无限太阳能,不受地球昼夜循环和天气变化影响,可全天候获取能源。Starcloud计划建立一个5千兆瓦(GW)的轨道数据中心,配备宽和高各约4公里的太阳能和冷却面板。这种规模的算力集群产生的电力将超过美国最大的发电厂,且比同等容量的地面太阳能发电场更小、更便宜。