科技改变生活 · 科技引领未来
五年前,Nvidia着手设计一种超级计算机级系统,该系统功能强大,足以训练和运行自己的AI模型,例如自动驾驶汽车模型,但又足够灵活,几乎可以服务于任何深度学习研究人员。在构建了DGX Pods的多个迭代之后,Nvidia汲取了有关构建具有模块化,可扩展单元的系统的宝贵经验。然后,大流行病爆发了。
该COVID-19的爆发带来了新的挑战Nvidia的,因为它的目标是构建塞勒涅,第四代其DGX SuperPODs的。减少的人员和建筑限制使这项任务变得复杂,但是Nvidia在短短三个半星期内就从数据中心的裸机架过渡到了完整的操作系统。
领导Nvidia系统团队的首席架构师Michael Houston对记者说:“最初的重点是非常非常快地进行部署,以便我们能够不断吸引研究人员。” “英伟达是我们机器的第一个客户-因此我们会证明一切,并确保机器以及我们如何指定吊舱架构是坚如磐石。”
陈楠华