31
2023
03

【浙商·蒋高振】算力产业链·互联方案:GPU卡间互联→PCIe/NVlink,服务器互联→IB/以太网!


【浙商·蒋高振】算力产业链·互联方案:GPU卡间互联→PCIe/NVlink,服务器互联→IB/以太网!


♻︎潜在受益:

裕太微——千兆以太网卡芯片

澜起科技——PCIe Retimer芯片


?数据互联:随着模型复杂程度增加,单张GPU无法完成训练任务,需要联合多张GPU,乃至多台服务器搭建集群协同工作,并需要GPU之间以及服务器之间进行数据传输交互。由于大模型数据量极大,在机器学习训练过程中,数据传输速度成为制约训练速度提升的瓶颈。在传统的方案中,GPU互联通常采用PCIe,服务器之间互联采用以太网Ethernet。


?英伟达:为了实现极限的超高计算密度,英伟达推出的DGX工作站采用NVLink技术代替传统的PCIe技术,可提供能够实现出色深度学习所需的通信性能。相较采用PCIe, NVLink技术带宽增加5倍。除能够实现GPU间高速内部通信的NVLink技术外,DGX还采用了InfiniBand代替Ethernet,为系统和系统间通信提供更大带宽,减少数据传输延迟造成的瓶颈。


?国内视角:

服务器互联——裕太微电子推出千兆以太网卡芯片(NIC),该芯片可通过PCIE接口与电脑交互数据流,调整为适配数据包后,通过以太网物理层接口发送或接收来自其他服务器的数据。

GPU互联——澜起科技PCIe Retimer芯片,采用先进信号调理技术来补偿信道损耗并消除各种抖动源影响,从而提升信号完整性,增加高速信号的有效传输距离,为服务器、存储设备及硬件加速器等应用场景提供可扩展的高性能PCIe互连解决方案。

上一篇 » 下一篇 »