- InfiniBand의 오랜 지배력은 이더넷의 개방형 표준 움직임으로 인한 실질적인 압박에 직면해 있습니다.
- Meta와 Nvidia는 AI 네트워크 확장을 위한 개방성에 베팅하고 있습니다.
- ESUN 프로젝트는 공유된 네트워킹 야망을 통해 업계 경쟁업체를 연결합니다.
OCP(Open Compute Project)는 인공 지능 클러스터 간 고성능 연결을 위한 개방형 표준 개발을 목표로 하는 ESUN(Ethernet for Scale-Up Networking)이라는 새로운 이니셔티브를 발표했습니다.
이 협력을 통해 Meta, Nvidia, AMD, Cisco 및 OpenAI와 같은 회사가 모여 이더넷이 대규모 데이터 센터에서 InfiniBand와 같은 기존 상호 연결과 경쟁할 수 있는 방법을 모색합니다.
협업에 참여하는 다른 회사로는 Arista, ARM, Broadcom, HPE Networking, Marvell, Microsoft 및 Oracle이 있습니다.
AI 클러스터를 위한 개방형 네트워킹
인피니밴드는 오랫동안 GPU와 가속기를 연결하는 인프라의 약 80%를 차지하며 고속 AI 네트워킹 시장을 장악해 왔다.
그러나 ESUN 그룹은 이더넷의 성숙도, 비용 효율성 및 상호 운용성으로 인해 이더넷이 AI 클러스터 확장을 위한 강력한 후보가 된다고 믿습니다.
독점 시스템과 달리 엔지니어들 사이에서 이더넷을 광범위하게 채택하면 대규모 AI 워크로드를 관리하는 데 따른 복잡성을 줄이는 데 도움이 될 수 있습니다.
지지자들은 이더넷을 개방형 표준으로 사용하면 운영자가 비용을 절감하면서 인프라를 확장할 수 있다고 주장합니다.
OCP의 새로운 AI 도구 이니셔티브는 다중 프로세서 시스템을 위한 이더넷 전송을 탐색하는 SUE-T(SUE-Transport) 프로그램의 이전 작업을 기반으로 합니다.
ESUN 참가자들은 정기적으로 만나 프로토콜 헤더, 오류 처리, 무손실 데이터 전송 등 스위치 동작에 대한 표준을 정의합니다.
또한 그룹은 네트워크 설계가 GPU 기반 시스템 내에서 로드 밸런싱 및 메모리 순서에 어떤 영향을 미치는지 연구합니다.
Ultra Ethernet Consortium 및 IEEE 802.3 표준 기관을 통해 더 큰 이더넷 생태계 전반에 걸쳐 조정을 보장할 계획입니다.
몇몇 회사는 이미 AI 확장을 목표로 이더넷 기반 제품을 개발했습니다. 예를 들어 Broadcom의 Tomahawk Ultra 스위치는 초당 최대 770억 개의 패킷을 지원하며 Nvidia의 Spectrum-X 플랫폼은 AI 클러스터용 가속 하드웨어와 이더넷을 결합합니다.
그러나 2011년 OCP를 공동 창립한 Meta는 ESUN을 데이터 센터 내 개방형 하드웨어 추진의 자연스러운 확장으로 보고 있습니다.
그럼에도 불구하고, 관찰자들은 확립된 InfiniBand 네트워크를 대체하려면 이더넷이 대기 시간과 안정성이 중요한 가장 까다로운 AI 워크로드에서 그 자체를 입증해야 한다고 지적합니다.
ESUN의 성공은 개방성과 성능의 균형에 달려 있습니다. 옹호자들은 AI 시스템이 표준화된 이더넷 기술을 사용하여 상호 운용 가능한 하드웨어에서 실행되는 미래를 봅니다.
그러나 AI 인프라의 규모와 민감도를 고려할 때 업계의 추진력이 독점 상호 연결에서 결정적으로 멀어질지는 여전히 불확실합니다.
현재 ESUN은 야심찬 노력을 대표하며 InfiniBand의 성능과 일치할 수 있을지는 지켜봐야 합니다.
Google 뉴스에서 TechRadar 팔로우 그리고 우리를 선호 소스로 추가하세요 귀하의 피드에서 전문가로부터 뉴스, 리뷰, 의견을 받아보세요. 팔로우 버튼을 꼭 눌러주시는 것 잊지 마세요!
그리고 물론 당신은 할 수 있습니다 TikTok에서 TechRadar 팔로우 뉴스, 리뷰, 언박싱, 동영상 등의 형태로 정기적인 업데이트를 받아보세요. 왓츠앱 매우