- Huawei는 UB-MASH를 원한다. 대형 AI 클러스터에서 상호 연결 표준을 통합
- ub-mash 설계는 확장 성을 위해 다차원 랙 레벨 메쉬와 폐쇄 백본을 혼합합니다.
- 전통적인 상호 연결은 대규모 스케일 배포에서 매우 비쌉니다
Huawei는 UB-Mash Interconnect를 개설 할 계획을 발표했습니다.이 시스템은 AI 데이터 센터에서 시스템, 메모리 및 네트워킹 장비가 많은 수의 통신 방식을 통합하는 시스템입니다.
UB-Mash 설계는 각 랙 내부에 다차원 메쉬가있는 데이터 홀 레벨에 가까운 기반 백본을 부착합니다.
Huawei는 이러한 토폴로지를 결합함으로써 수천 개의 시스템 노드에 규모가 있어도 비용을 제어 할 수 있다고 주장합니다. 또한 지연 및 하드웨어 고장이 막히는 AI 워크로드로의 스케일링 문제를 해결하기를 희망합니다.
프레임 워크에서 조각 된 표준을 대체함으로써
이 단계는 다중 중첩 표준을 단일 프레임 워크로 대체하는 방법으로 소개되어 스케일 컴퓨팅 인프라가 얼마나 큰 대형 컴퓨팅 인프라가 만들어지고 운영되는지 재구성 할 수 있습니다.
간단히 말해, 화웨이는 오늘날의 다양한 연결 규칙의 조합을 보편적 시스템으로 대체하려고하므로 모든 것이 더 쉽고 저렴하게 결합됩니다.
Hang Liao는 Huawei의 수석 과학자 인 Hang Liao는“다음 달에 회의가 있으며 UB-Mash 프로토콜이 출판 될 것이며 누군가가 무료 라이센스처럼 선언 될 것이라고 발표 할 예정이다.
“이것은 매우 새로운 기술입니다. 우리는 다른 캠프의 경쟁 표준화 노력을 찾고 있습니다.
UB-MASH의 중심 논쟁 중 하나는 전통적인 상호 연결이 규모에서 매우 비싸서 결국 연결에 가속보다 더 많은 비용이 들었다는 것입니다.
화웨이는 자체 성능을 지적하며, 여기서 8,192- 노드 배포는 비용이 선형 적으로 증가 할 필요가 없다는 증거로 사용되었습니다.
이것은 클라우드 스토리지 운영에 사용되는 최대 SSD 시스템과 같은 수백만 개의 프로세서, 고속 네트워킹 장치 및 대형 스토리지 어레이로 만든 AI 시스템의 미래에 필수적으로 설계되었습니다.
UB-Mash는 Huawei ‘s Supernode라는 광범위한 아이디어의 일부입니다. 이 데이터는 CPU, GPU, 메모리, SSD 장치 및 스위치가 모두 단일 시스템에서 작동 할 수있는 중앙 규모 클러스터를 나타냅니다.
이 개념은 대역폭의 하나의 대역폭 청구와 미묘한 모음이 증거로 위치 할 수있을뿐만 아니라 다음 급여 생성을 계산할 수 있습니다.
그러나 PCI, Nvilink, Uulink 및 Ultra Ethernet과 같은 표준은 이미 반도체 및 네트워킹 산업 분야의 여러 회사에서 이미 지원됩니다.
이제 문제는 업계가 새로운 Huawei-Becked 프로토콜을 수락 할 것인지 또는 광범위한 회사를 통해 이미 지원되는 표준을 계속 선호 할 것인지 여부입니다.
Huawei의 제안은 야심이 많음에도 불구하고 고객을 공급 업체의 강력하고 통제 된 프로토콜의 위치에 두었습니다.
오픈 소스 라이센스를 사용하더라도 장기 효율성, 정권 및 지리적 정치적 위험에 대한 우려가 있습니다.
그는 화웨이의 기술이 잠재적으로 지배적으로 보이지만, 그 단계는 아직 보호되지 않은 업계의 광범위한 신뢰와 채택을 취하는 것입니다.
Toms 하드웨어에 의해