華為推出全球最快AI訓練集群Atlas 900 可廣泛應用于科學研究與商業創新

2019-09-18 14:29:10

來源：環球網 | 作者：佚名 | 字號：A+ ｜ A-

9月18日，華為全聯接2019(HUAWEI CONNECT)大會上，華為副董事長胡厚崑發布了Atlas 900 AI訓練集群，以超強算力帶給企業人工智能業務的極致體驗。世界正從數字化向智能化轉型，人工智能產業作為關鍵驅動力，面臨自身的升級進化的挑戰。華為在超強人工智能算力和大規模分布式AI訓練集群兩個方面加速智能化世界的轉型。

Atlas 900 AI訓練集群介紹

在大型數據集上進行訓練的神經網絡架構涵蓋從圖像識別、自然語言處理、視頻實時分析和智能推薦系統等各個方面，訓練這些神經網絡模型需要大量浮點計算能力。近年來單個AI處理器算力和訓練方法上均取得了重大進步，但是在單一機器上，AI訓練所需要的時間仍然長得不切實際，因此需要借助大規模分布式AI集群環境來提升神經網絡訓練系統的浮點計算能力。

此次發布的Atlas 900 AI訓練集群由數千顆昇騰910 AI處理器互聯構成，是當前全球最快的AI訓練集群，代表了當今全球的算力巔峰。其總算力達到256P~1024P FLOPS @FP16，相當于50萬臺PC的計算能力。

Atlas 900 AI訓練集群領先技術優勢

AI算力業界領先

Atlas 900 AI訓練集群采用業界單芯片算力最強的昇騰910 AI處理器，每顆昇騰910 AI處理器內置32個達芬奇AI Core，單芯片提供比業界高一倍的算力(256TFLOPS@FP16)。Atlas 900 AI訓練集群將數千顆昇騰910 AI處理器互聯，打造業界第一的算力集群。

昇騰910 AI處理器采用SoC設計，集成“AI算力、通用算力、高速大帶寬I/O”，大幅度卸載Host CPU的數據預處理任務，充分提升訓練效率。

最佳集群網絡

Atlas 900 AI訓練集群采用“HCCS、 PCIe 4.0、100G以太”三類高速互聯方式，百TB全互聯無阻塞專屬參數同步網絡，降低網絡時延，梯度同步時延縮短10~70%。

在AI服務器內部，昇騰910 AI處理器之間通過HCCS高速總線互聯;昇騰910 AI處理器和CPU之間以最新的PCIe 4.0(速率16Gb/s)技術互聯，其速率是業界主流采用的PCIe 3.0(8.0Gb/s)技術的兩倍，使得數據傳輸更加快速和高效。在集群層面，采用面向數據中心的CloudEngine 8800系列交換機，提供單端口100Gbps的交換速率，將集群內的所有AI服務器接入高速交換網絡。

獨創iLossless智能無損交換算法，對集群內的網絡流量進行實時的學習訓練，實現網絡0丟包與E2E μs級時延。

系統級調優

Atlas 900 AI訓練集群通過華為集合通信庫和作業調度平臺，整合HCCS、 PCIe 4.0和100G RoCE三種高速接口，充分釋放昇騰910 AI處理器的強大性能。

華為集合通信庫提供訓練網絡所需的分布式并行庫，通信庫+網絡拓撲+訓練算法進行系統級調優，實現集群線性度>80%，極大提升了作業調度效率。

極致散熱系統

傳統數據中心多以風冷技術對設備進行散熱，但在人工智能時代傳統數據中心卻面臨非常大的挑戰。高功耗器件比如CPU和AI芯片帶來更大的熱島效應要求更高效的冷卻方式。液冷技術可以滿足數據中心高功率、高密部署、低PUE的超高需求。

Atlas 900 AI訓練集群采用全液冷方案，創新性設計業界最強柜級密閉絕熱技術，支撐>95%液冷占比。單機柜支持高達50kW超高散熱功耗，實現PUE

另外，在空間節省方面，與8kW風冷機柜相比，節省機房空間79%。極致的液冷散熱技術滿足了高功率、高密設備部署、低PUE的需求，極大地降低了客戶的TCO。

Atlas 900AI訓練集群領先的Benchmark指標

華為已在華為云上部署了一個Atlas 900 AI訓練集群，集群規模為1024顆昇騰910 AI處理器。基于當前最典型的ResNet-50 v1.5模型”和“ ImageNet-1k數據集”，Atlas 900AI訓練集群只需59.8秒就可完成訓練，排名全球第一。

“ ImageNet-1k數據集”包含128萬張圖片，精度為75.9%，在同等精度下，其他兩家業界主流廠家測試成績分別是70.2s和76.8s，Atlas 900 AI訓練集群比第2名快15%。

Atlas 900 AI集群適用場景

Atlas 900 AI集群主要為大型數據集神經網絡訓練提供超強算力，可廣泛應用于科學研究與商業創新，讓研究人員更快地進行圖像、視頻和語音等AI模型訓練，讓人類更高效地探索宇宙奧秘、預測天氣、勘探石油和加速自動駕駛的商用進程。

Atlas 900 AI集群也可以提供云服務，以云的方式提供充裕的、經濟的算力資源，簡單易用、高效率、全流程的AI平臺，為客戶帶來極致體驗的“易獲取、用得起、方便用”的普惠AI算力。

責任編輯：徐孟睿

国产精品第一区第27页,美女在线不卡,亚洲成a人在线观看,亚洲欧洲日产国码一级毛片,日韩a一级欧美一级在线播放,日日摸夜夜添夜夜添人人爽

華為推出全球最快AI訓練集群Atlas 900 可廣泛應用于科學研究與商業創新