top of page
CI.Seoa News.png

《 Meta 》為 AI 時代重新構想我們的基礎設施


隨著我們在人工智慧研究方面開闢新天地,在我們的應用程式系列中提供更多尖端的人工智慧應用程序和體驗,並建立我們對元宇宙的長期願景,我們的人工智慧 (AI) 計算需求將在未來十年內急劇增長。


我們正在執行一項雄心勃勃的計劃,以構建下一代 Meta 的 AI 基礎設施,今天,我們將分享一些有關我們進展的細節。


這包括我們第一個用於運行 AI 模型的定製矽晶片,一個新的 AI 優化數據中心設計以及用於 AI 研究的 16,000 GPU 超級計算機的第二階段。這些努力 —— 以及仍在進行中的其他專案 —— 將使我們能夠開發更大、更複雜的人工智慧模型,然後有效地大規模部署它們。人工智慧已經成為我們產品的核心,可以實現更好的個人化、更安全、更公平的產品以及更豐富的體驗,同時也幫助企業接觸到他們最關心的受眾。

我們甚至通過部署 CodeCompose 來重新構想我們的編碼方式,CodeCompose 是我們開發的基於 AI 的生成編碼助手,旨在提高開發人員在整個軟體開發生命週期中的工作效率。


通過重新思考我們如何在基礎設施中進行創新,我們正在創建一個可擴展的基礎,為生成式人工智慧和元宇宙等領域的新興機遇提供動力。


人工智慧是我們基礎設施的核心


自 2010 年我們的第一個數據中心破土動工以來,我們已經建立了一個全球基礎設施,目前為每天使用我們應用程式系列的 2015 多億人提供了引擎。多年來,人工智慧一直是這些系統的重要組成部分,從 Big Sur 硬體到 PyTorch 的開發,再到我們用於人工智慧研究的超級電腦。


現在,我們正在以令人興奮的新方式推進我們的基礎設施:


  • MTIA(元訓練和推理加速器):這是我們針對推理工作負載的內部定製加速器晶元系列。 MTIA 提供比 CPU 更高的計算能力和效率,並且它是針對我們的內部工作負載定製的。通過同時部署 MTIA 晶片和 GPU,我們將為每個工作負載提供更好的性能、更低的延遲和更高的效率。


  • 下一代數據中心:我們的下一代數據中心設計將支持我們當前的產品,同時支持未來幾代人工智慧硬體進行訓練和推理。這個新的數據中心將採用 AI 優化設計,支援液冷 AI 硬體和高性能 AI 網路,將數千個 AI 晶元連接在一起,用於數據中心規模的 AI 培訓集群。它的構建速度也更快、更具成本效益,並將補充其他新硬體,例如我們第一個內部開發的 ASIC 解決方案 MSVP,該解決方案旨在為 Meta 不斷增長的影片工作負載提供支援。


  • 研究超級集群 (RSC) AI 超級計算機:我們認為 Meta 的 RSC 是世界上 最快的 AI 超級電腦之一,旨在訓練下一代大型 AI 模型,為新的增強現實工具、內容理解系統、實時翻譯技術等提供動力。它具有 16,000 個 GPU,可通過 3 級 Clos 網路結構訪問,為 2,000 個訓練系統中的每一個提供全頻寬。

端到端集成堆疊的優勢


定製設計我們的大部分基礎設施使我們能夠優化從物理層到虛擬層到軟體層再到實際用戶體驗的端到端體驗。


我們設計、構建和運營一切 —— 從數據中心到伺服器硬體,再到保持一切運行的機械系統。因為我們從上到下控制堆疊,所以我們能夠根據我們的特定需求對其進行自定義。例如,如果 GPU,CPU,網路和存儲可以更好地支持我們的工作負載,我們可以輕鬆地並置。如果這意味著我們需要不同的電源或冷卻解決方案,我們可以將這些設計重新考慮為一個有凝聚力的系統的一部分。


這在未來幾年將變得越來越重要。在接下來的十年中,我們將看到晶元設計、專用和特定於工作負載的人工智慧基礎設施、大規模部署的新系統和工具以及產品和設計支援效率的提高方面的專業化和定製程度不斷提高。所有這些都將提供基於最新研究的越來越複雜的模型,以及使世界各地的人們能夠獲得這項新興技術的產品。


我們始終專注於提供長期價值和影響,以指導我們的基礎設施願景。我們相信,我們在建設世界級基礎設施方面的記錄使我們能夠在未來十年及以後繼續引領人工智慧領域。



以上內容來自 [ Meta Newsroom ] about.fb.com/news/2023/05/metas-infrastructure-for-ai

科技新聞類別 News category

科技新聞影音 News Video

​科技新聞類別  News Category

搜尋新聞 Search News

科技新聞類別 News category

bottom of page