本站真誠介紹香港這個「東方之珠」和「亞洲國際都會」

亞洲國際都會 asiasworldcity

IBM用最新芯片,打造了一箇大型機

(本文内容不代表本站观点。)
香港飛龍 Hong Kong HK Dragon
香港飛龍.online 官方授權發布的第4代「香港飛龍」標誌

本文内容:

如果您希望可以時常見面,歡迎標星收藏哦~來源:內容編譯自theregister,謝謝。IBM的最新大型機以平臺傳統的關鍵任務工作負載的安全性和可靠性屬性爲基礎,添加了AI來支持大型語言模型(LLM)、助手和代理。z17系列引入了改進的TelumII處理器和SpyreAI加速器卡,這兩者都是在去年帕洛阿爾託舉行的HotChips會議上討論過的,據稱其AI性能比z16提高了7.5倍。IBM聲稱,雖然TelumII提供了改進的AI推理來針對交易運行欺詐檢測檢查(就像z16中引入的那樣),但Spyre卡提供了一種擴展AI處理的方法,以支持生成AI和LLM,並使用多種模型來提高準確性並減少誤報。IBM院士兼IBMZ架構師ElpidaTzortzatos在談到藍色巨人爲這款最新大型計算機開發的硬件增強功能時表示:“如果將數據視爲新的燃料,那麼基礎設施就是推動企業AI之旅走向成功的引擎。”該公司表示,他們花了很多時間與客戶討論他們希望在大型機中看到什麼,這爲z17的開發提供了參考。客戶顯然告訴他們要更新他們的應用程序並使大型機更加人工智能驅動。但這並不是像其他一些公司那樣,將生成式人工智能簡單地投入到其中。藍色巨人聲稱已經仔細考慮過這個問題。Tzortzatos表示:“GenAI對我們的客戶來說非常重要,但也不是唯一的AI工具。儘管最近有很多關於GenAI的討論,但預測性AI仍將在企業中發揮關鍵作用。”“我們將繼續非常非常好地服務於這些用例,但GenAI爲新的用例打開了大門,例如擁有助手並能夠總結文檔,能夠爲開發人員提供支持,讓副駕駛能夠自動完成代碼等等。”這些助手包括該公司的watsonxCodeAssistantforZ和watsonxAssistantforZ等。Tzortzatos聲稱,該公司看到的一箇新趨勢是將預測人工智能的優勢與大型語言和代碼模型的優勢結合起來,以提取新特徵或新見解,並從這些人工智能模型中獲得更好、更準確的結果。她舉了一箇保險的例子,保險公司從DB2數據庫中提取與索賠相關的結構化信息,然後從非結構化文本中提取關鍵見解(例如索賠原因或索賠緊急程度),並將其輸入預測AI模型以獲得更好、更準確的結果。根據HotChips的詳細介紹,z17中的TelumII處理器與上一代一樣是八核芯片,但運行速度更高,爲5.5GHz。TelumII的緩存大小也增加了40%,並增加了另一項新功能——片上IO加速器或數據處理單元(DPU),旨在卸載SpyreAIAccelerator卡在處理較新的AI模型時需要處理的大量數據。Tzortzatos解釋說:“當談到大型語言模型和GenAI時,我們看到模型複雜性和模型尺寸增加了超過一百倍,這對AI計算提出了更高的要求。”這些SpyreAI加速器卡可插入PCIe插槽,每個卡最多有32個核心,據說與TelumII芯片本身的AI加速器架構類似。IBM表示,z17可以在單個系統中擁有最多48張卡。藍色巨人還在準備z/OS3.2,這是其爲IBMZ系統開發的下一個主要操作系統版本,計劃於今年第三季度發佈。這將爲整個系統提供對硬件加速AI功能的支持,並使用運營AI實現系統管理功能。IBM表示,新平臺將增加對現代數據訪問方法、NoSQL數據庫和混合雲數據處理的支持,以使AI能夠利用更廣泛的企業數據來應用預測性業務洞察。IBM推出新款大型機正值這種高價位產品的艱難時期,特朗普政府的國際貿易政策動搖了商業信心。傳統上,隨着舊系統客戶升級,新大型機的推出將爲藍色巨人帶來收入激增,但今年的銷售可能會很困難。然而,Gartner基礎設施和運營集團執行副總裁MikeChuba表示,公司已經充分瞭解客戶的需求。Chuba向TheRegister表示:“如果你回顧一下最近幾代大型機的發佈會,並繼續回顧這一代,你會發現,IBM在涉及大型大型機客戶的研發過程中投入了更多時間。”“IBM的研發工作現在專注於新硬件如何直接解決客戶面臨的挑戰。他們在z16上引入的專用加速器和這一代的渦輪增壓版2直接解決了交易時欺詐檢測等挑戰,從而專注於人工智能。”IBM的的新芯片去年,IBM爲其著名的大型機系統推出了一款更強大的處理器,承諾增強用於推理的片上AI加速,並集成數據處理單元(DPU)以增強IO處理能力。IBM還爲其提供了一箇單獨的AI加速器,旨在支持更大規模的推理。據藍色巨人稱,TelumII處理器在帕洛阿爾託舉行的HotChips2024大會上發佈,預計將爲大型機帶來顯著的性能提升。該公司還預覽了SpyreAIAccelerator,並表示預計這兩款芯片將於2025年上半年與下一代IBMZ系統一起推出。如果IBM的說法可信的話,那麼全球大約70%的交易都是通過其大型機進行的,而IBM表示,它在HotChips上展示的開發成果將使其能夠將生成性AI引入這些關鍵任務工作負載。TelumII和其前代產品一樣,是一款八核芯片,但在新芯片中,這些芯片的時鐘速度更高,爲5.5GHz。有十個36MB二級緩存;每個內核一箇,DPU一箇,第十個作爲整體芯片緩存。IBM表示,隨着虛擬L3和虛擬L4分別增長到360MB和2.88GB,這意味着緩存大小增加了40%。首款Telum處理器於2022年推出時爲z16帶來了內置AI推理功能。它能夠在處理金融交易時對其進行實時欺詐檢測檢查。藍色巨人表示,它已顯著增強TelumII處理器上的AI加速器功能,達到每秒24萬億次運算(TOPS)。但正如TheRegister之前所解釋的那樣,TOPS可能是一箇誤導性指標。雖然增加了對INT8作爲數據類型的支持,但TelumII本身的設計旨在使模型運行時能夠與最苛刻的企業工作負載並行運行。添加片上DPU是爲了幫助滿足不斷增長的工作負載需求,特別是着眼於未來的AI工作負載和即將推出的Z系統Spyre加速器。據Armonk公司介紹,每個DPU包括四個處理集羣,每個集羣有八個可編程微控制器和一箇管理這些處理集羣的IO加速器,以及兩個IO抽屜域的IO子系統。DPU還具有單獨的L1緩存和請求管理器來跟蹤未完成的請求。DPU位於主處理器結構和PCIe結構之間。將其直接連接到結構的目的是大大減少數據傳輸的開銷,同時提高吞吐量和功率效率。IBM表示,作爲最高配置,未來的Z系統可能擁有多達32個TelumII處理器和12個IO籠,每個籠子最多有16個PCIe插槽,使系統總共支持多達192個PCIe卡,大大擴展了IO容量。Spyre加速器將包含32個核心,其架構與集成在TelumII芯片中的AI加速器類似。IBMZ可以配置多箇Spyre加速器,通過PCIe安裝,以便根據需要擴展AI加速。例如,八張卡的集羣將爲單個IBMZ系統添加256個加速器核心。TelumII和SpyreAccelerator均旨在支持IBM所稱的集成AI,即使用多箇AI模型來提高與單個模型相比的預測性能和準確性。藍色巨人IBMZ和LinuxONE產品管理副總裁TinaTarquinio在評論中表示:“TelumII處理器和Spyre加速器旨在提供高性能、安全且更節能的企業計算解決方案。”她補充道:“經過多年的開發,這些創新將被引入我們的下一代IBMZ平臺,以便客戶可以大規模利用LLM和生成式AI。”藍色巨人希望超越推理,在其大型機上進行微調,甚至可能訓練模型。該公司表示,這將使銀行和其他希望將數據安全保存在自己場所的企業等客戶能夠完全在組織內部訓練和部署模型。TelumII和SpyreAccelerator都將由三星採用5nm工藝節點爲IBM生產。https://www.theregister.com/2025/04/08/ibm_z17_update/半導體精品公衆號推薦專注半導體領域更多原創內容關注全球半導體產業動向與趨勢*免責聲明:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅爲了傳達一種不同的觀點,不代表半導體行業觀察對該觀點贊同或支持,如果有任何異議,歡迎聯繫半導體行業觀察。今天是《半導體行業觀察》爲您分享的第4089期內容,歡迎關注。『半導體第一垂直媒體』實時專業原創深度公衆號ID:icbank喜歡我們的內容就點“在看”分享給小夥伴哦


(本文内容不代表本站观点。)
---------------------------------
本网站以及域名有仲裁协议(arbitration agreement)。

依据《伯尔尼公约》、香港、中国内地的法律规定,本站对部分文章享有对应的版权。

本站真诚介绍香港这个「东方之珠」和「亚洲国际都会」,香港和「东方之珠」和「亚洲国际都会」是本站的业务地点名称。

本网站是"非商业"(non-commercial),没有涉及商业利益或竞争。


2025-Jun-26 11:33am (UTC +8)
栏目列表