2025 年 11 月 6 日谷歌發(fā)布的 TPU Ironwood 芯片,需與特定存儲、互聯(lián)、軟件及散熱組件深度搭配,才能實現(xiàn) “四倍性能提升” 與 “百萬級商用部署”,這些組件共同構成其完整算力生態(tài),也是挑戰(zhàn)傳統(tǒng) AI 算力方案的關鍵。
高帶寬存儲(HBM)與共享內(nèi)存:解決數(shù)據(jù) “供給不足”
Ironwood 單芯片集成 192GB HBM,容量較前代提升 6 倍,內(nèi)存帶寬達 7.2Tbps,直接破解 “算力強但數(shù)據(jù)傳得慢” 的瓶頸。更關鍵的是,9216 顆芯片可共享 1.77PB 高帶寬內(nèi)存,處理千億參數(shù)大模型時無需反復 “搬運數(shù)據(jù)”,Anthropic 測試顯示,Claude 模型的數(shù)據(jù)訪問效率因此提升 3 倍以上,間接縮短迭代周期。
光電路交換與互聯(lián)網(wǎng)絡:保障集群 “協(xié)同不卡頓”
Ironwood 搭載谷歌自研光電路交換技術,將芯片間傳輸延遲降至微秒級,還支持 “故障自動路由”,鏈路中斷時毫秒內(nèi)切換備用路徑,確保模型訓練不中斷。其 “扁平化” 互聯(lián)架構減少數(shù)據(jù)傳輸中間節(jié)點,9216 顆芯片協(xié)同效率提升 40%,避免算力浪費。
AI 框架與云調(diào)度系統(tǒng):讓芯片 “會干活、好調(diào)用”
Ironwood 的軟件搭檔是 TensorFlow 框架與谷歌云調(diào)度系統(tǒng)。TensorFlow 針對 FP8 計算格式優(yōu)化,自動拆解訓練任務適配芯片架構;云調(diào)度系統(tǒng)支持靈活調(diào)用 “單顆 - 小集群 - 全 POD” 資源,中小團隊無需巨額投入即可逐步擴容,讓算力快速落地商用。
高效散熱系統(tǒng):維持芯片 “穩(wěn)定跑滿性能”
Ironwood 采用 “液冷 + 風冷” 混合散熱,核心單元液冷直觸控溫 50℃以下,外圍風冷輔助,散熱效率較傳統(tǒng)方案提升 50%。滿負載運行時溫度波動不超 3℃,避免性能降頻,算力利用率保持 95% 以上,較散熱不佳方案提升 15%。
這種 “硬件 + 配套” 一體化設計,讓 Ironwood 的四倍性能切實落地,在 Anthropic 等場景中具備 “高性價比 + 高可靠性” 優(yōu)勢,也為 AI 芯片發(fā)展提供 “拼協(xié)同” 的新思路。