應用

技術

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點新聞
企業(yè)注冊個人注冊登錄

首款專為大規(guī)模上下文 AI 設計的 CUDA GPU,英偉達 Rubin CPX 發(fā)布

2025-09-10 09:13 IT之家
關鍵詞:英偉達RubinCPX

導讀:英偉達宣布推出新產(chǎn)品Rubin CPX,這是一款專為大規(guī)模上下文處理而設計的專用 GPU,涵蓋了像大規(guī)模編碼和生成視頻這樣要求高的工作。

  9 月 10 日消息,英偉達宣布推出新產(chǎn)品Rubin CPX,這是一款專為大規(guī)模上下文處理而設計的專用 GPU,涵蓋了像大規(guī)模編碼和生成視頻這樣要求高的工作。

  該硬件旨在將理解 AI 提示的任務與生成響應的任務區(qū)分開,英偉達表示,這將使整個過程對客戶的效率更高。

  該新硬件預計將作為較大的 Vera Rubin 平臺的一部分工作,該平臺同時集成了 Vera CPU 和 Rubin GPU。英偉達聲稱全機架版本 Vera Rubin NVL144 CPX 擁有 8 exaflops 的 AI 性能。

  從英偉達新聞稿獲悉,獨立的 Rubin CPX GPU 包含128GB 的 GDDR7 顯存。英偉達承諾,新硬件具有 3 倍的 attention capabilities,并使用公司的 4-bit NVFP4 精度提供 30 petaflops 的計算能力。

  英偉達 CEO 黃仁勛將 Rubin CPX 與 RTX 進行了比較,他說:“正如 RTX 革新了圖形和物理 AI,Rubin CPX 是首款專為大規(guī)模上下文 AI 設計的 CUDA GPU,能夠在同一時間推理跨越數(shù)百萬個知識符號的模型?!彼€試圖量化客戶的投資回報,提到部署新硬件的 1 億美元投資可以產(chǎn)生 50 億美元的收益。

  英偉達表示,該硬件將得到其完整軟件棧的支持,包括 Nemotron —— 其一系列開放的多模態(tài)模型,專為構(gòu)建企業(yè)級 AI 代理(旨在自主處理復雜任務的系統(tǒng))而設計。Nemotron 模型提供不同尺寸,從 Nano 用于設備端應用,到 Super 用于單 GPU 設置,再到 Ultra 用于大型數(shù)據(jù)中心。

  英偉達表示,預計 Rubin CPX 將于2026 年底推出