午夜福利电影丨精品国产一区二区三区色欲丨久久无码中文字幕免费影院丨亚洲人成人无码www影院丨人人爽人人澡人人人人妻

歡迎訪問深圳市中小企業公共服務平臺電子信息窗口

英偉達發布新GPU Rubin CPX,專為長上下文AI推理設計

2025-09-10 來源:愛集微
616

關鍵詞: 英偉達Rubin CPX AI推理運算 Vera Rubin NVL144 CPX 長上下文推理 視頻生成

英偉達周二(9月9日)宣布,推出專為長上下文推理和視頻生成應用設計的專用GPU Rubin CPX,用于翻倍提升當前AI推理運算的工作效率,特別是編程、視頻生成等需要超長上下文窗口的應用。

英偉達創始人兼CEO黃仁勛說:“正如RTX徹底改變了圖形和物理AI一樣,Rubin CPX是首款專為海量上下文AI打造的CUDA GPU,這種AI模型可以同時處理數百萬個知識token的推理。”

Rubin是英偉達將在明年發售的下一代頂級算力芯片,基于Rubin的CPX預計也要到2026年底出貨。下一代英偉達旗艦AI服務器的全稱叫做NVIDIA Vera Rubin NVL144 CPX——集成36個Vera CPU、144塊Rubin GPU和144塊Rubin CPX GPU。

Rubin CPX配備128GB GDDR7內存,NVFP4精度下AI算力可達30PFLOPS,非常適合運行長上下文處理(超過100萬個token)和視頻生成任務。

Vera Rubin NVL144 CPX平臺可在單機架集成144張Rubin CPX GPU、144張Rubin GPU、36張Vera CPU,提供8EFLOPS的AI性能(NVFP4精度)和100TB的快速內存,內存帶寬達到1.7PB/s。

其AI性能是英偉達Vera Rubin NVL144平臺的2倍多,是基于Blackwell Ultra的GB300 NVL72系統的7.5倍,相比GB300 NVL72系統還能提供3倍更快的注意力機制。