AMD宣布對銳龍AI Max的銳龍可變顯存進行重大升級,可劃分96GB作為顯存使用,帶大模這讓它能夠運行128B大小的更強大模型。
AMD在年初的支持CES 2025上推出了銳龍AI Max系列處理器,擁有2個Zen 5架構CCD最多16個內核,可運并擁有最多40組RDNA 3.5架構CU的行B型超大核顯,并配備256位的銳龍LPDDR5X內存控制器,盡管很多用戶對這款產品的帶大模期待是更小體積的游戲機產品,但是更強從AMD自身的規劃以及廠商的反應來看,該系列處理器似乎更多的支持被計劃用于本地AI以及大模型等需求。
顯然AMD對于AI更加重視,現已宣布對銳龍AI Max的行B型可變顯存進行重大升級,即將推出的銳龍Adrenalin Edition 25.8.1 WHQL驅動程序可以讓配備128GB內存的銳龍AI MAX設備劃分96GB作為顯存使用,這讓它能夠運行128B參數的帶大模大模型。
AMD表示已經成功使用銳龍AI Max+ 395處理器成功在本地運行Meta的Llama 4 Scout 109B模型,成為首款成功運行該模型的Windows AI處理器,并支持視覺和MCP,Llama Scout采用混合專家模式,所以每次只有17B處于活動狀態,所以可保持較快的輸出,最多可實現15tokens/s的生成速度。
銳龍AI Max處理器對大模型提供了廣泛的支持,從最小的1B微型模型到最大128B的模型,支持包括GGUF在內的多種量化格式,使其能夠靈活地適用于不同場景。這次升級還增大了對大型上下文大小的支持,大多數設置的最大token數約為4096個,但這次升級后銳龍AI Max平臺可以擴展至256000個token,但需要開啟Flash Attention功能,啟用KV Cache Q8,這運行在上下文中保存大量token,使其支持更高級的任務,例如解析和匯總大型文檔的內容。
當然,上述功能都需要你擁有的銳龍AI Max搭載了128GB內存,特別是考慮到該系列處理器使用了板載的LPDDR5X內存的情況下。目前擁有這類設備的用戶可以在AMD官網上下載預覽版驅動提前嘗鮮。