文 | 半導(dǎo)體產(chǎn)業(yè)縱橫,作者 | 九林
這兩天,存儲(chǔ)行業(yè)熱鬧非凡。
8 月 5 日,美光一口氣推出了三款基于美光 G9 NAND 打造的數(shù)據(jù)中心 SSD,號(hào)稱能滿足多樣化 AI 工作負(fù)載需求。
無(wú)獨(dú)有偶,鎧俠也推出了專為生成式 AI 需求打造的 245.76TB NVMe SSD;此外,閃迪發(fā)布最新的 256TB AI 專用 SSD。
存儲(chǔ)大廠們接連放大招,發(fā)布 SSD 產(chǎn)品,并且特意強(qiáng)調(diào) " 賦能 AI"。
誰(shuí)在呼喚 AI SSD?
與標(biāo)準(zhǔn)固態(tài)硬盤(pán)不同,AI SSD 專為處理深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)訓(xùn)練和實(shí)時(shí)數(shù)據(jù)分析等人工智能應(yīng)用的巨大數(shù)據(jù)吞吐量、低延遲和高 IOPS(每秒輸入 / 輸出操作數(shù))需求而設(shè)計(jì)。
AI 訓(xùn)練:高要求的存儲(chǔ)需求
大模型迭代速度迅猛,每一次升級(jí)都伴隨著訓(xùn)練數(shù)據(jù)量的指數(shù)級(jí)增長(zhǎng),PB 級(jí)數(shù)據(jù)已成為 AI 訓(xùn)練的基本門檻 。訓(xùn)練環(huán)節(jié)涉及 GPU、HBM 及承擔(dān)快照、日志功能的 SSD 等組件,且對(duì)存儲(chǔ)的要求遠(yuǎn)高于推理環(huán)節(jié)。
在訓(xùn)練過(guò)程中,系統(tǒng)需要反復(fù)讀取和寫(xiě)入巨量數(shù)據(jù),包括訓(xùn)練語(yǔ)料、模型參數(shù)、日志文件和中間結(jié)果等。數(shù)據(jù)流動(dòng)的頻率極高、負(fù)載持續(xù),IO 密度遠(yuǎn)超日常應(yīng)用。
在 AI 模型訓(xùn)練過(guò)程中,SSD 不僅負(fù)責(zé)儲(chǔ)存模型參數(shù),包含不斷更新的權(quán)重和偏差,而且可以創(chuàng)建檢查點(diǎn)(check point),以定期保存 AI 模型訓(xùn)練進(jìn)度,即使訓(xùn)練中斷也能從特定點(diǎn)恢復(fù)。上述功能都相當(dāng)依賴高速傳輸以及寫(xiě)入耐用度,因此客戶主要選擇使用4TB/8TB TLC SSD 產(chǎn)品,以滿足嚴(yán)苛的訓(xùn)練過(guò)程需求。
AI 推理環(huán)節(jié):SSD 的核心支撐作用
AI 推理環(huán)節(jié)中,SSD 可在推理過(guò)程中協(xié)助調(diào)整、優(yōu)化 AI 模型,尤其 SSD 可以實(shí)時(shí)更新數(shù)據(jù),以便微調(diào)推理模型結(jié)果。AI 推理主要提供檢索增強(qiáng)生成(RAG, Retrieval-Augmented Generation)和大型語(yǔ)言模型(LLM, Large Language Model)服務(wù),而 SSD 可以儲(chǔ)存 RAG 和 LLM 參考的相關(guān)文檔和知識(shí)庫(kù),以生成含有更豐富信息的響應(yīng)。目前TLC/QLC 16TB 以上等大容量 SSD便成為 AI 推理主要采用的產(chǎn)品。
TrendForce 數(shù)據(jù)顯示,全球范圍內(nèi),2024 年 AI 相關(guān)的 SSD 采購(gòu)容量將超過(guò) 45EB,未來(lái)幾年,AI 服務(wù)器有望推動(dòng) SSD 需求年增率平均超過(guò) 60%,而 AI SSD 需求在整個(gè) NAND Flash(閃存)的占比有機(jī)會(huì)自 2024 年的 5%,上升至 2025 年的 9%。
大廠 AI SSD 比拼,各有神通
鎧俠:AI SSD,兩方面入手
鎧俠在今年公布了 AI 時(shí)代中長(zhǎng)期增長(zhǎng)戰(zhàn)略。重點(diǎn)圍繞 AI 驅(qū)動(dòng)的存儲(chǔ)技術(shù)創(chuàng)新、SSD 業(yè)務(wù)拓展及資本效率優(yōu)化,以鞏固其在 NAND 閃存市場(chǎng)的競(jìng)爭(zhēng)力。
對(duì)于 AI SSD 有兩類產(chǎn)品線:
第一類是高性能 SSD。鎧俠的 CM9 系列,專為 AI 系統(tǒng)設(shè)計(jì),搭載針對(duì)數(shù)據(jù)中心優(yōu)化的 PCIe 5.0,最大限度地發(fā)揮需要高性能和高可靠性的 GPU 功能。
第二類是容量型 SSD。鎧俠的 LC9 系列,適用于推理中使用的大型數(shù)據(jù)庫(kù)等用例,當(dāng)時(shí)容量為 122.88 TB,未來(lái)計(jì)劃推出更大容量產(chǎn)品。
前兩天,鎧俠推出了新的容量—— 245.76TB。據(jù)了解鎧俠 LC9 系列 SSD 采用的也是 QLC 3D 閃存,但是特點(diǎn)是結(jié)合了 CBA(CMOS 直接鍵合到陣列)技術(shù),這就能夠?qū)崿F(xiàn)在 154 球柵陣列(BGA)小型封裝中達(dá)到 8 TB 的容量。鎧俠稱這是業(yè)界首創(chuàng)。
對(duì)于未來(lái)的 AI SSD,鎧俠也提出了自己的設(shè)想,主要從兩個(gè)方面突破。第一是速度更快。現(xiàn)在的 SSD 每秒能處理 200 萬(wàn) -300 萬(wàn)次小文件讀寫(xiě),多采用 TLC 和 QLC ,而新產(chǎn)品將采用XL-FLASH 的 SLC 閃存,速度提升到每秒 1000 萬(wàn)次以上,特別適合 AI 需要頻繁讀取零碎數(shù)據(jù)的場(chǎng)景。
這里解釋一下,XL-FLASH 是鎧俠開(kāi)發(fā)的具有極低延遲、高性能 NAND,用于填補(bǔ)易失性存儲(chǔ)器(如 DRAM)和當(dāng)前閃存之間存在的性能缺口。最開(kāi)始鎧俠把 XL-FLASH 定位為英特爾已停產(chǎn)的 Optane 內(nèi)存的競(jìng)爭(zhēng)對(duì)手。目前,鎧俠的第二代 XL-Flash 采用 MLC(多層單元)架構(gòu),密度翻倍,芯片容量從 128Gb 提升至 256Gb。
第二是更智能。目前 AI 檢索數(shù)據(jù)要依賴內(nèi)存,2026 年鎧俠將推出AiSAQ 軟件,讓 SSD 自己就能處理 AI 的檢索任務(wù)。這樣不僅能減輕內(nèi)存負(fù)擔(dān),還能讓 AI 應(yīng)用運(yùn)行更高效,尤其適合智能終端和邊緣計(jì)算設(shè)備。
美光:AI SSD 三劍客
美光最新發(fā)的 AI SSD 是三款。
第一款是美光 9650 SSD,全球首款 PCIe 6.0 的 SSD,主要用在數(shù)據(jù)中心領(lǐng)域。能夠提供 28 GB/s 的性能。據(jù)美光測(cè)試,相較于 PCIe 5.0 SSD,9650 SSD 的隨機(jī)寫(xiě)入與隨機(jī)讀取的存儲(chǔ)能效分別提升高達(dá) 25% 和 67%。
第二款是美光 6600 ION SSD,單盤(pán)容量最高達(dá) 245TB,主要應(yīng)用在超大規(guī)模部署與企業(yè)級(jí)數(shù)據(jù)中心整合服務(wù)器基礎(chǔ)設(shè)施、構(gòu)建大型 AI 數(shù)據(jù)湖。相較于競(jìng)品,該產(chǎn)品的存儲(chǔ)密度提升高達(dá) 67%,單機(jī)架存儲(chǔ)容量突破 88PB,大幅降低總體擁有成本(TCO)。
第三款是美光 7600 SSD,主要用于 AI 推理與混合工作負(fù)載。據(jù)稱,能夠在高度復(fù)雜的 RocksDB 工作負(fù)載下實(shí)現(xiàn)業(yè)界領(lǐng)先的亞毫秒級(jí)延遲。
從美光推出的產(chǎn)品來(lái)看,瞄準(zhǔn)的正是:速度、容量、性價(jià)比。從美光最新的財(cái)報(bào)來(lái)看,截至 2025 年 5 月 29 日,美光 Q3 財(cái)季營(yíng)收 93 億美元,同比增長(zhǎng) 37%;凈利潤(rùn) 21.81 億美元,同比增長(zhǎng) 210.7%。其中,美光的 NAND 收入 21.55 億美元,占總收入的 23%,環(huán)比增長(zhǎng) 16.2%。NAND Bit 出貨量環(huán)比增長(zhǎng)約 25%。美光表示,2025 財(cái)年有望實(shí)現(xiàn)創(chuàng)紀(jì)錄的營(yíng)收。
Solidigm:優(yōu)化 AI 效率的存儲(chǔ)產(chǎn)品組合
Solidigm 將 AI 存儲(chǔ)方案大致分為兩類。
一類是,直連式存儲(chǔ)(DAS),針對(duì)訓(xùn)練等對(duì)性能極度敏感的場(chǎng)景,它更關(guān)注單位功耗下的 IOPS;另一類是網(wǎng)絡(luò)存儲(chǔ)(包括 NAS 文件 / 對(duì)象存儲(chǔ)),針對(duì)數(shù)據(jù)攝取、歸檔和 RAG(檢索增強(qiáng)生成)等大容量場(chǎng)景,對(duì)讀性能要求較高,同時(shí)也追求最低成本存儲(chǔ)海量數(shù)據(jù)。
Solidigm 在 AI SSD 中的另一個(gè)亮點(diǎn)是 QLC SSD。自 2018 年發(fā)布首款 QLC SSD 以來(lái),Solidigm 已累計(jì)出貨超過(guò) 100EB 的 QLC,并為全球 70% 的領(lǐng)先 OEM AI 解決方案提供商提供服務(wù)。
Solidigm 不僅推動(dòng) QLC 技術(shù)的普及與應(yīng)用,還在液冷 SSD 技術(shù)領(lǐng)域進(jìn)行大膽嘗試。2025 年 3 月,Solidigm 展示其首款采用 SolidigmD7-PS1010 E1.S 9.5mm 外形規(guī)格的冷板液冷 SSD,該方案顯著提升了散熱效率。
一路向上
盡管大多數(shù) AI SSD 預(yù)計(jì)是在 2026 年推出,但從前文的對(duì)比來(lái)看,AI SSD 已經(jīng)有了雛形。
從顆粒的選擇上,AI SSD 會(huì)朝著 QLC 顆粒方向走。鎧俠 CEO 柳茂知也表示,QLC SSD 是 AI 行業(yè)最好的選擇。盡管從 SLC 到 MLC,再到 TLC,最終到 QLC,SSD 的性能一直在下降,但隨著技術(shù)的演變,2025 年 QLC SSD 的速度已經(jīng)比 2017 年的 TLC SSD 快很多了。如今 QLC SSD 的順序讀寫(xiě)速度可達(dá) 7000MB/s 左右,性能十分強(qiáng)大,能夠滿足 AI 大模型數(shù)據(jù)存儲(chǔ)和調(diào)用的要求。
從實(shí)際測(cè)試中,Solidigm 構(gòu)建了一個(gè)新 100 兆瓦 AI 數(shù)據(jù)中心的模型,評(píng)估 QLC 固態(tài)硬盤(pán)、TLC 固態(tài)硬盤(pán)和基于機(jī)械硬盤(pán)的混合部署的影響。 其中發(fā)現(xiàn),QLC 固態(tài)硬盤(pán)的能效比 TLC 固態(tài)硬盤(pán)高 19.5%;比混合 TLC 固態(tài)硬盤(pán)和機(jī)械硬盤(pán)高 79.5%,同一數(shù)據(jù)中心內(nèi),使用 QLC 固態(tài)硬盤(pán)時(shí)可部署的全套 AI 基礎(chǔ)設(shè)施數(shù)量更高。
從傳輸接口與協(xié)議層面來(lái)看,采用 PCIe 接口并支持 NVMe 協(xié)議,未來(lái)大概率會(huì)成為 AI SSD 的標(biāo)準(zhǔn)配置。PCIe 接口憑借不斷升級(jí)的帶寬能力,從 PCIe 3.0 發(fā)展到如今的 PCIe 5.0,目前業(yè)內(nèi)已經(jīng)推進(jìn)到了 PCIe 7.0(6 月份發(fā)布了)。
可以從前文看到,目前推出的 SSD 大多是支持 PCIe 5.0 的,美光已經(jīng)推出了 PCIe 6.0 的產(chǎn)品,順序讀取速率高達(dá) 28GB/s,到明年有競(jìng)爭(zhēng)力的 AI SSD 應(yīng)該都用上 PCIe 6.0。
不過(guò),PCIe 目前在成本上還是比較昂貴,首批 PCIe 6.0 SSD 產(chǎn)品價(jià)格高達(dá) 500-800 美元(1TB),是普通 PCIe 4.0 SSD 的 3 倍 -5 倍。同時(shí),產(chǎn)品需搭配支持 PCIe 6.0 的 CPU 及主板。
此外,NVMe 協(xié)議專門針對(duì)閃存存儲(chǔ)進(jìn)行優(yōu)化,為 SSD 提供了極高的 I/O 吞吐量和低延遲,這對(duì)于減少數(shù)據(jù)訪問(wèn)瓶頸非常重要。在 PCIe 接口之上構(gòu)建了高效的數(shù)據(jù)訪問(wèn)機(jī)制,極大地降低了延遲,提升了 IOPS 性能,能充分發(fā)揮閃存的快速讀寫(xiě)特性。隨著技術(shù)發(fā)展,PCIe 接口和 NVMe 協(xié)議還會(huì)持續(xù)演進(jìn),融入如CXL 等新興技術(shù)。
熱鬧之下
AI SSD 的賽道,越來(lái)越擁擠。
從云端訓(xùn)練到邊緣推理,存儲(chǔ)不僅要保證基礎(chǔ)性能,更需要與 AI 計(jì)算流程深度適配。存儲(chǔ)廠商正在調(diào)整技術(shù)路線,從單純追求性能指標(biāo)轉(zhuǎn)向優(yōu)化整體系統(tǒng)協(xié)同。這種轉(zhuǎn)變反映了行業(yè)對(duì) AI 工作負(fù)載特性的深入理解。
當(dāng)前的技術(shù)競(jìng)爭(zhēng)焦點(diǎn),已從硬件參數(shù)的比拼,轉(zhuǎn)向如何實(shí)現(xiàn)存儲(chǔ)與計(jì)算的無(wú)縫配合。畢竟在 AI 時(shí)代,最好的 SSD 不是跑分最高的那塊,而是讓 AI" 忘記 " 存儲(chǔ)存在的那塊。