文 | 新質動能,作者|沐風,編輯|時楠
AI 創業圈里,又沖出一個估值 288 億的獨角獸。
這家公司背后的掌舵人——喬琳,本碩均畢業于復旦大學計算機系,資歷硬到能在硅谷掀起風浪。
她的投資人陣容堪稱豪華:有紅杉、Benchmark 這樣的頂級老牌風投,也有一票手握核心算力的產業巨頭。
而最炸裂的,是那兩位名字——英偉達和 AMD。
沒錯,黃仁勛和蘇姿豐,這對在芯片戰場互不相讓的對手,竟罕見地坐到同一張牌桌上,為同一個創業者押下重注。
這就讓人忍不住想問:喬琳,這位復旦才女,以及她創立的名字有點拗口的 Fireworks AI,究竟有何底氣,讓芯片圈的 " 教父 " 和 " 女王 " 同時放下刀劍,掏出支票?
復旦才女硅谷進階
要看懂 Fireworks AI,必須先看懂它的創始人,喬琳。
這位姐的履歷,堪稱一部學霸和技術大牛的進化史。復旦本碩連讀,加州大學圣巴巴拉分校博士,先后在 IBM、LinkedIn 當技術高管。創業前,她最重要的一站,是在 Meta(當年的 Facebook)。
在 Meta 任職期間,她領導了超過 300 人的工程團隊,把 PyTorch 從一個科研圈的小眾工具,打造成支撐全球開發者生態的行業標桿。她主導的改造,不只是把它跑起來,更是讓它能在 Meta 的數據中心、移動端、以及 AR/VR 設備上高效運行。
簡單來說,PyTorch 就是今天無數 AI 模型的 " 地基 "。而喬琳,就是當年那個最核心的 " 包工頭 " 之一。
這段經歷,讓她悟透了一個道理:PyTorch 之所以能干翻幾十個競爭對手,關鍵就在于它的設計哲學——把復雜留給團隊,把簡單帶給用戶。
開發者用起來,幾行代碼就能調用強大的功能,極其絲滑。但他們不知道的是,背后是幾百個頂級工程師,在處理著天文數字般的復雜技術。
2022 年,她拉上六位 PyTorch 老戰友和一位前谷歌 AI 專家,在加州雷德伍德創立了 Fireworks AI。這個團隊,幾乎可以說是 AI 基礎設施的 " 夢之隊 ":有人擅長分布式推理引擎,有人深耕 GPU 算力優化,有人對大模型微調了如指掌。
她的目標很明確:在 AI 這波淘金熱里,不當那個挖金礦的,而是當那個在旁邊賣水、賣鏟子的。
現在搞 AI 的創業公司,遍地都是。但他們都有個共同的痛點:想用開源大模型,但自己買 GPU 服務器太貴,養算法工程師太難,部署和優化更是要命。
怎么辦?喬琳的公司,就像一個 "AI 算力中央廚房 "。
他們租來一大堆英偉達的服務器,把市面上最火的開源大模型,比如 Llama、DeepSeek,都提前在上面裝好、優化好。然后,創業公司直接通過 API 接口來調用就行,按流量付費。
你不用管后廚有多兵荒馬亂,直接點菜就行。Fireworks AI,就是要把這種極致的 " 簡單 ",賣給所有想用 AI 的人。
Fireworks AI 的秘密武器
如果只是當個中介,租服務器再轉租出去,那 Fireworks AI 不值 288 個億。
他們真正的 " 秘密武器 ",是能讓 AI 模型跑得更快、更省錢的底層優化技術。說白了,他們不只是 " 中央廚房 ",還是自帶 " 米其林三星 " 技術的大廚。
光說不練假把式。我們來看看他們的客戶,AI 編程獨角獸 Cursor,是怎么被他們 " 帶飛 " 的。
Cursor 是個給程序員用的智能編程工具。但程序員有個大麻煩:想讓 AI 改一大段代碼,比如幾百行,用 GPT-4 這種通用模型,經常又慢又錯,急死個人。
為了解決這個問題,Cursor 自己訓練了一個專門用來 " 改代碼 " 的新模型。但光有模型還不夠,還得跑得快。
這時候,Fireworks AI 出手了。他們用了兩招,給 Cursor 的模型裝上了 " 渦輪增壓 "。
第一招,叫 " 量化技術 "。
這玩意兒說起來復雜,其實很簡單。就像把一部 4K 高清電影,壓縮成能在你手機上流暢播放的短視頻,畫質沒差多少,但文件小了好幾倍,播放起來也快多了。
Fireworks AI 就是用類似的技術,在不犧牲太多準確性的前提下,讓 AI 模型的計算效率大幅提升。
第二招,叫 " 推測執行 "。
普通 AI 寫代碼,是一個字一個字往外蹦。但 Fireworks 的技術,能讓 AI" 腦補 ",一次性猜出后面好幾個詞,然后回頭快速驗證。這樣一來,速度直接起飛。
效果有多炸裂?用了 Fireworks AI 的技術后,Cursor 的模型速度飆到了每秒生成約 1000 個 token,比普通推理快了 13 倍,比之前用 GPT-4 也快了 9 倍。
更狠的是,Fireworks AI 靠自研的推理引擎和優化工具,把算力榨到極致。比如他們的 Fire Attention 技術,能讓推理速度飆升、資源消耗下降,直接幫客戶省下一大筆錢。
最終,程序員改幾百行代碼,幾秒鐘就能出結果。這種效率的提升,就是 Fireworks AI 最值錢的地方。
黃仁勛雙重身份
技術牛,商業模式清晰,客戶也都是 AI 圈的當紅炸子雞。Fireworks AI 自然成了資本的寵兒。
他們的投資人名單,星光熠熠:紅杉、Benchmark、AMD、英偉達……
但在這其中,英偉達的角色,最值得玩味。
作為 A 輪的投資方,英偉達不僅給了錢,還和 Fireworks AI 有深度技術合作,互為客戶。看起來,這是一段 " 伯樂與千里馬 " 的佳話。
但,你可別忘了,這個人是黃仁勛。黃仁勛的投資,從來都不是純潔的友誼。
就在今年 3- 月,英偉達收購了 Fireworks AI 的競爭對手 Lepton,然后強勢推出了自己的 GPU 云服務市場,直接殺進了 Fireworks AI 的核心業務領域。
在醫療健康領域,英偉達也投資多家公司,為 AI 藥物研發提供強大的算力支持。不僅如此,在量子計算等前沿領域,英偉達也與谷歌、甲骨文等巨頭強強聯手,共同開發量子芯片,并為企業客戶提供混合量子計算服務的測試和開發平臺。
一邊給你遞上支票,一邊可能已經在磨刀,準備隨時收割你的業務。 這,就是科技巨頭的生存法則。喬琳自己,對此也看得很清楚。
喬琳在最近一次訪談中透露,任何有利可圖的市場,英偉達都虎視眈眈,準備加入競爭,打破現有格局。她直言不諱地指出,壟斷并非市場所樂見,競爭是必然趨勢,本質上這是一個經濟問題。
至于這場競爭何時打響?喬琳表示,應該很快了。
這種合作與競爭并存的微妙關系,引發了業界對于英偉達未來動向的關注,尤其是其是否會收購 Fireworks AI,更成為一個值得探討的熱點話題。
而這次傳出的 40 億美元估值,既是市場對 Fireworks AI 技術和商業模式的認可,也是一場與時間的賽跑。他們必須在英偉達這個 " 巨無霸 " 親自下場收割之前,盡快做大規模,建立自己的護城河。