復合 LLM 應用 ( compound LLM applications ) 是一種結合大語言模型(LLM)與外部工具、API、或其他 LLM 的高效多階段工作流應用。
前,服務這些應任務需要對運時不確定、作流結構不確定等問題,這對現有集群任務調度算法提出了極大挑戰,并嚴重影響任務運效率。
為了解決上述問題,上海交通大學朱怡飛教授團隊聯合江行智能提出調度框架 LLMSched,通過引入三類新節點來擴展傳統任務表征方法實現復合 LLM 應用任務的有效表征,借助貝葉斯網絡識別可降低不確定性的關鍵節點,并以信息熵衡量節點的熵減程度。
目前論文已被 IEEE ICDCS ’ 25 接收。
實驗結果顯示,LLMSched 結合探索 - 利用策略來平衡調度不確定性與當前調度收益,最終實現高效調度復合 LLM 應用,相較現有調度器平均任務完成時間降低 14~79%。
團隊通過對現有復合 LLM 應用的設計分析與實驗,總結出復合 LLM 應用以下兩點不確定性:
時長不確定性:單任務耗時波動高達 300 秒(圖 1a)。該不確定性主要來源于 LLM 的自回歸生成特性。
結構不確定性:任務步驟數與運行結構隨機波動(圖 1b/c)。該不確定性主要來源于 LLM 在復合 LLM 應用中發揮的決策與規劃功能。
為了應對復合 LLM 應用中存在的結構不確定性,研究團隊提出全新有向無環圖(DAG)建模框架,如下圖所示。該框架引入了三種節點,常規節點(Regular Stage),LLM 節點(LLM Stage)與動態虛擬節點(Dynamic Stage)。其中,常規節點對應外部工具、api 等的調用,LLM 節點對應 LLM 推理任務,動態虛擬節點對應由 LLM 規劃生成的子 DAG。
貝葉斯分析器 + 熵減衡量機制:讓系統越算越 " 清醒 "
團隊在研究過程中意識到復合 LLM 應用的部分節點存在顯著的關聯性。這種關聯性使得在執行完成某些前置節點后,后續節點的不確定性能夠有效降低,具體表現如下:
1、規劃式任務中 LLM 規劃節點后的工作流完全由該節點決定。完成該 LLM 規劃節點后,所規劃的子工作流的未知拓撲結構可被完全揭示。
2、相當一部分的節點在運行時長上存在較高的關聯性(下圖所示)。在完成前置節點后,后續節點的時長不確定性進一步降低。具體表現在后續節點的運行時長的條件分布更為緊湊、可預測。
考慮到實際情況中,不同的節點能夠降低的不確定性程度大不相同,團隊引入信息論中信息熵的概念,使用互信息衡量,如下圖所示。由于信息熵與互信息均通過變量的分布進行計算,因此之前通過 BN 獲得分布便可以直接用于計算調度每個節點的熵減,無需額外的測量。
實驗結果:平均任務完成時間最低降至 79%
團隊選取了六種代表性的復合 LLM 應用,并基于此構建了 4 種不同應用組成的負載,如下圖所示。團隊在一臺搭載 H800 GPU 的 ubuntu 機器上使用 vLLM 框架與 LLaMA-7B 模型進行了實驗。
實驗結果表明,LLMSched 相較于現有的調度器最多可降低 79% 的平均任務完成時間。
實驗結果表明,LLMSched 在任意一組實驗設置上均取得領先的成績,同時隨著任務數量增加,LLMSched 的優勢變得更為突出,比如,與 Decima 相比,在包含 100、200、300 和 400 個任務的混合工作負載中,LLMSched 分別降低了 38%、65%、73% 和 75% 的平均 JCT,這展示了 LLMSched 的可擴展性。
為了分析這兩個組件的有效性,團隊進行了消融研究,創建了兩種額外的方法——LLMSched w/o BN 和 LLMSched w/o uncertainty。第一種方法遵循算法 1 中提出的相同調度方案,但使用歷史任務平均持續時間進行估計。第二種方法使用貝葉斯網絡更新任務持續時間的后驗分布,但僅執行 SRTF 策略。
對于 LLMSched w/o BN,在四種類型工作負載上,平均 JCT 分別比 LLMSched 高 18%、17%、20% 和 5%。這表明 BN 發揮了重要作用,因為它顯著提高了任務持續時間估計的準確性。借助 BN,可以通過利用階段間相關性,更動態地更新和更準確地預測非計劃階段的任務持續時間。
對于 LLMSched w/o uncertainty,在四種類型工作負載上,平均 JCT 分別比 LLMSched 高 21%、12%、15% 和 13%。這表明不確定性感知策略在有效引導探索過程中至關重要。當處理混合工作負載時,其重要性尤為突出,因為各階段的不確定性減少差異顯著。對于這種工作負載,LLMSched w/o BN 的性能優于 LLMSched w/o uncertainty。
LLMSched 為 LLM 服務優化開辟了新方向,尤其對多模塊協作的 Agent 系統、LLM 推理集群資源調度具有重要參考價值。其不確定性量化框架可擴展至其他動態任務場景,推動智能調度理論與實際系統的深度融合。
論文鏈接:https://arxiv.org/abs/2504.03444
一鍵三連「點贊」「轉發」「小心心」
歡迎在評論區留下你的想法!
— 完 —
點亮星標
科技前沿進展每日見