在具身智能研發中,往往普遍存在以下數據問題:數據模態缺失、數據采集流程繁瑣、任務數據管理繁雜、模型訓練推理部署門檻高等難題。諸多瓶頸成為具身智能模型從實驗室走向規?;瘧玫?" 攔路虎 "。零次方深耕具身智能領域,以自身模型開發經歷為基礎,深悉行業痛點,推出 " 全模態 " 具身數據全鏈路解決方案,突破數據瓶頸,加速模型訓練開發,涵蓋:" 全模態 " 數據采集設備、數據采集與管理平臺、模型訓練與模型推理工具鏈,旨在徹底解決上述痛點問題。
面向未來 3-5 年具身數據需求設計
技術路線上:當前具身智能模型的發展仍處于發展期,各研究團隊的技術路線逐漸向更豐富的模態探索:
視覺 - 關節融合方案(如 ACT、Diffusion Policy、DP3 等):通過聯合嵌入視覺信息與機器人本體感知,利用本體數據補償視覺觀測歧義性,提升動作泛化能力,但因缺乏力學反饋,在物理交互密集型任務中適應性不足。
語義 - 視覺 - 關節融合方案(如 Pi0、GROOT 等):引入語義信息(如語言指令 / 場景描述)增強環境與長序列任務的理解,結合視覺與關節狀態實現多模態決策,提升復雜任務泛化性。
視覺 - 關節 - 力聯合建模(如 RDP 等)引入力 / 觸覺反饋構建物理表征,提升泛精密操作的魯棒性;
更為齊全的模態架構正成為新趨勢,通過跨模態對齊實現環境 - 物理 - 語義的協同推理。
在此背景下,零次方的全模態數據架構具備雙重核心優勢:
1. 維度兼容性:全模態數據高維數據可自然降維生成任意子模態數據集(如剝離力觸覺獲得純視覺 - 關節數據),兼容現存所有算法范式的訓練需求;
2. 價值持續性:預設傳感器冗余通道,集成工具標注對齊多模態數據流,為正在演進的 VLA、跨模態對齊、物理因果推理、世界模型等等未來 3-5 年可能涌現的具身模型提供燃料。
這種前瞻性設計能兼容當下技術生態、支撐長期算法進化的 " 高維數據基座 "。此外,零次方的 " 全模態 " 數采人形機器人 ZERITH-H1,完美兼顧零次方的全模態數據架構設計,實現全模態數據采集與落地。
" 全模態 " 數采人形機器人 ZERITH-H1
" 擬人 " 身體架構," 超人 " 活動范圍:ZERITH-H1 的上肢結構、自由度設計全部參考人類的身體,并在此基礎上大幅增加關節的活動范圍,使得其具備超越成年男性的靈活操作空間。
ZERITH-H1 基礎參數介紹
高維度 " 全模態 " 傳感器設計:為應對具身智能模型訓練普遍存在的 " 數據模態缺失 " 問題,零次方機器人在 Zerith-H1 設計階段即整合了各種模態的傳感器,可實現對二維視覺信息、三維空間信息、關節信息、力觸覺信息、聲音信息的 " 完整 " 模態信息采集。
集成觸覺感知,抓取豆腐等易碎物
特別的是,針對于力觸覺感知部分,ZERITH-H1 搭載了觸覺夾爪,集成了高分辨率視觸覺傳感器,實現對抓取力觸覺的精準感知。零次方在視觸覺傳感器方面技術積累深厚,源于清華 AI&Robot 實驗室。實驗室曾提出過超越人類觸覺感知水平的超光譜視觸覺傳感方案,相關視觸覺成果多次獲 ICRA、IROS Best Paper Finalists、多次在 T-RO、Soft Robotics、T-MECH 上發表相關研究。
低延遲、高動態響應的遙操系統:為了進一步滿足實時同步操作的需求,零次方將機器人與采集者通訊延遲無限推進至零延遲,實現 " 孿生式 " 映射同步感知;同時整體設備連續運行時間超過 4 小時,滿足長時間不間斷的數據采集需求。
VR 遙操演示
VR APP 快速構建物理世界與虛擬世界交互渠道:基于主流 vr 設備自研 ZERITH-VR APP,實現遙操作設備與機器人本體、具身數據管理平臺超低數據傳輸延時。同時通過 " 一鍵式 " 設備連接、" 引導式 " 數據采集工作流,幫助用戶快速掌握復雜任務數據采集能力,確保數據收集質量、提升數據采集效率。
具身數據采集管理平臺:將采集的多元化數據,轉為即用型訓練燃料
針對數據采集任務多樣、采集流程繁雜、數據管理及可視化等需求,零次方自研具身數據管理平臺用于數據全流程管理,依托自身開發模型的經歷,通過數萬次的數據采集與測試,不斷測試數據管理平臺易用性,現正式對外推出具有:對具身任務數據分類、清洗、標注、檢索等模塊化高易用性的具身數據采集管理平臺。
集成高效訓練與部署工具鏈:讓訓練與場景落地更迅捷、更簡易化
同時,為讓用戶可快速、便捷式將數據集應用于模型訓練,零次方數據平臺設計兼容主流開源算法框架的標準化接口(如 ACT、Diffusion Policy、DP3 等);數據接口兼容對基座模型(Pi0、GROOT、ZERITH-V0 等)的后訓練(LORA、Full tuning、RL 等),提供符合許可證要求的快速訓練接入能力。
在模型訓練過程,零次方深度集成 AI 訓練工具 Swanlab,實現對模型訓練的全過程記錄、實時監控、數據可視化與批量實驗分析,幫助用戶科學調參、管理歷史訓練實驗數據,高效迭代自己的具身智能模型。
在模型推理上,機器人最高可選 500TOPS 算力主機,集成易用部署的框架,優化推理效果,實現絲滑動作執行,真實可見的在場景中的落地效果。
雷峰網雷峰網