三易生活 1小時前

可識別唇語，蘋果的新專利可能會解救頭戴設備

為了挽救 Vision Pro，蘋果又出招了。日前有消息源曝光了他們獲批的一個新專利，顯示其未來的頭戴式設備將支持讀取唇語，所以用戶無需發出聲音，就可通過讀取唇部動作來接收命令。

在這份名為 " 帶有語音輸入結構的電子設備 " 專利相關文件中，蘋果描述了在佩戴者無法說話的場景下，通過內置的視覺傳感器讀取唇語以實現語音輸入。如果這個專利真的能落地，或將對目前一切頭戴設備都有著巨大的積極作用。

就在小米和阿里先后下場之后，這一輪 AI 眼鏡熱潮已經到來。然而在烈火烹油的局面下，這類產品其實也面臨著不小的危機。根據 VR Vision 的統計，僅僅在抖音電商，AI 眼鏡的平均退貨水平就達到了 40%-50%。而在網友們將其列為 " 吃灰神器 " 的一眾原因里，除了元器件變多會增加佩戴負擔外，語音交互則是另一個被集中反饋的痛點。

對于智能音箱這類使用場景基本集中在家庭環境的設備，它與語音交互可以說是天作之合，但 AI 眼鏡、XR 頭顯則截然不同，畢竟后者在使用時會有相當一部分是公共場合。

誠然，在 AI 大模型相關技術跨越式發展的當下，這類智能設備都擁有了不錯的語義識別能力，能夠理解用戶語句背后的含義，再輔以降噪引擎，可以在各種各樣的聲音中分辨所需要的語音流，從而精準識別來自佩戴者的指令。

盡管拾音和語義理解都不是問題，但真正的痛點就在于，不是所有人都能克服在大庭廣眾之下對著空氣說話帶來的羞恥感。再加上由于公共場合的聲音環境更加復雜，所以即便降噪技術再先進，也需要用戶用更高的音量來操控設備。可是在公共場合高聲喧嘩，顯然就與公序良俗相背。再加上語音交互就需要用一定音量說出需求，但不少人并不希望自己的隱私被暴露。

十年前，馬化騰在談及騰訊沒有做語音助手時就曾表示，" 我們沒有作為重點去做，這個功能看起來方便，其實未必，比如一個人對著手機說我要去干嘛干嘛，好傻，人一多我都不好意思這么說，而且也不私密，寧可多按幾下。"

要知道支持拍攝功能的 AI 眼鏡本身就存在巨大的隱私爭議，因為不是所有人都能接受活在鏡頭下。再加上 AI 眼鏡普遍以語音交互為核心，就會給用戶在公共場合使用帶來巨大的心理負擔。此外，音頻的信息量要遠大于圖文，但信息量大并不總是一件好事，因為用戶分析和篩選需要花費更多的時間，并且聽覺相對視覺在上下文聯想方面對于人腦更不友好，這就會使得用戶在用語音交互時需要耗費更多的精力。

那么問題就來了，難道 AI 眼鏡、XR 頭顯的廠商不知道語音交互的缺陷嗎？其實答案是語音交互已經是當下最有性價比的解決方案了。但語音交互的一大痛點就是用戶必須要發出聲音，可要強化 ASR（語音識別）、NLP 自然語義處理、遠場拾音，并捕捉用戶壓低聲音說話的聲紋，成本就必然會大幅度提升，進而又會導致潛在受眾群體變少。可如果降低成本，大聲說話帶來的社交壓力又客觀存在。

在語音交互之前，智能眼鏡類產品的主要交互方式是鏡腿觸控模式。可是在眼鏡腿上進行交互并不符合人體工學，其缺陷在于需要將手舉到頭部與眼鏡對齊，但頻繁舉手就會讓人感到疲勞。而 TWS 耳機能用觸控交互的原因，是用戶并不會頻繁調整音量或者開啟降噪，所以低頻場景的觸控操作反而可行。

在觸控交互不適合頭戴設備，語音交互有缺陷的情況下，蘋果這一識別唇語的無聲輸入模式就有望成為一個兩全其美的解決方案。用戶無需發出聲音，讀取唇部動作來接收命令的方式，就解決了用戶在公共場合與設備交互帶來的一系列痛點。更何況識別唇語如今也不是什么黑科技，只需搭配一個成熟的 AI 視覺模型就可解決。

通過向 AI 模型灌輸不同語言的用戶說話時的唇部動作，在經過充分的預訓練后，就能夠讓搭載了 AI 模型的設備知道用戶到底在說什么。只要解決識別率的問題，AI 眼鏡、XR 頭顯被廣泛應用于公共場合的最大一塊絆腳石，就可能會被搬開。

一旦用戶能夠毫無顧忌地使用 AI 眼鏡、XR 頭顯，這類產品也就有了從小眾嘗鮮群體專屬變為大眾化消費電子產品的契機。

【本文圖片來自網絡】

查看原文

宙世代

ZAKER旗下Web3.0元宇宙平臺

一起剪

ZAKER旗下免費視頻剪輯工具

相關標簽

ai 專利 vision 抖音

熱門訂閱換一批

星河商業觀察

聚焦星河商業動態，洞察行業發展脈絡。

查看全部

Blockchain News

宙世代元宇宙

元宇宙黨建解決方案

元宇宙文旅解決方案

元宇宙展廳解決方案

元宇宙行業峰會解決方案

元宇宙營銷解決方案

元宇宙會展解決方案

元宇宙演藝節目解決方案

元宇宙博物館解決方案

元宇宙圖書館解決方案

元宇宙校園解決方案

元宇宙企業展廳解決方案

元宇宙藝術展解決方案

元宇宙電商解決方案

融媒體解決方案

ZAKER智慧云

媒體解決方案

黨建解決方案

公檢法解決方案

智慧交通解決方案

高校解決方案

AI視頻剪輯

AI視頻剪輯

AI智能客服

AI工具箱

AI寫稿助手

AI口語陪練

我的訂閱

可識別唇語，蘋果的新專利可能會解救頭戴設備

宙世代

一起剪

相關閱讀

截胡蘋果！真我P4系列官宣：鏡頭排布跟iPhone 17 Pro一樣

華為用5.5G打造萬人超大體育館：信號無死角 滿座可達600Mbps

兩家門店設計“撞臉” 名創優品被曝雇水軍指責泡泡瑪特

從LABUBU到WAKUKU，誰在顛覆潮玩經濟？

能裝3T照片的夸克，裝不下阿里的野心？

OpenAI推出GPT-5在華商標申請遇阻：等待駁回復審

你每月要花多少錢 網傳騰訊視頻VIP將漲價至38元 客服否認

《杭州市促進具身智能機器人產業發展條例（草案）》公開征求意見

只需一個Windows 11插件：任務欄就能顯示CPU、內存、網絡使用率等信息

英偉達第三次回應H20不存在后門！央媒靈魂拷問：請用進一步行動來印證

高盛：美國消費者或將承擔67%的關稅成本

AI浪潮下，具身智能的崛起與數據瓶頸

為應對AI能耗問題 微軟耗資17億美元買“糞便”埋地

拼多多一路向B

最新評論

三易生活

熱門推薦

熱門訂閱 換一批

星河商業觀察

華為用5.5G打造萬人超大體育館：信號無死角滿座可達600Mbps

你每月要花多少錢網傳騰訊視頻VIP將漲價至38元客服否認

為應對AI能耗問題微軟耗資17億美元買“糞便”埋地

熱門訂閱換一批