最近 AI 界的大新聞是 GPT-5 和谷歌的世界模型 Genie 3。然而,在無人在意的角落里,微軟悄悄把 Edge 進化成了了 AI 瀏覽器。
上一次聽到 Edge 的消息還是 IE 正式關停的時候,Edge 作為 IE 的繼任者難免會被拿出來討論,通常沒有什么好話。
再上一次是 Edge 加入 sidebar 功能的時候,罕見地搶了一批 Chrome 的用戶。
時至今日,Edge 的風評似乎沒有比曾經的 IE 好到哪里去。
都 2025 年了,居然還有瀏覽器的首頁充斥著閃爍的 MSN 資訊、天氣卡片、股市小窗口,以及永遠關不掉的「熱門故事」。與此同時,微軟不斷地在給 Edge 加入「無用的新功能」,讓系統變得越來越臃腫。
但如果你愿意再給 Edge 一次機會的話,一鍵開啟 Copilot 模式,Edge 就變成了神似 Dia 的樣子:
干凈得不像微軟出品 。
欄目作者召集
極客公園的新欄目「AI 上新」,將帶大家體驗最新的 AI 應用和硬件,讓你成為 AI 時代「最靚的仔」!
現在,我們也向所有喜歡嘗鮮和體驗 AI 的同學發出召集,只要你發現并體驗了新的 AI 應用或者功能,按照格式(參考案例: AI 上新|不會用 PS 的我,卻敢去小紅書上接「設計單」了)向欄目投稿,在極客公園公眾號發布,不僅能獲得相應稿費,且會為你「報銷」AI 應用的訂閱費用。
同時,優秀作者還有機會進入極客公園 AI 體驗群 ,獲得最新 AI 應用和工具的內測資格,參加極客公園專屬相關 AI 活動,和 AI 應用創始人一對一溝通。
AGI 太久,只爭朝夕,讓一部分人先 AI 起來吧!投稿、進群請掃描下方二維碼添加極客小助手微信
01
微軟,再造一遍瀏覽器
要讓 Edge 變成 AI 瀏覽器,除了要更新到最新版本之外,還需要掌握一些小小的「魔法」。然后在設置的「AI 創新」一欄,就可以開啟 Copilot 模式。
Copilot 模式的形態介于谷歌在 Chrome 有限 Gemini 集成,和 Manus 這樣完全的 AI 瀏覽器之間。
在 Copilot 模式下,首頁就變成了一個對話框,你可以直接用搜索引擎搜索、詢問 Copilot 或者讓它深度思考。這一點和其他主流的 AI 瀏覽器差別不大。
Copilot 的第二個入口在地址欄左側,一顆小藥丸形狀的圖標,單擊就可以呼出,或者讓它固定在右側。
官方說它可以「感知所有標簽頁」。于是我打開了一篇論文、一份財報,以及一個亞馬遜相機的搜索頁面。隨后我告訴 Copilot:「幫我總結特斯拉的財報,還有這篇論文的大綱,以及我想選購一款性價比高的相機。」
一分鐘后,Copilot 分別概括了財報和論文,附上了各個價位的最佳相機,并暗示了我給出的需求并不精準 。
這一瞬間,我確實有一種錯覺,有另外一顆大腦正在替我工作。
這種總結能力也能遷移到視頻上。當你在 Edge 中打開 YouTube 視頻時,只要呼出 Copilot 并指示「總結視頻」,它就會給出總結。
美中不足的是,Copilot 的這種感知并非全自動的,需要你手動 @ 標簽欄,它才能替你工作 。
不過,最能讓我產生「幻覺」,是 Copilot Vision。這是一個交互方式上非常新鮮的功能,Copilot 可以直接看到你的屏幕,并以此為基礎和你用語音交互,就像你和朋友共享屏幕一樣。
例如在一個典型的購物場景,Copilot Vission 就可以直接看到屏幕上的備選產品,并給出選購建議。打開 Copilot Vission,一個帶著濃郁廣普口音的中年女聲就會很熱情地和你打招呼:「嗨~我可以看到你屏幕啦!」,很像在 Panda Express 或者 Jade Dragon Restaurant 碰到的那種廣東阿姨。
不得不說,現在的 AI 語音已經做得非常自然,已經不太分辨得出 AI 味。碰到 AI 驗證的時候,它還會主動安慰你:
「是不是挺煩人的」。
這我還是第一次在 AI 身上感受到了人味,語音交互帶來的情感濃度的確要比文字強很多 。
但是就功能性來說,Vission 還算不上實用。一方面是它的圖像識別速度跟不上我的瀏覽速度。另一方面,它在圖像和語音識別的準確率上也有待提升。例如它會把「IPX6」識別成「IPX4」,我用語音糾正了它,它馬上道歉,但是聽成了「IPX7」。
目前的 Vision 有一點像家里的女性長輩,不懂科技,聊天信息密度不高,但是非常包容,情緒價值拉滿 。
以上就是 Edge 最主要的功能了。還有一些功能微軟表示正在開發中,例如 Agent 能力、智能標簽分組或者是動態的 AI 助手。
實際上,很多功能微軟已經開發完畢、處于測試階段了,出于大公司的保守,它沒有集成到 Edge 中。但是沒有關系,進入單獨 Copilot 主頁,打開「實驗室」,你可以看到,微軟確實在開發一些好玩的東西。
Copilot 3D,可以一鍵將圖像轉換為 3D 模型。上傳自己的照片,你就可以輕松得到一個「逼真」的 3D 頭像。
Copilot 游戲,體驗原汁原味的上古 FPS 大作《雷神之錘 2》,并且每一幀都是由 AI 實時生成的,同時畫面非常卡頓。
Copilot Actions 是微軟最接近「Agent」野心的功能。我試著讓它預訂了一張 8 月 10 號從上海飛北京的機票。Copilot 大概跑了 20 分鐘,完成了點點鼠標一分鐘就能做完的工作。
但奇妙之處在于: 它允許我隨時「搶方向盤」。
當它差點給我選了個中轉航班時,我可以隨時接管瀏覽器權限,把航線拉回直飛。這種「人機共駕」的體驗,比那些一路黑箱跑到底的競品要安心得多。
實際上,這樣操作之后,跑任務的效率會大大提升,最終的出品也可控得多。我覺得這才是目前 Agent 最實用、最可靠的人機協作形態。正如它的名字 Copilot 一樣,這是一種副駕駛員的哲學。
02
微軟的歷史包袱
總的來說,Edge 瀏覽器的 AI 進化給到了不錯的體驗,基礎功能不遜色于主流工具的同時,也有一些自身的亮點,例如標簽感知和 Vision。
但與此同時,這還不是一款可以成熟到覆蓋所有 Edge 用戶的產品。很多宣傳的功能并沒有完全兌現,各個功能的入口也分散在四處。最明顯的就是,地址欄旁 Copilot 入口支持附件上傳和語音交互,而主入口的 Copilot 反而不支持這些功能。
更大的割裂感在于 Edge 瀏覽器本身和 Copilot 模式上。
單就視覺而言,傳統功能區延續了 Win11 的 Fluent 圓角玻璃;AI 面板則是現代極簡的風格,仿佛兩代人共用一張辦公桌。
更重要的功能性上,Edge 團隊背負著沉重的歷史包袱:兼容模式、IE 模式、企業策略、臃腫的 PDF 閱讀器……而 Copilot 團隊顯然想再造一個「AI 優先」的物種。兩股力量在同一具身體里拉扯,導致入口分散、菜單嵌套、選項重名。
于是,Edge 就像是一座仍在施工的跨河大橋:橋這頭,是微軟多年堆出來的舊公路,坑洼卻熟悉;橋那頭,是閃著霓虹的 AI 新大陸,誘人卻斷續。
用戶站在橋中間,有一些迷茫。