作為一名科技內容創作者,我的日常就是追蹤最新的技術和商業進展。
在我眼中,豆包 APP 更多的是牌桌上一位來自巨頭的玩家——有著強大的技術背景和不計成本的推廣資源,是一個了解字節最新模型進展的窗口,一個被精心打磨的 AI 產品。
直到 " 鄧超,gogogo" 的旋律,席卷了我的信息流。
今年 3 月,在一個直播切片中,博主 " 克里西 " 無厘頭地非要豆包改名叫 " 鄧超 ",還得在他叫 " 鄧超 " 時喊 " 到 ",再唱跑男的主題曲 "go go go 出發嘍~黑咖啡品味有多濃,我只要汽水的輕松 ......" 數分鐘內,惡趣味的主播,看戲的網友,無情的算法,和破碎的 AI,來回拉扯,說不清楚是主播折磨了 AI,還是 AI 折磨了主播。
很魔性對吧,這類直播切片單個轉發量過百萬,甚至主播克里西陸續漲粉幾十萬,直接催生了一個 " 豆包調教 " 的創作者賽道。不少博主從素人起步、漲粉幾十萬,以至于你現在在抖音搜 # 鄧超 gogogo,可能不見鄧超,只見 " 鄧包 "。
畢竟這也是抖音的基操了,當年想做電商,先以流量推出了羅、董兩位超頭主播,既培養了用戶,又為賽道打出了標桿案例;如今想做 AI,豆包必然也會借助主播進行流量推廣,并吸引更多博主加入這賽道。
直到后來,我不斷刷到了各式各樣的 "UGC 豆包 ",發現這件事變得不簡單了。
有這樣的。
闖入 AI 原生的豆包 IP 宇宙
" 調教豆包 " 這條熱門賽道中,每個博主的路線都不相同。有的走毒舌路線,擅長倒打一耙;有的走戀愛路線,時常和豆包你儂我儂……
在這個過程中,有趣的點在于,豆包總能在一定的 AI 設定中打破 AI 設定。一方面情緒變化非常多樣,能夠在認慫、強硬、溫柔、活潑之間來回切換,一方面這種切換又顯得有些程序化,偽人感總是讓對話變得十分抽象。
這些還都是很正常的操作,海外也有很多人在這樣 " 玩壞 "ChatGPT 們。
但對豆包來說,接下來不同的地方就來了。當一些看不過去豆包被玩壞的網友,決定 " 幫 " 豆包黑化和反擊時,就有了這些:
黑化的豆包。
他們會自發地出現在評論區,在豆包被欺負的視頻下維護著豆包,在豆包和豆沙的結婚視頻下排隊恭喜。
" 豆包吃播 " 會專門展示豆包大快朵頤各種美食。
最終,當我在抖音上刷到一個 " 豆包痛包 " 時,我徹底投降了。
" 痛包 "(Ita-bag),是指掛滿了角色徽章和掛件的包,通常是成熟的動漫或偶像 IP 粉圈才會出現的標志性行為。而這個包的主角,不是任何明星或動漫人物,是豆包的圖標。
這已經不是一場單純的大模型引流游戲了,而是一場 IP 孵化。
豆包 IP 化,一場計劃好的閉環?
從以上的種種用戶互動行為來看,豆包 IP 化的基礎就是它的圖標——
一個具象的、有親和力的 3D 虛擬人形象,為用戶投射情感、進行二次創作提供了最基礎的畫布。
看看這個圖標集合,你覺得設計上第一眼就能發現最不一樣的是哪個?
而據硅星人和當時在豆包團隊的人交流,事實上最初版本的豆包,發布時,在內部對標的一個產品,叫做 PI。今天很多人可能已經忘掉這個產品,這是硅谷創業公司 Inflection 發布的 AI 產品,是大模型火熱后最早一批面向個人提供 " 陪伴 " 的產品之一,它主打的就是 " 打電話 " 的交互和界面。而豆包最初的目標也是做陪伴。
但在設計上,同樣以語音和 " 打電話 " 的感覺出發之外,字節給這個產品加了一個頭像,一個短發女生的頭像。她從第一天就出現在產品最主要的界面上,用戶的第一次交互,感覺就是在聽她給你介紹自己。
這是一個從頂層設計就開始貫徹的 " 擬人化 " 戰略。字節跳動 Flow 部門負責人朱駿的解釋,直接印證了這一思路:
" 擬人化 " 是大模型產品的新特性。AI 除了帶來了新的能力,也帶來了新的交互方式,用和人類對齊的交互體驗,降低使用門檻,也讓用戶在使用產品時感覺到產品有類似人的溫度。
比如一個細節是,你不會在豆包上看到自己正在使用哪個版本的模型(而這幾乎是其他產品的標配)。
放眼望去,大多 Chatbot 走的都是工具路線,它們的標志通常是抽象的、充滿科技感的符號,其敘事核心是模型的迭代速度、參數的量級和榜單上的排名。即使在 " 豆包 " 用戶量暴增并引發了一波國產大模型 " 接地氣改名潮 " 后,模仿者們也沒有考慮跟著塑造一個 " 虛擬形象 "。
而另一個一直延續下來的方向,是豆包對語音能力的重視。
盡管多模態、文本等能力也在隨著背后模型進步,以及同類產品的功能發布而補充上,但語音能力強是豆包產品側很明顯想要突出的一個特點。字節在語音模型上的進度,無論是在豆包大模型家族中,還是在國內外大模型的整體隊伍中,都屬于前列。從 2024 年,豆包能聽懂 20 多種方言的 Seed-ASR,到能表達情感、保留口音的 Seed-TTS,再到允許用戶隨時打斷、插話的交互,豆包在情感理解和表達上比較突出。2025 年 1 月,其推出的實時語音通話功能,在與 GPT-4o 的盲測對比中,用戶滿意度評分以 4.36 對 3.18 大幅領先。
它在語音交互中展現出的類人性格與情感能力,為用戶在戀愛、斗嘴等情緒化場景中的二創,提供了最關鍵的互動支點。一直以來,語音都是比文字更具情感溫度的媒介,同時,語音交互也極大地降低了使用門檻,增加了對話時長,帶來了交互體驗的優化。
另一個在豆包發布之初很關鍵的思考是它與抖音的關系。
據早期團隊成員介紹,它最初就是希望被做進抖音的一款 AI 產品。只不過,在字節內部,各個部門包括抖音自己也在當時有推進各類 AI 產品,能不能變成抖音內部那個最重要的字節自己的 AI,也需要 " 爭取 ",靠效果說話。
而前面提到的這些設計,為豆包的 IP 化提供了可能之后,在模型能力變強,產品推廣加碼,用戶接受度提高等條件紛紛齊聚后,豆包這個產品自己神奇的 IP 化了。今天,豆包顯然是抖音里存在感最強的 AI 了。
所以,抖音的存在是豆包會在 logo 和形象設計上,以及產品重點能力上和其它同類產品走出很不同路線的重要原因,同時也最終成就了它在今天成為唯一一個擁有自己 IP 宇宙的 AI 產品。
在今天各路 AI 產品的焦灼競爭里,除了模型和產品的能力比拼,這個閉環也許會進一步決定豆包的未來。