這段時間,有一款神秘 AI 硬件吊足了網(wǎng)友們的胃口——比肩 iPhone 和 MacBook 的使用場景和頻率,但不帶屏幕,又不是 AI 眼鏡、AI 耳機(jī)、AI pin、iPod ……它背后的老板還放言要「量產(chǎn) 1 億臺」。
OpenAI CEO 奧特曼和蘋果前首席設(shè)計官艾維聯(lián)創(chuàng)的 io 公司,究竟用 AI 搗鼓了什么「開辟新賽道的硬件設(shè)備」,好難猜啊!
于是,雖然奧特曼透露計劃明年末正式發(fā)布該產(chǎn)品,但現(xiàn)在已有不少 X 網(wǎng)友忍不住打起了 AI「猜」圖的主意。萬一它知道些「內(nèi)幕」呢,對吧?
目前市場上有關(guān) io 首款硬件設(shè)備細(xì)節(jié)的爆料,主要有以下幾點(diǎn):
無屏幕,通過內(nèi)置攝像頭和麥克風(fēng)實(shí)現(xiàn)外界環(huán)境交互
外形設(shè)計風(fēng)格類似 iPod Shuffle
未采用 AI 眼鏡、智能手機(jī)、耳機(jī)這幾種當(dāng)下流行的 AI 硬件形態(tài)
比 AI pin 大一些
有掛脖式設(shè)計
可以與智能手機(jī)、PC 聯(lián)動
話不多說,先來看看 AI 創(chuàng)作博主 Ben Geskin 在 X 上甩出的「io 產(chǎn)品圖」,有近 9000 人次的 X 網(wǎng)友前來圍觀。
由 OpenAI 的 ChatGPT 生成的「GPT 版 Apple Watch」:
由 xAI 的 Grok 生成的「便攜桌面版 AI 攝像頭」:
愛范兒把同一套「預(yù)測 io 產(chǎn)品圖」的提示詞,分別拋給了搭載 Imagen 4 的 Gemini、搭載 GPT-4o 的 ChatGPT 以及搭載 Grok-3 的 Grok,然后它們各自給出了如下模擬產(chǎn)品圖。
按照 Google 官方的說法,Imagen 4 能夠更清晰地呈現(xiàn)諸如皮膚、毛發(fā)、復(fù)雜紋理等圖像細(xì)節(jié)部分,也更擅長創(chuàng)作「照片級」、「寫實(shí)風(fēng)格」的 AI 圖像。同時,其宣稱 Imagen 4 所生成的 AI 圖像支持各種長寬比,且分辨率高達(dá) 2 K。
不過有一說一,Gemini 所設(shè)計的這款 io 產(chǎn)品「長得有點(diǎn)人山人海的」,越看越像 Apple Watch+AI pin+ 登山包掛繩的結(jié)合體……
另外,Gemini 還同時給出了能體現(xiàn)「io 新產(chǎn)品與智能手機(jī)、PC 設(shè)備隔空聯(lián)動」的示意圖。
雞蛋盒外印刷包裝上的英文內(nèi)容清晰、準(zhǔn)確、美觀:
據(jù) Google I/O 大會方面透露,Imagen 4 后續(xù)將推出一個快速版本,屆時其 AI 生圖速度將是上一代 Imagen 3 的 10 倍,讓我們一起拭目以待吧。
一位細(xì)節(jié)控的攝影師
如果說 prompt 關(guān)鍵詞還原度、畫面主體內(nèi)容完整度,現(xiàn)在市面上主流的文生圖模型都能做到「有鼻子有眼的了」——總體水平相差并不大。
因此,在圖像生成質(zhì)量這塊兒,Google 開始卷細(xì)節(jié)了,宣稱 Imagen 4 有「更細(xì)膩的色彩」和「更精致的細(xì)節(jié)」。這聽起來沒什么實(shí)感,還是得「用圖說話」。
基于同一套提示詞:
一只金毛狗在沙灘上找貝殼(a golden retriever finding shells on the beach)
愛范兒對比了 Imagen 4 模型、Imagen 4 上一代模型 Imagen 3,以及豆包 Seedream3.0 所給出的圖像效果。
并且,仔細(xì)看金毛狗的毛發(fā)似乎還被海水打濕了,一綹一綹的。
其實(shí)剛看到 Imagen 3 生成的杰作時,有點(diǎn)擔(dān)心 Imagen 4 會不會打不贏。
不過,后者確實(shí)也沒讓人失望,用實(shí)力演繹了什么叫做「盤順條亮」。
再者,從局部來看,金毛狗的毛發(fā)細(xì)節(jié)滿滿,不僅更有光澤、光影分布更勻稱,而且還原了蓬松感,看起來就很好擼。
另外還有一個細(xì)節(jié)處理也很亮眼,那便是狗子的眼神。圖像中金毛狗的眼神看向了沙灘上的貝殼海螺,對應(yīng)了 prompt 中的「正在找(finding)」。
作為一組對比參照,豆包的表現(xiàn)也很抗打。下圖雖然整體色彩偏暗,但畫面細(xì)節(jié)也十分豐富,例如海風(fēng)吹起的浪花激蕩、海風(fēng)吹動的狗毛根根分明、金毛刨出貝殼后爪子粘上了不少沙子……
而 Google 官方給出的示例中,Imagen 4 還能「細(xì)節(jié)控」到「指哪刻畫哪」。卡皮巴拉短而硬的皮毛、油畫的筆觸、泡泡的光影、水晶表層的構(gòu)造都可以準(zhǔn)確地捕捉到。
當(dāng)愛范兒向最新 Gemini 2.5 Flash 版本的 Gemini 提出,「設(shè)計一款帶電子屏的帆布包,有大中小型號」時,這位多模態(tài) AI 助手花費(fèi) 10 秒左右,便交出了如下設(shè)計圖。
而且值得一提的是,其外觀樣式設(shè)計整體線條流暢不生硬,還保留了一些「手繪」的感覺。
然后,愛范兒進(jìn)一步要求 Gemini 寫明電子屏帆布包的具體尺寸。從此次生成結(jié)果來看,其主要英文單詞和羅馬數(shù)字都較為清晰且拼寫準(zhǔn)確,但涉及英文單位、標(biāo)點(diǎn)符號的部分則會出現(xiàn)亂碼的情況。
不過,輪到相應(yīng)海報、邀請函的設(shè)計時,如果提示詞中有語義較為模糊的地方,Gemini 很大可能就會錯意了。
Gemini 先是根據(jù)電子屏帆布包「Canvas Connect」的產(chǎn)品設(shè)計圖,給出了左圖的產(chǎn)品海報。接下來,prompt 要求是讓它改一下海報的配色,主色調(diào)是棕色和綠色,其余部分不變。
然而,由于 prompt 中沒有寫明「帆布包」的配色不變,Gemini 更換海報底色時,把帆布包的配色也一并改了,如左圖所示。
而且,無論是電子屏的畫面,真人模特的動作、神態(tài),還是文字內(nèi)容,都無明顯改動。這個案例綜合反映出 Imagen 4 模型文生圖的可控性較強(qiáng),文字排版較為美觀,大體上可復(fù)用。
可惜的是,一些成段、成片的文字內(nèi)容,目前很大程度上還需要依賴精細(xì) prompt 來控制調(diào)試。
別急,Imagen 4 還有許多設(shè)計玩法等著一眾網(wǎng)友們?nèi)ヌ剿髂亍?/p>
愛范兒試了一下,發(fā)現(xiàn)它可以把海報中的真人模特,直接替換成發(fā)型、穿搭、動作都較為貼合的卡通人物形象,即上圖最右側(cè)那張海報。這也不失為懶得 P 圖美顏時的一種交圖思路。
不過,如果不提出具體要求,海報原有的排版也會隨之改變。這點(diǎn)目前需要在 prompt 的部分多花些功夫。
或者來一個「風(fēng)格活潑有趣」、「文本內(nèi)容雋永」、「適配社交媒體」的電子邀請函吧。