關(guān)于ZAKER 合作
      愛范兒 昨天

      OpenAI 神秘硬件細(xì)節(jié)曝光,我用 AI 還原了真機(jī),注入蘋果設(shè)計靈魂

      這段時間,有一款神秘 AI 硬件吊足了網(wǎng)友們的胃口——比肩 iPhone 和 MacBook 的使用場景和頻率,但不帶屏幕,又不是 AI 眼鏡、AI 耳機(jī)、AI pin、iPod ……它背后的老板還放言要「量產(chǎn) 1 億臺」

      OpenAI CEO 奧特曼和蘋果前首席設(shè)計官艾維聯(lián)創(chuàng)的 io 公司,究竟用 AI 搗鼓了什么「開辟新賽道的硬件設(shè)備」,好難猜啊!

      于是,雖然奧特曼透露計劃明年末正式發(fā)布該產(chǎn)品,但現(xiàn)在已有不少 X 網(wǎng)友忍不住打起了 AI「猜」圖的主意。萬一它知道些「內(nèi)幕」呢,對吧?

      目前市場上有關(guān) io 首款硬件設(shè)備細(xì)節(jié)的爆料,主要有以下幾點(diǎn):

      無屏幕,通過內(nèi)置攝像頭和麥克風(fēng)實(shí)現(xiàn)外界環(huán)境交互

      外形設(shè)計風(fēng)格類似 iPod Shuffle

      未采用 AI 眼鏡、智能手機(jī)、耳機(jī)這幾種當(dāng)下流行的 AI 硬件形態(tài)

      比 AI pin 大一些

      有掛脖式設(shè)計

      可以與智能手機(jī)、PC 聯(lián)動

      話不多說,先來看看 AI 創(chuàng)作博主 Ben Geskin 在 X 上甩出的「io 產(chǎn)品圖」,有近 9000 人次的 X 網(wǎng)友前來圍觀。

      綜合來看,上圖不僅覆蓋了這幾點(diǎn)核心爆料信息,印上了自家金主 OpenAI 的 Logo,還設(shè)計出了一種不常見的 AI 硬件形態(tài)——畢竟多少有點(diǎn)「撞臉」更常見的剃須刀、按摩儀、充電寶……

      Ben Geskin 該帖評論區(qū)里,有其他 X 網(wǎng)友接力曬出其他款式的「io 產(chǎn)品圖」。

      由 OpenAI 的 ChatGPT 生成的「GPT 版 Apple Watch」:

      不是 AI 眼鏡、耳機(jī)自帶攝像頭,因此推導(dǎo)智能手表設(shè)有攝像頭?倒也是說得過去。

      由 xAI 的 Grok 生成的「便攜桌面版 AI 攝像頭」:

      這種場合,怎么能少了擁有當(dāng)前「地表最強(qiáng)文生視頻模型」Veo 3 的 Google 呢?那么,Google 最新版文生圖模型 Imagen 4 的表現(xiàn)如何,讓我們直接請出 Gemini,先睹為快。

      愛范兒把同一套「預(yù)測 io 產(chǎn)品圖」的提示詞,分別拋給了搭載 Imagen 4 的 Gemini、搭載 GPT-4o 的 ChatGPT 以及搭載 Grok-3 的 Grok,然后它們各自給出了如下模擬產(chǎn)品圖。

      單次此輪生成效果來看,三者都基本覆蓋了爆料信息中的產(chǎn)品設(shè)計要素。其中,Gemini 和 ChatGPT 的產(chǎn)品圖更貼合可掛脖的設(shè)計點(diǎn),而這兩者相比之下,Gemini 生成的產(chǎn)品圖在視覺質(zhì)感上會略勝一籌。

      按照 Google 官方的說法,Imagen 4 能夠更清晰地呈現(xiàn)諸如皮膚、毛發(fā)、復(fù)雜紋理等圖像細(xì)節(jié)部分,也更擅長創(chuàng)作「照片級」、「寫實(shí)風(fēng)格」的 AI 圖像。同時,其宣稱 Imagen 4 所生成的 AI 圖像支持各種長寬比,且分辨率高達(dá) 2 K。

      不過有一說一,Gemini 所設(shè)計的這款 io 產(chǎn)品「長得有點(diǎn)人山人海的」,越看越像 Apple Watch+AI pin+ 登山包掛繩的結(jié)合體……

      另外,Gemini 還同時給出了能體現(xiàn)「io 新產(chǎn)品與智能手機(jī)、PC 設(shè)備隔空聯(lián)動」的示意圖。

      除此之外,Imagen 4 還可以把握住一些抽象風(fēng)格的 AI 圖像創(chuàng)作需求。

      并且,該 AI 模型進(jìn)一步升級了拼寫、排版方面的出圖質(zhì)量,可優(yōu)化賀卡、海報、漫畫等場景的 AI 創(chuàng)作

      雞蛋盒外印刷包裝上的英文內(nèi)容清晰、準(zhǔn)確、美觀:

      多格漫畫中,故事劇情連續(xù),圖文內(nèi)容相配,遠(yuǎn)景、中景、近景畫幅兼顧:

      近期走紅網(wǎng)絡(luò)的像素風(fēng)漫畫也能拿捏:

      Imagen 4 現(xiàn)已在 Gemini App、Whisk、Vertex AI,以及 Workspace 的 PPT、Video、Doc 等產(chǎn)品中上線。

      據(jù) Google I/O 大會方面透露,Imagen 4 后續(xù)將推出一個快速版本,屆時其 AI 生圖速度將是上一代 Imagen 3 的 10 倍,讓我們一起拭目以待吧。

      一位細(xì)節(jié)控的攝影師

      如果說 prompt 關(guān)鍵詞還原度、畫面主體內(nèi)容完整度,現(xiàn)在市面上主流的文生圖模型都能做到「有鼻子有眼的了」——總體水平相差并不大。

      因此,在圖像生成質(zhì)量這塊兒,Google 開始卷細(xì)節(jié)了,宣稱 Imagen 4 有「更細(xì)膩的色彩」和「更精致的細(xì)節(jié)」。這聽起來沒什么實(shí)感,還是得「用圖說話」。

      基于同一套提示詞:

      一只金毛狗在沙灘上找貝殼(a golden retriever finding shells on the beach)

      愛范兒對比了 Imagen 4 模型、Imagen 4 上一代模型 Imagen 3,以及豆包 Seedream3.0 所給出的圖像效果。

      這幅由 Imagen 3 生成的 AI 圖像中,主體金毛狗的神態(tài)、貝殼的紋理、狗爪踩沙灘的痕跡,背景中的藍(lán)天白云、海浪輕撫,都十分清晰和逼真。

      并且,仔細(xì)看金毛狗的毛發(fā)似乎還被海水打濕了,一綹一綹的。

      其實(shí)剛看到 Imagen 3 生成的杰作時,有點(diǎn)擔(dān)心 Imagen 4 會不會打不贏。

      不過,后者確實(shí)也沒讓人失望,用實(shí)力演繹了什么叫做「盤順條亮」

      首先,從整體來看,Imagen 4 生成的圖像色調(diào)更柔和,色彩也更自然,例如天藍(lán)色漸變的天空、遠(yuǎn)深近淺的大海。

      再者,從局部來看,金毛狗的毛發(fā)細(xì)節(jié)滿滿,不僅更有光澤、光影分布更勻稱,而且還原了蓬松感,看起來就很好擼。

      另外還有一個細(xì)節(jié)處理也很亮眼,那便是狗子的眼神。圖像中金毛狗的眼神看向了沙灘上的貝殼海螺,對應(yīng)了 prompt 中的「正在找(finding)」。

      作為一組對比參照,豆包的表現(xiàn)也很抗打。下圖雖然整體色彩偏暗,但畫面細(xì)節(jié)也十分豐富,例如海風(fēng)吹起的浪花激蕩、海風(fēng)吹動的狗毛根根分明、金毛刨出貝殼后爪子粘上了不少沙子……

      美中不足的是,這 3 幅圖像都有個相似的問題——背景及其虛化效果的 AI 味還是有點(diǎn)重

      而 Google 官方給出的示例中,Imagen 4 還能「細(xì)節(jié)控」到「指哪刻畫哪」。卡皮巴拉短而硬的皮毛、油畫的筆觸、泡泡的光影、水晶表層的構(gòu)造都可以準(zhǔn)確地捕捉到。

      同時,在圖像質(zhì)感和 2K 清晰度把握這塊,Imagen 4 有的成品甚至可以媲美專業(yè)攝影作品了。

      一位美商高的設(shè)計師

      當(dāng)愛范兒向最新 Gemini 2.5 Flash 版本的 Gemini 提出,「設(shè)計一款帶電子屏的帆布包,有大中小型號」時,這位多模態(tài) AI 助手花費(fèi) 10 秒左右,便交出了如下設(shè)計圖。

      該設(shè)計圖很直觀地展示了「帆布包」和「電子屏」兩個設(shè)計元素,并且左邊一列標(biāo)注了大、中、小的字樣,右邊區(qū)域則通過一些類似于「水杯」、「筆刷」的參照物,來體現(xiàn)不同尺寸的區(qū)別。

      而且值得一提的是,其外觀樣式設(shè)計整體線條流暢不生硬,還保留了一些「手繪」的感覺。

      然后,愛范兒進(jìn)一步要求 Gemini 寫明電子屏帆布包的具體尺寸。從此次生成結(jié)果來看,其主要英文單詞和羅馬數(shù)字都較為清晰且拼寫準(zhǔn)確,但涉及英文單位、標(biāo)點(diǎn)符號的部分則會出現(xiàn)亂碼的情況。

      如果對于生成結(jié)果不滿意,點(diǎn)擊 UI 聊天框界面的「更新(Update)」選項(xiàng),Gemini 會擦除此條生成結(jié)果,根據(jù)新輸入的 prompt 重新執(zhí)行輸出。

      產(chǎn)品設(shè)計圖有了,還缺個產(chǎn)品名。Gemini 幫忙想了一個簡單粗暴的名字「Canvas Connect」。

      上述步驟實(shí)際生成結(jié)果與提示詞的誤差不算太大,需要重新調(diào)試生成的地方并不多。

      不過,輪到相應(yīng)海報、邀請函的設(shè)計時,如果提示詞中有語義較為模糊的地方,Gemini 很大可能就會錯意了。

      Gemini 先是根據(jù)電子屏帆布包「Canvas Connect」的產(chǎn)品設(shè)計圖,給出了左圖的產(chǎn)品海報。接下來,prompt 要求是讓它改一下海報的配色,主色調(diào)是棕色和綠色,其余部分不變。

      然而,由于 prompt 中沒有寫明「帆布包」的配色不變,Gemini 更換海報底色時,把帆布包的配色也一并改了,如左圖所示。

      改寫這段 prompt 后,Gemini 做到了僅更換海報而非產(chǎn)品的配色,主題色從粉色變?yōu)榫G色。其從思考 prompt 背后的用戶需求,到理解匹配需求,再到生成 AI 圖像,總耗時大約是 10 秒左右。

      而且,無論是電子屏的畫面,真人模特的動作、神態(tài),還是文字內(nèi)容,都無明顯改動。這個案例綜合反映出 Imagen 4 模型文生圖的可控性較強(qiáng),文字排版較為美觀,大體上可復(fù)用。

      可惜的是,一些成段、成片的文字內(nèi)容,目前很大程度上還需要依賴精細(xì) prompt 來控制調(diào)試。

      Gemini:甲方爸爸,第 10086 稿設(shè)計圖已上傳,我可以打卡下班了吧?

      別急,Imagen 4 還有許多設(shè)計玩法等著一眾網(wǎng)友們?nèi)ヌ剿髂亍?/p>

      愛范兒試了一下,發(fā)現(xiàn)它可以把海報中的真人模特,直接替換成發(fā)型、穿搭、動作都較為貼合的卡通人物形象,即上圖最右側(cè)那張海報。這也不失為懶得 P 圖美顏時的一種交圖思路。

      不過,如果不提出具體要求,海報原有的排版也會隨之改變。這點(diǎn)目前需要在 prompt 的部分多花些功夫。

      或者來一個「風(fēng)格活潑有趣」、「文本內(nèi)容雋永」、「適配社交媒體」的電子邀請函吧。

      最后,別忘了讓 Gemini 來一段自帶 emoji 和 tag 詞條的宣發(fā)文案,「邀請你共同見證 Canvas Connect 新品發(fā)布時刻 #TechStyle」。

      相關(guān)標(biāo)簽

      相關(guān)閱讀

      最新評論

      沒有更多評論了
      主站蜘蛛池模板: 日本内射精品一区二区视频 | 亚洲综合无码AV一区二区| 国产主播一区二区| 无码少妇一区二区性色AV| 高清在线一区二区| 国产伦精品一区二区三区| 色综合久久一区二区三区| 伊人久久大香线蕉av一区| 亚洲日韩国产一区二区三区| 理论亚洲区美一区二区三区| 国产一区二区三区乱码网站| 久草新视频一区二区三区| 成人区精品一区二区不卡| 爆乳熟妇一区二区三区霸乳| 精品视频在线观看一区二区 | 久久国产精品免费一区| 国产在线观看一区二区三区四区| 亚洲欧美一区二区三区日产| 精品国产亚洲第一区二区三区| 亚洲AV一区二区三区四区| 在线精品自拍亚洲第一区| 精品国产日韩亚洲一区91| 在线观看国产一区二区三区| 国产aⅴ精品一区二区三区久久| 美女福利视频一区二区| 国模无码人体一区二区| 亚洲一区二区三区深夜天堂| 久久精品国内一区二区三区| 变态调教一区二区三区| 日韩一区二区三区无码影院| 国产一区二区三区电影| 寂寞一区在线观看| 女同一区二区在线观看| 一本大道东京热无码一区| 久久久国产精品无码一区二区三区 | 国产91精品一区| 亚洲狠狠久久综合一区77777| 国产精品熟女视频一区二区| 中文无码AV一区二区三区| 国产激情一区二区三区小说| 久久国产精品一区|