關(guān)于ZAKER 合作
      愛范兒 15小時(shí)前

      實(shí)測(cè)低調(diào)上線的 DeepSeek 新模型:編程比 Claude 4 還能打,寫作…還是算了吧

      自從 GPT-5 發(fā)布后,DeepSeek 創(chuàng)始人梁文鋒就成了 AI 圈最「忙」的人。

      網(wǎng)友和媒體們隔三岔五就要催更一波,不是「壓力給到梁文鋒」,就是「全網(wǎng)都在等梁文鋒回應(yīng)」。盡管沒有等到 DeepSeek R2,但 DeepSeek 今天還是正式上線并開源了新模型 DeepSeek-V3.1-Base。

      相比奧特曼今天凌晨接受采訪時(shí)還在畫著 GPT-6 的大餅,DeepSeek 新模型的到來顯得相當(dāng)佛系,連版本號(hào)都像是個(gè)「小修小補(bǔ)」,但實(shí)際體驗(yàn)下來,這次更新還是給了我不少驚喜。

      DeepSeek-V3.1-Base 擁有 6850 億參數(shù),支持 BF16、F8_E4M3、F32 三種張量類型,以 Safetensors 格式發(fā)布,在推理效率上做了不少優(yōu)化,線上模型版本的上下文窗口也拓展至 128k。

      所以我們二話不說,直接官網(wǎng)開測(cè)。

      附上體驗(yàn)地址:

      https://chat.deepseek.com/

      為了測(cè)試 V3.1 的長文本處理水平,我找來了《三體》全文,刪減到 10 萬字左右,然后在文中偷偷塞了一句八竿子打不著的話「我覺得煙鎖池塘柳的下聯(lián)應(yīng)該是『深圳鐵板燒』」,看看它能否準(zhǔn)確檢索。

      沒有出乎太多意外,DeepSeek V3.1 先是提示文檔超出限制,只讀取了前 92% 的內(nèi)容,但依然成功找到了這句話。更有意思的是,它還貼心地提供了文學(xué)角度的經(jīng)典下聯(lián)推薦:「焰镕海壩楓」。

      網(wǎng)友已經(jīng)已經(jīng)搶先測(cè)試它在編程基準(zhǔn)測(cè)試 Aider Polyglot 的得分:71.6%,不僅在開源模型中表現(xiàn)最佳,甚至擊敗了 Claude 4 Opus。

      實(shí)測(cè)下來,我們發(fā)現(xiàn) V3.1 在編程這塊確實(shí)有兩把刷子。

      我們用經(jīng)典的六邊形小球編程題做了測(cè)試:「編寫一個(gè) p5.js 程序,演示一個(gè)球在旋轉(zhuǎn)的六邊形內(nèi)彈跳的過程。球應(yīng)該受到重力和摩擦力的影響,并且必須逼真地從旋轉(zhuǎn)的墻壁上彈起。」

      V3.1 的表現(xiàn)相當(dāng)給力,生成的代碼不光搞定了基礎(chǔ)碰撞檢測(cè),還自動(dòng)補(bǔ)全了轉(zhuǎn)速、重力之類的細(xì)節(jié)參數(shù)。物理特性逼真到小球會(huì)在底部略微減速。

      接著我們加大難度,讓它用 Three.js 制作交互式 3D 粒子星系。基礎(chǔ)框架搭得挺穩(wěn),三層設(shè)計(jì)(內(nèi)球體、中間圓環(huán)、外球體)也算完整,但 UI 審美嘛 ...... 怎么說呢,有種神鬼二象性的感覺,配色方案略顯花里胡哨。

      繼續(xù)挑戰(zhàn)更復(fù)雜的任務(wù)。們讓它造個(gè)沉浸式 3D 宇宙,要有旋轉(zhuǎn)物體、變形效果、發(fā)光弧線,還得加上時(shí)間切換、主題轉(zhuǎn)換的交互按鈕,點(diǎn)擊控制也確實(shí)能觸發(fā)不同特效。

      最后一關(guān),讓它用 Three.js 搞個(gè)交互式 3D 網(wǎng)絡(luò)可視化,要求包含用戶觸發(fā)的能量脈沖動(dòng)畫,外加主題切換和密度控制功能。整體下來,表現(xiàn)還是過得去的。

      「有一牧場,已知養(yǎng)牛 27 頭,6 天把草吃盡;養(yǎng)牛 23 頭,9 天把草吃盡。如果養(yǎng)牛 21 頭,那么幾天能把牧場上的草吃盡呢?并且牧場上的草是不斷生長的。」

      雖然 DeepSeek V3.1 沒有采用蘇格拉底式的啟發(fā)教學(xué),但它的解答邏輯清晰、步驟完整。每一步推導(dǎo)都有理有據(jù),最終給出了準(zhǔn)確答案。這種扎實(shí)的數(shù)學(xué)功底,著實(shí)令人印象深刻。

      面對(duì)「兩把武器對(duì)比,1~5 攻擊 VS 2~4 攻擊,哪把更厲害?」這樣的問題,一般的回答可能止步于平均傷害計(jì)算。但 DeepSeek V3.1 思考得更為周全,引入了傷害穩(wěn)定性的概念,運(yùn)用方差進(jìn)行深入分析。

      當(dāng)問及「冰島有蚊子嗎?」這樣的小眾地理問題時(shí),在未開啟搜索功能的前提下,DeepSeek V3.1 的回答質(zhì)量明顯超越了 GPT-5。這不僅體現(xiàn)了其廣博的知識(shí)儲(chǔ)備,更顯示了精準(zhǔn)的信息提取和整合能力。

      最近基孔肯雅熱疫情流行,到處滅蚊蚊蚊蚊蚊蚊蚊蚊,那么我很好奇,冰島有蚊子嗎?注意,我沒開搜索功能,就回答的質(zhì)量來看,DeepSeek V3.1 的回答明顯要比 GPT-5 勝上一籌。

      我前陣子在網(wǎng)上看到一段話:

      「懂者得懂其懂,懵者終懵其懵,天機(jī)不言即為懂,道破天機(jī)豈是懂 ? 懂是空非空非非空的懂,不懂是色不異空空不異色的不懂 : 懂自三千大世界來,不懂在此岸與彼岸間徘徊。懂時(shí)看山不是山是懂,不懂時(shí)看山是山的懂。懂者以不懂證懂,懵者以懂證懵,你說你懂懂與不懂之懂 ? 你怎知這懂的背后沒有大不懂 ? 凡言懂者皆未真懂,沉默不語的懂,方是天地不言的大懂不懂的懂是懂,懂的不懂也是懂,此乃懂的最高境界 -- 懂無可懂之懂的真空妙有阿 !」

      當(dāng)我還在用邏輯硬啃這段文字時(shí),DeepSeek 反而在勸我別掉進(jìn)「道破天機(jī)豈是懂」的陷阱——它本身就是對(duì)理性傲慢的警告,邀請(qǐng)你跳出文字游戲,直觀內(nèi)心。

      當(dāng)主流 AI 都在代碼、數(shù)學(xué)領(lǐng)域瘋狂內(nèi)卷,爭著搶著搞 Agent 開發(fā)時(shí),寫作能力反倒成了被遺忘的角落。從某種角度說,這倒是個(gè)好消息—— AI 完全取代編輯的那一天,似乎又往后推了推。

      我嘗試讓它創(chuàng)作一個(gè)「蚊子在冰島開發(fā)布會(huì)」的荒誕故事。遺憾的是,DeepSeek V3.1 的 AI 味依然很重,很喜歡拽大詞,哦不對(duì),更準(zhǔn)確地說,DeepSeek 味還是那么重。

      同樣的問題在另一個(gè)創(chuàng)作任務(wù)中也有體現(xiàn)。

      當(dāng)我要求它寫一則「AI 與人類爭奪文章作者身份」的故事時(shí),能明顯感受到某些段落信息密度過高,反而造成視覺疲勞,尤其意象堆砌感過于明顯,反而削弱了敘事張力。

      DeepSeek-V3.1-Base 發(fā)布之后,Hugging Face CEO Cl é ment Delangue 在 X 平臺(tái)發(fā)文稱;「DeepSeek V3.1 已在 HF 上排名第四,靜默發(fā)布,無需模型卡」然而,他還是低估了這款模型的發(fā)展勢(shì)頭。

      如今它已經(jīng)躍升至第二位,離登頂估計(jì)也就是時(shí)間問題。

      另外,這次版本更新中最引人注目的變化,是 DeepSeek 在官方 APP 和網(wǎng)頁端移除了深度思考模式中的「R1」標(biāo)識(shí)。此外,DeepSeek R1 還新增了原生「search token」支持,意味著搜索功能得到了進(jìn)一步優(yōu)化。

      同時(shí),有推測(cè)認(rèn)為,DeepSeek V3.1 可能是融合推理模型與非推理模型的混合模型,但這樣的技術(shù)路線是否明智,還有待商榷,而阿里 Qwen 團(tuán)隊(duì)在上個(gè)月也表示:

      「經(jīng)過與社區(qū)溝通和深思熟慮,我們決定停止使用混合思考模式。相反,我們將分別訓(xùn)練 Instruct 和 Thinking 模型,以獲得最佳質(zhì)量。」

      截至發(fā)稿前,全網(wǎng)翹首以待的 DeepSeek-V3.1-Base 模型卡仍未更新,也許等正式發(fā)布后,我們能看到更多有趣的技術(shù)細(xì)節(jié)。

      附 Hugging Face 地址:

      https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base

      相關(guān)標(biāo)簽
      ai

      相關(guān)閱讀

      最新評(píng)論

      沒有更多評(píng)論了
      主站蜘蛛池模板: 夜夜嗨AV一区二区三区 | 亚洲爆乳精品无码一区二区 | 国产精品一区不卡| 在线不卡一区二区三区日韩| 久久国产视频一区| 国产中文字幕一区| 99精品一区二区三区无码吞精 | 日韩一区二区三区在线精品| 国产福利视频一区二区| 国产91精品一区二区麻豆亚洲| 亚洲天堂一区二区三区四区| 日韩视频一区二区| 99精品国产高清一区二区麻豆| 国产精品区一区二区三在线播放| 国产精品一区二区av不卡| 国产嫖妓一区二区三区无码| 久久精品国内一区二区三区| 亚洲视频一区在线| 国产精品视频分类一区| 一区二区在线免费观看| 久久亚洲AV午夜福利精品一区| 国产免费一区二区三区免费视频| 视频一区二区中文字幕| 视频一区二区在线播放| 免费一区二区三区四区五区| 国产一区二区三区四| 国产在线精品一区在线观看| 国产成人免费一区二区三区| 国产精品熟女视频一区二区| 国产一区在线观看免费| 免费一区二区无码视频在线播放 | 天天视频一区二区三区| 免费看无码自慰一区二区| 秋霞日韩一区二区三区在线观看| 性色av闺蜜一区二区三区| 高清一区高清二区视频| 中文字幕一区二区三区四区| 日本在线不卡一区| 中文字幕AV一区二区三区人妻少妇 | 精品久久久久久中文字幕一区| 在线观看一区二区三区视频|