今天,X平台發布了其重大更新,推出了Grok 3。作為一個有幸獲得早期訪問權限的用戶,我將測試這個新的AI 模型,並與ChatGPT 進行比較。 Grok 3 帶來了兩種新模式:深度搜索和思考模式,這兩個模式似乎嵌入了某種推理模型,可以在用戶界面之間輕鬆切換。
首先,Grok 3的用戶界面和ChatGPT非常相似,從品牌顏色到按鈕圖標都讓人感覺似曾相識。儘管如此,我們還是直接進入測試階段。
訪問和界面:
你可以在grok.com上訪問新版Grok,不僅可以在X平台上使用,還有一個專門的用戶界面。
聊天可以直接分享到X,使內容傳播變得更加便捷。
實測對比:Grok 3性能大揭秘
為了更深入地了解Grok 3 的,視頻博主實力進行了一系列對比測試,涵蓋了命名、編碼、圖像生成、內容創作以及網絡搜索等多個維度,把Grok 3 與ChatGPT、DeepSeek、Perplexity 等明星產品同台競技。
命名:測試常規模式下的Grok 3 在“以i 結尾的狗品種分類”測試中表現不佳,未能準確理解指令。然而,成功切換至推理模式後,Grok 3 克服了這一挑戰,給出了符合要求的答案,初步執行了推理模式的優勢。
編碼測試:在構建“太空侵略者與貪吃蛇結合遊戲”的測試中,Grok 3 的推理模式雖然思考最終時間相當長,但生成的HTML 代碼卻未能有效運行,只需創建一個綠色方塊,編碼能力略顯遜色於ChatGPT。
圖像生成測試:在“生成長頸鹿騎著魔毯的圖片”的測試中,Grok 3表現出驚人的圖像生成能力,其作品豐富,細節有趣豐富,甚至超越了ChatGPT的表現,令人眼前一亮。
內容創作(SEO 優化文章)測試:在“創建一篇關於SEO培訓日本的SEO優化文章”的測試中,Grok 3生成的文章不再人性化,行文流暢自然,格式排版也更加出色,內容長度略與ChatGPT相比,在內容創作方面更勝一籌。
網絡搜索/深度研究測試:視頻博主分別在Grok 3、Perplexity 和ChatGPT 中進行了“深度研究”測試。 Grok 3 的深度搜索速度極快,但結果被中斷,且深度和數據時效性方面不及Perplexity。 Perplexity 在深度和數據來源方面同樣領先,但Grok 3 的速度優勢和Twitter 實時數據集成能力不容忽視。
結論與評價:
Grok 3在速度和圖像生成上表現出色,但代碼執行和深度研究方面仍需完善。
對於訂閱了X 高級服務的用戶,Grok 3 提供了一定的免費查詢權限,但高級功能需要額外付費。
Grok 3 的推出,它不僅僅是一個聊天機器人,還試圖成為一個全能的搜索與內容創建平台。
總的來說,儘管Grok 3 在某些方面還有待提高,但其創新性和潛力是可估的,特別是對於X 平台的用戶來說,這是一個激動人心的新工具。