圖、文/CTWANT
▲(圖/翻攝自instagram.com/elonrmuskk)
馬斯克(Elon Musk)日前在社群平台X(前稱Twitter)上表示,他所創立的人工智慧公司xAI正在開發中的最新AI模型「Grok 3.5」仍十分粗糙,克坦言Grok 3.5尚需進一步調整,預計最快還需一週時間才能正式推出。
根據媒體報導指出,Grok 3.5被定位為首款能夠從「第一原理」(First-Principles)出發進行邏輯推理的AI模型,其設計初衷並非僅僅作為聊天助手,而是要在火箭引擎與電化學等高難度領域具備回答能力。
馬斯克先前就曾提過強調,Grok 3.5的回答內容甚至有可能是「網路上找不到的答案」,其目標是突破目前大語言模型的知識回憶框架,邁向合成全新知識的能力。
為推廣Grok,馬斯克也親自參與行銷,他近日將自己在X的暱稱更改為「gorklon rust」,並同步更換頭像。雖然Grok 3.5尚未公布具體上線日期,但外界普遍認為距離正式亮相已經不遠。
另外有網友撰寫分析報告,Grok 3.5的算力需求比前一代Grok 3提升了2.75倍,顯示其背後的模型規模與訓練資源也同步擴大。而今年下半年預計推出的Grok 4,其算力將比Grok 3成長至12倍,即便排除部分宣傳成分,實際增幅至少也有5倍左右。
撰文網友認為,Grok 3.5屬於從「理解模型」向「科研模型」演進的過渡型,而Grok 4則將此路線深化,朝向「專家型AI研究員」的形態邁進。
在技術層面,Grok 3.5的三大特點,第一,其從基本概念出發推理,不依賴大量文本統計資料,而是模擬人類思考方式,特別在如電機、電化學、火箭等專業領域展現高水準解答。
第二,由xAI的Colossus超級電腦支援高強度訓練,並導入「問題—鍊式—答案」的監督機制,使其在像GPQA這類科學評測任務中表現突出。
第三,它具備多工處理能力,在數學、物理、程式設計等任務中穩定性極佳,並透過上下文處理強化少樣本泛化能力。
撰文網友推測,Grok的長期目標是打造可用於科學研究與技術決策的AI平台,而非通用聊天機器人。下一代Grok 4將進一步朝此方向發展,包括實現跨模態第一性推理,也就是結合圖像、影片與3D結構於邏輯分析中;此外,也導入「Auto-Research Agent」架構,能自動提出假設、設計子問題與驗證流程,打造具備科研自主能力的人工智慧。該計畫被視為邁向通用人工智慧(AGI)的關鍵一步,不是模擬人類,而是推進人類科研的加速引擎。
根據目前測試資料顯示,Grok 4已在ELO(1529)與GPQA(95.4%)等指標上超越OpenAI的GPT-4,展現其在「跨領域深層認知」上的潛力與競爭力,未來將挑戰生成式AI市場中的主流地位。
延伸閱讀