AI推理再突破!OpenAI推出o1模型,挑戰人類推理極限


Lieta Research是Evan架立的全面透視美股期權的網站,在裡面可以清楚的看到造市商的行為,讓你直接打開股票戰場上的地圖迷霧。
使用我的優惠碼MOFI,可享10%折扣。同時我也會寫一系列文章做Lieta Research的教學,敬請大家期待

OpenAI 於 9 月 13 日凌晨發布兩款全新 AI 模型 o1-preview 和 o1-mini,宣告 AI 能力邁向新層次。這兩款模型在推理能力上展現出顯著的突破,超越了 OpenAI 之前發布的 GPT-4o 模型。

OpenAI 執行長 Sam Altman 強調 o1 模型在解決複雜任務方面的優勢,特別是在數學推理、編程和科學問題上。他在聲明中表示:“這是目前為止功能最強大且最一致的模型系列,代表著向無限推理模型邁出的一小步。”

o1 模型在各種測試中表現出色。在物理、化學和生物學等領域的測試中,o1 模型的表現接近博士生水準。在數學奧林匹克資格考試中,o1 模型得分為 83%,而 GPT-4o 僅能正確解答 13% 的問題。在編碼方面,o1 模型在 Codeforces 競賽中達到了第 89 個百分位。

OpenAI 也強調了 o1 模型在安全性方面的優勢。通過開發新的安全訓練方法,o1-preview 模型在安全測試中得分 84,顯著高於 GPT-4o 的 22 分。OpenAI 表示:“我們衡量安全性的一種方法是測試當使用者試圖繞過安全規則時,我們的模型如何繼續遵循安全規則。在我們最嚴格的越獄測試之一中,GPT-4o 得分為 22,而我們的 o1 預覽模型得分為 84。”

OpenAI 提供兩種版本的 o1 模型:o1-preview 和 o1-mini。o1-preview 模型具有更強大的推理能力,但每週僅能發送 30 條訊息。而 o1-mini 模型價格更低,速度更快,每週可發送 50 條訊息,適合需要推理但不需廣泛世界知識的應用。o1-mini 的價格比 o1-preview 便宜 80%。

目前,ChatGPT Plus 和 Team 用戶可在 ChatGPT 中訪問 o1 模型,但使用有限制。OpenAI 表示,o1 模型目前不具備 ChatGPT 的許多實用功能,例如瀏覽網頁、上傳文件和圖片等。這暗示 o1 模型仍處於發展階段,未來將不斷擴展功能。

OpenAI 發布的 o1 模型代表著 AI 能力的新突破,為解決覆雜推理任務提供了新的解決方案。盡管 o1 模型仍處於發展階段,但其在推理能力和安全性方面取得的進步已令業界矚目。未來,隨著 OpenAI 的不斷發展,o1 模型有望在更多領域發揮重要作用,推動人工智能技術的進步。


歡迎在XQ綁我的推薦碼@MOFI
我推薦可以課「盤後量化模組」,有送兩個其他的免費模組。這也是我自己最常用的模組
我會不定期的更新我在量化交易上發現的策略,請隨時關注了解更多

返回頂端