Step Reasoner mini

還在為複雜的數理邏輯題和枯燥的文本創作煩惱？ Step R-mini 幫你輕鬆解決！

前往網站

作者:LoRA

收錄時間:2025年01月16日

下載量:811

計價模式:Free

版本:v1.0

簡介

Step Reasoner mini (簡稱Step R-mini) 是階躍星辰(Leap Star) 推出的首款推理模型。它採用獨特的「慢思考」和反覆驗證的邏輯機制，旨在提供準確可靠的回复，並能有效解決邏輯推理、代碼、數學等複雜問題，同時兼顧文學創作等通用領域，展現了強大的“文理兼修” 能力。

核心特點：

強大的推理能力：擅長主動規劃、嘗試和反思，透過邏輯推理解決複雜問題，包括數學題（甚至奧數題）、幾何題（能主動繪製草圖）、邏輯推理題和LeetCode “Hard” 級別的程式設計題。
文理兼修：不同於許多只擅長單一領域的推理模型，Step R-mini 透過大量的強化學習訓練，使其在文學創作、日常聊天和翻譯等任務中也表現出色，能夠理解用戶意圖並進行創造性表達。
優異的基準測試表現：在AIME 和Math 等數學基準測試中，Step R-mini 的表現優於o1-preview，與OpenAI 的o1-mini 不相上下；在LiveCodeBench 程式設計任務中也優於o1-preview。
強化學習訓練：採用On-Policy 強化學習演算法進行訓練，提升模型的綜合能力。
未來的視覺推理能力：階梯星辰正在發展視覺推理模型，將推理能力擴展到視覺領域，實現「空間慢思考(Spatial-Slow-Thinking)」。

應用場景：

如何體驗：

使用者可登入躍問網頁端https://yuewen.cn ，在左上角選擇“Step R-mini” 進行體驗。

效果預覽

猜你喜歡

Goedel-Prover

Goedel-Prover是普林斯顿、清华等机构推出的开源LLM，能将数学问题转化为形式证明，显著提升自动化定理证明能力。

自動化數學證明 AI定理證明
Neo-1

發現Neo-1是Vantai的開創性AI模型，如何具有精確的結構預測和創新特徵來徹底改變分子設計和藥物開發。

Neo-1 AI 模型分子設計AI
Step Reasoner mini

還在為複雜的數理邏輯題和枯燥的文本創作煩惱？ Step R-mini 幫你輕鬆解決！

AI 推理模型兼具文理科能力的推理模型
Microsoft Phi-4

Microsoft Phi-4是 Microsoft 開發的人工智慧 (AI) 框架，用於深度學習和強化學習任務的自動化訓練和推理。

小語言模型數學

精選專欄