什麼是Goedel-Prover ?
Goedel-Prover是專注於自動化數學問題的形式證明生成的開源AI 模型。該模型的核心目標是:
✅ 將自然語言數學問題轉換為形式化語言(如Lean 4)
✅ 自動生成完整的數學證明,解決形式化數學陳述和證明稀缺的問題
✅ 提高數學定理自動證明能力,推動AI 在數學推理領域的發展
在多項基準測試中, Goedel-Prover取得了突破性成果,例如:
1.miniF2F 基準測試:成功率57.6%,超越此前所有開源模型
2.PutnamBench:成功解決7 個高難度數學問題
3.Lean Workbook:自動生成近3 萬個形式化證明
核心功能
✅ 1. 形式化翻譯
自動解析自然語言數學問題,精準轉換為Lean 4 形式語言
確保翻譯的邏輯完整性和數學嚴謹性
✅ 2. 自動定理證明
基於AI 自動推理,生成完整的數學證明過程
適用於高階數學、計算機科學等領域
✅ 3. 專家迭代訓練(Expert Iteration)
採用專家迭代方法進行多輪優化,不斷提升數學證明能力
使用Lean 編譯器驗證證明正確性,確保生成的證明嚴謹無誤
✅ 4. 大規模數據集訓練
結合Numina、Lean Workbook、Mathlib4 等數據集,增強泛化能力
訓練過程中持續擴展數學問題庫,適應不同數學領域
技術原理
✅ 1. 形式化翻譯
雙形式化器(Formalizer A & B):兩種不同風格的數學翻譯,提高多樣性
編譯正確性(CC)測試:確保形式化陳述符合Lean 語法
忠實性與完整性(FC)測試:確保翻譯準確表達原始數學問題
✅ 2. 專家迭代訓練
採用DeepSeek-Prover-V1.5-RL 生成初始證明
通過Lean 編譯器驗證正確性,篩選高質量證明
訓練數據持續更新,模型不斷優化,提升自動證明能力
✅ 3. 數據集擴展
結合Numina、Mathlib4 等外部數據集,豐富數學定理庫
訓練過程中逐步增加Lean Workbook 數據,提高不同數學領域的適應性
應用場景
數學研究:幫助數學家驗證複雜定理,加速研究進展數學教學:為教師提供詳細數學證明,輔助學生理解數學邏輯軟件驗證:用於驗證軟件算法的正確性,提高安全性和可靠性
AI 算法驗證:確保AI 相關算法的數學理論基礎合理嚴謹跨學科研究:支持物理、工程等學科的數學推理應用
Goedel-Prover項目地址
GitHub 倉庫: Goedel-Prover
HuggingFace 模型庫: 模型下載
arXiv 論文: 技術報告