中文(繁體)

目前位置: 首頁> AI 資訊

Pruna AI 開源AI 模型優化框架,助力高效壓縮

作者: LoRA 時間: 2025年03月20日 1011

QQ_1742461212364.png

Pruna AI 是一家歐洲初創公司,專注於AI 模型壓縮算法的開發。近日,該公司宣布將其優化框架開源,幫助開發者更高效地壓縮和優化AI 模型。該框架結合了緩存、剪枝、量化和蒸餾等多種方法,旨在提升模型性能,同時標準化了壓縮模型的保存、加載和評估流程。

Pruna AI 的框架支持多種模型類型,包括大型語言模型、擴散模型、語音識別和計算機視覺模型,目前主要聚焦於圖像和視頻生成模型的優化。已有Scenario 和PhotoRoom 等企業使用其服務。除了開源版本,Pruna AI 還提供企業版,包含高級優化功能和壓縮代理,用戶只需設定速度和準確度要求,代理將自動找到最佳壓縮組合。

Pruna AI 按小時收費,幫助企業通過優化模型節省推理成本。例如,該公司成功將一個Llama 模型體積縮小八倍,幾乎無精度損失。近日,Pruna AI 完成了650萬美元的種子融資,投資者包括EQT Ventures、Daphni、Motier Ventures 和Kima Ventures。

項目地址:https://github.com/PrunaAI/pruna