The Browser Company推出全新AI瀏覽器Dia
1019
Pruna AI 是一家歐洲初創公司,專注於AI 模型壓縮算法的開發。近日,該公司宣布將其優化框架開源,幫助開發者更高效地壓縮和優化AI 模型。該框架結合了緩存、剪枝、量化和蒸餾等多種方法,旨在提升模型性能,同時標準化了壓縮模型的保存、加載和評估流程。
Pruna AI 的框架支持多種模型類型,包括大型語言模型、擴散模型、語音識別和計算機視覺模型,目前主要聚焦於圖像和視頻生成模型的優化。已有Scenario 和PhotoRoom 等企業使用其服務。除了開源版本,Pruna AI 還提供企業版,包含高級優化功能和壓縮代理,用戶只需設定速度和準確度要求,代理將自動找到最佳壓縮組合。
Pruna AI 按小時收費,幫助企業通過優化模型節省推理成本。例如,該公司成功將一個Llama 模型體積縮小八倍,幾乎無精度損失。近日,Pruna AI 完成了650萬美元的種子融資,投資者包括EQT Ventures、Daphni、Motier Ventures 和Kima Ventures。
項目地址:https://github.com/PrunaAI/pruna