百聆
百靈提供由先進人工智慧技術支援的創意設計和互動式網路體驗的創新解決方案。
百聆語音對話助手
百聆是個開源的語音對話助手,提供自然流暢的語音互動體驗。它結合了語音識別,語音活動檢測,大語言模型和語音合成技術。
主要優勢
無需GPU,即可達到接近GPT-4的對話效果
適用於各種邊緣設備和資源限制環境
完全開源,支持社區貢獻和二次開發
高效可靠,提供高品質語音對話
目標用戶
需要高效語音互動體驗的用戶,例如日常對話,資訊查詢或任務管理。尤其適合對硬體配置要求不高,但對語音互動品質有較高要求的使用者。
使用場景範例
語音查詢天氣
雅思口說練習
設定定時任務
產品特色
高效開源模型
本地部署,無需GPU
模組化設計,方便客製化升級
支援記憶功能,提供個人化體驗
支援工具調用,提升實用性
支援任務管理,高效管理使用者任務
使用教程
1 複製專案倉庫git clone https://github.com/wwbin2017/bailing.git,進入專案目錄
2 安裝依賴pip install -r requirements.txt
3 設定環境變數設定config/config.yaml,下載SenseVoiceSmall到models/SenseVoiceSmall目錄,取得deepseek的api_key
4 啟動後端服務(選用) cd server,執行python server.py
5 啟動主程式運行python main.py,開始語音對話