阿聯酋政府支持的技術創新研究所(TII)近日宣布推出其新一代開源小型語言模式(SLM)-Falcon3系列。這一系列包括四個不同規模的模型:1B、3B、7B和10B,並提供基礎版與指令版兩種變體,旨在為開發人員、研究人員和企業提供一種高效且成本低廉的AI解決方案。這些模型的推出,標誌著AI功能的進一步民主化,能夠在輕量級的單GPU基礎設施上運行,滿足對計算資源有限的設備和應用場景的需求。
圖源備註:圖片由AI生成,圖片授權服務商Midjourney
Falcon3的表現已在Hugging Face排行榜上脫穎而出,超越了與之尺寸相同的開源模型,如Meta的Llama和Qwen-2.5。特別是7B和10B版本在推理速度、語言理解、指令執行以及程式碼和數學任務等方面,展現了領先的技術優勢,甚至在多個基準測試中超越了谷歌、Meta和阿里巴巴等競爭對手。
與傳統的大型語言模式(LLM)相比,SLM模式因其較少的參數和更簡潔的設計,具備高效性和低成本優勢,尤其適合在客戶服務、醫療保健、物聯網等領域中應用。根據市場研究公司Valuates Reports的數據,SLM市場預計將在未來五年內實現18%的年均成長。
Falcon3系列的訓練資料規模達到了14兆tokens,是其前身Falcon2的兩倍多。該系列採用了僅解碼器架構和分組查詢注意機制,最大限度地減少了記憶體使用,同時提升了推理效率。 Falcon3支援英語、法語、西班牙語和葡萄牙語等四種語言,並配備了32K的上下文窗口,能夠處理長輸入文本,滿足各類行業的需求。
TII表示,Falcon3的基礎模型適合通用任務,指令版則專為對話任務如客戶服務和虛擬助理最佳化。該系列的推出將進一步推動邊緣運算和隱私敏感應用的發展,支援如個人化推薦、數據分析、醫療診斷和供應鏈優化等場景。
所有Falcon3模式都遵循TII Falcon License2.0發布,這是一個基於Apache2.0的寬鬆許可證,支援負責任的AI開發和部署。為了幫助開發者和研究人員上手,TII也推出了Falcon Playground測試環境,使用者可以在整合這些模型之前進行試用。
AI課程適合對人工智能技術感興趣的人,包括但不限於學生、工程師、數據科學家、開發者以及AI技術的專業人士。
課程內容從基礎到高級不等,初學者可以選擇基礎課程,逐步深入到更複雜的算法和應用。
學習AI需要一定的數學基礎(如線性代數、概率論、微積分等),以及編程知識(Python是最常用的編程語言)。
將學習自然語言處理、計算機視覺、數據分析等領域的核心概念和技術,掌握使用AI工具和框架進行實際開發。
您可以從事數據科學家、機器學習工程師、AI研究員、或者在各行各業應用AI技術進行創新。