近期,人工智慧開發平台Hugging Face 團隊發布了兩款新型AI 模型,SmolVLM-256M 和SmolVLM-500M。他們自信地聲稱,這兩款模型是目前為止體積最小的AI 模型,能夠同時處理圖像、短視頻和文本數據,尤其適合內存少於1GB 的設備如筆記型電腦。這項創新讓開發者在處理大量資料時,能夠以更低的成本實現更高的效率。
這兩款模型的參數分別為256百萬和500百萬,這意味著它們在解決問題的能力上也相應有所提升,參數越多,模型的表現通常越好。 SmolVLM 系列能夠執行的任務包括對影像或影片片段進行描述,以及回答關於PDF 文件及其內容的問題,例如掃描文字和圖表。這使得它們在教育、研究等多個領域具備了廣泛的應用前景。
在模型的訓練過程中,Hugging Face 團隊利用了名為「The Cauldron」 的50個高品質影像和文字資料集,以及名為Docmatix 的檔案掃描和詳細說明配對的資料集。這兩個資料集均由Hugging Face 的M4團隊開發,專注於多模態AI 技術的發展。值得注意的是,SmolVLM-256M 和SmolVLM-500M 在各類基準測試中表現優於許多更大模型,如Idefics80B,尤其是在AI2D 測試中,它們在分析小學生科學圖表的能力上表現突出。
然而,小型模型雖然價格親民且多才多藝,但它們在複雜推理任務上的表現可能不如大型模型。一項來自Google DeepMind、微軟研究院以及魁北克Mila 研究所的研究顯示,許多小型模型在這些複雜任務上的表現令人失望。研究人員推測,這可能是由於小型模型傾向於識別資料的表面特徵,而在新情境中應用這些知識時則顯得力不從心。
Hugging Face 的SmolVLM 系列車款不僅是體積小巧的AI 工具,而且在處理各種任務時展現了令人矚目的能力。對於希望以低成本實現高效數據處理的開發者而言,這無疑是一個不錯的選擇。
AI課程適合對人工智能技術感興趣的人,包括但不限於學生、工程師、數據科學家、開發者以及AI技術的專業人士。
課程內容從基礎到高級不等,初學者可以選擇基礎課程,逐步深入到更複雜的算法和應用。
學習AI需要一定的數學基礎(如線性代數、概率論、微積分等),以及編程知識(Python是最常用的編程語言)。
將學習自然語言處理、計算機視覺、數據分析等領域的核心概念和技術,掌握使用AI工具和框架進行實際開發。
您可以從事數據科學家、機器學習工程師、AI研究員、或者在各行各業應用AI技術進行創新。