微軟的研究團隊近日推出了一種名為「大型行動模式」(LAM)的人工智慧技術,標誌著AI技術的一個新階段。與傳統的語言模型不同,LAM不僅能進行對話,還能自主操作Windows程序,執行具體任務。
LAM的優勢
LAM能夠理解多種輸入方式(如文字、語音、圖像),並將這些輸入轉換為具體的任務步驟。它不僅可以製定計劃,還能根據實際情況調整行動策略。 LAM的建造過程包括:
任務分解:將複雜任務分解為步驟。
轉化為行動:透過AI系統(如GPT-4o)將計劃轉化為實際行動。
探索新方案:自主尋找新的解決方案。
微調訓練:透過獎勵機制優化表現。
測試結果
在實驗中,基於Mistral-7B的LAM模型在Word測試中表現出色:
成功率:LAM成功完成任務的機率為71%,超過GPT-4o的63%。
執行速度:LAM每個任務只要30秒,GPT-4o需要86秒。
資料擴展與訓練
研究團隊透過擴展資料集,從最初的29,000對任務計畫擴展到76,000對,提升了訓練效果。最終,約2,000個成功的任務序列被用於訓練。
持續挑戰
儘管LAM表現優秀,研究團隊仍面臨一些挑戰,包括任務錯誤、監管問題和技術擴展性。不過,LAM代表了AI技術的重大進步,未來可幫助人類完成更多實際任務。
關鍵點總結
LAM能夠自主執行Windows程序,突破傳統AI的限制。
LAM在執行任務時速度更快、成功率更高。
資料擴展和訓練優化增強了LAM的效果和準確性。
AI課程適合對人工智能技術感興趣的人,包括但不限於學生、工程師、數據科學家、開發者以及AI技術的專業人士。
課程內容從基礎到高級不等,初學者可以選擇基礎課程,逐步深入到更複雜的算法和應用。
學習AI需要一定的數學基礎(如線性代數、概率論、微積分等),以及編程知識(Python是最常用的編程語言)。
將學習自然語言處理、計算機視覺、數據分析等領域的核心概念和技術,掌握使用AI工具和框架進行實際開發。
您可以從事數據科學家、機器學習工程師、AI研究員、或者在各行各業應用AI技術進行創新。