如何安裝ComfyUI? Windows 安裝ComfyUI教程指南
1005
在機器人技術領域,美國創業公司Figure AI 於近期發布了一款名為Helix 的端側大模型,標誌著人形機器人控制技術的重大突破。 Helix 是首個能夠對整個人形機器人上半身(包括頭部、軀幹、手腕和手指)進行高頻率、連續控制的視覺- 語言- 動作(VLA)模型。這意味著,機器人可以在無需大量訓練的情況下,直接根據自然語言指令執行任務。
Figure AI 通過建立兩個互補的系統來解決視覺語言模型的通用性和速度之間的矛盾。系統一是一個快速反應的視覺運動策略模型,能夠每秒執行200次精確動作,而係統二則是一個開源的視覺語言模型,能夠理解複雜場景與自然語言。這兩個系統通過端到端訓練實現了高效的溝通,從而克服了以往人形機器人在執行多樣化任務時所面臨的限制。
更令人興奮的是,Helix 不僅可以在單台機器人上運行,更是首個能實現雙機協作的AI 模型。在一系列演示中,兩台搭載Helix 的機器人面對一堆從未見過的雜物,成功地進行了協作分類。為了完成任務,機器人之間需要進行視覺上的“確認”,彼此對視以確保信息傳遞準確無誤。這種人機協作的方式不僅展示了Helix 的強大能力,更暗示著未來人形機器人與人類之間的互動將更加自然和高效。
通過僅用500小時的高質量監督數據,Helix 便能輕鬆識別並處理成千上萬種小型家居物品。在簡單的指令下,機器人能夠準確完成從未示範過的任務,顯示出其驚人的靈活性和智能化程度。
隨著Helix 的推出,Figure AI 也在積極進行融資,目標達15億美元,預計公司估值將達到395億美元。這一數字與去年相比翻了近14倍,反映出市場對機器人技術的巨大興趣與潛力。