在2025年消費性電子展(CES)上,NVIDIA 發布了全新的Cosmos 平台,該平台旨在加速實體人工智慧(AI)系統的開發,尤其是自主駕駛車輛和機器人。 Cosmos 平台整合了生成式世界基礎模型(WFM)、視訊標記器、安全防護機制以及一個加速的資料處理管道,這些功能可協助開發者在減少對真實世界資料依賴的情況下創建和優化AI 模型。
Cosmos 平台將以開放模式授權的形式在Hugging Face 和NVIDIA NGC 目錄中提供,後續將推出經過優化的NVIDIA NIM 微服務,並透過NVIDIA AI 企業軟體平台提供企業支援。
NVIDIA 執行長黃仁勳在展會上表示:「機器人技術即將迎來像ChatGPT 那樣的轉折時刻。與大型語言模型一樣,世界基礎模型是推動機器人和自主駕駛車輛發展的核心,但並非所有開發者都有能力和資源來訓練自己的模型。
Cosmos 模型可以根據文字、圖像和感測器資料產生基於物理的高清視頻,使其適用於視頻搜尋、合成資料生成和強化學習等應用。開發者能夠自訂模型以模擬工業環境、駕駛場景以及其他特定用例。此外,NVIDIA 還推出了NeMo Curator,這是一個加速視訊處理管道,能夠在14天內處理2000萬小時的視訊數據,以及Cosmos Tokeniser,這是一個視覺數據壓縮工具。
Agility Robotics 的技術長 Pras Velagapudi 指出:「資料稀缺性和變異性是機器人環境成功學習的關鍵挑戰。Cosmos 的文字、影像和視訊到世界的能力使我們能夠產生和增強各種任務的場景,從而在不需要過多昂貴的真實資料擷取的情況下訓練模型。
多家主要的機器人和運輸公司,包括Agile Robots、XPENG、Waabi 和Uber,已經開始採用Cosmos 進行AI 開發。 Uber 執行長Dara Khosrowshahi 表示:「生成式AI 將驅動未來的出行,既需要豐富的數據,也需要強大的運算能力。透過與NVIDIA 的合作,我們有信心幫助加速安全、可擴展的自主駕駛解決方案的進程。
除了Cosmos,NVIDIA 還推出了Llama Nemotron 大型語言模型和Cosmos Nemotron 視覺語言模型,專為醫療、金融和製造等行業的企業使用而開發。
官方部落格:https://nvidianews.nvidia.com/news/nvidia-launches-cosmos-world-foundation-model-platform-to-accelerate-physical-ai-development
AI課程適合對人工智能技術感興趣的人,包括但不限於學生、工程師、數據科學家、開發者以及AI技術的專業人士。
課程內容從基礎到高級不等,初學者可以選擇基礎課程,逐步深入到更複雜的算法和應用。
學習AI需要一定的數學基礎(如線性代數、概率論、微積分等),以及編程知識(Python是最常用的編程語言)。
將學習自然語言處理、計算機視覺、數據分析等領域的核心概念和技術,掌握使用AI工具和框架進行實際開發。
您可以從事數據科學家、機器學習工程師、AI研究員、或者在各行各業應用AI技術進行創新。