moonshot-v1-vision-preview
Moonshot Vision Preview 提供創新的 AI 工具,用於無縫設計和建立未來的 Web 體驗。
Kimi 視覺模型
Kimi 視覺模型是Moonshot AI 開放式平台提供的先進影像理解技術,能夠準確地辨識和理解圖片內容,包括文字、色彩和物件形狀等。它高效準確,適用於圖像內容描述、視覺問答等多種場景,定價與moonshot-v1 系列模型一致,按模型推理的總Tokens 計費,每張圖片消耗1024 Tokens。
目標用戶
開發者、研究人員和需要圖像理解功能的企業。開發者可輕鬆整合其強大的API 介面;研究人員可用於影像分析和研究;企業可提升業務效率和使用者體驗。
使用場景範例
開發者開發圖像問答應用
企業進行自動化影像內容審核
研究人員進行影像辨識研究
產品特色
支援多輪對話,理解上下文並回答問題
提供串流輸出,即時回傳結果
可進行工具調用,擴展應用範圍
支援JSON 模式,方便資料交互
支援部分處理和回應,提高效率
不支援連網搜索,確保資料安全
不支援創建含圖片內容的緩存,但可使用已建立的緩存
僅支援base64 編碼圖片內容
使用教程
1 取得Moonshot API 金鑰
2 選擇適合的Kimi 視覺模型,例如moonshot-v1-8k-vision-preview
3 將圖片轉換為base64 編碼字串
4 建構API 請求,包含模型名稱、圖片內容和指令
5 發送請求到Moonshot AI 開放式平台
6 解析響應結果並進行後續處理