CogVLM2
CogVLM2是一種高性能的多語言開源模型,用於多模式對話框和圖像理解,支持長文本和高分辨率圖像。
什麼是CogVLM2 ?
CogVLM2是Tsinghua University開發的尖端多語言多語言對話模型。它支持中文和英語,高分辨率圖像處理高達1344x1344,文本長度為8K。該開源模型在TextVQA和DOCVQA等各種基準測試中都具有出色的表現,從而對其前身提供了重大的性能改進。它非常適合從事客戶服務,教育和醫療保健等領域智能係統的研究人員和開發人員。