中文(繁體)

目前位置: 首頁> AI 資訊

Hume AI Octave:首個LLM驅動的情感理解文本轉語音系統

作者: LoRA 時間: 2025年02月27日 851

在人工智能領域,Hume AI公司最近宣布推出其全新產品Octave,這一系統被稱為首個由大型語言模型(LLM)驅動的文本轉語音系統。 Octave的創新之處在於其不僅能夠生成自然的語音,還能理解上下文中的情感、語調、節奏和韻律,從而為用戶提供更為生動和人性化的語音輸出。

Hume AI的聯合創始人兼首席執行官Alan Cowen在接受媒體採訪時表示,Octave模型的設計初衷是為了使文本轉語音的生成過程更加自然和靈活。他提到,Octave可以根據輸入的文本內容,自動識別人物性格和情感狀態,並相應調整語音的表現。例如,諷刺的句子會被以諷刺的語氣表達,而緊急的內容則會以急促的語調呈現。

語音控制

Octave還具備了一項獨特的功能,用戶可以通過簡單的自然語言指令,針對生成的聲音進行細緻的調整。這意味著,用戶可以直接輸入諸如“更快樂”、“更悲傷”等描述,從而使生成的語音更加符合他們的期望。 Cowen補充道,Octave能夠根據角色的特性,比如“諷刺的中世紀農民”,立即生成對應的聲音,並在情感表達上進行相應的調節。

QQ20250227-092641.png

與傳統的逐字處理模型不同,Octave重視上下文的連貫性,能夠在句子層面及句子間捕捉情感變化。這種能力使得Octave在處理複雜情緒和語境時表現得更加出色。

隨著人工智能技術的快速發展,Hume AI的Octave系統為文本轉語音技術帶來了新的可能性。它不僅能為影視製作、遊戲開發等行業提供更加真實的角色配音,也為教育、客服等領域的應用開闢了新的方向。 Hume AI的這一創新將進一步推動語音技術的發展,助力更自然、更具情感的交流方式。