祖克柏知曉Meta 使用盜版圖書館資料訓練AI

作者: LoRA 時間: 2025年01月15日 403

近日，隨著Meta 公司在一場關於版權的集體訴訟中披露的文件浮出水面，該公司利用一個名為Library Genesis（LibGen）的盜版電子書圖書館來訓練其最新的AI 聊天機器人Llama3的消息引發了廣泛關注。這些文件顯示，Meta 的工程師曾討論過利用LibGen 這一「影子圖書館」的潛在風險，尤其是在版權和數據所有權問題日益突出的背景下。儘管存在潛在的負面影響和輿論風險，Meta 的執行長馬克・祖克柏依然批准了這項決定。

圖書館書房閱讀 (3)

在法庭的要求下，Meta 內部關於使用LibGen 數據集的機密對話記錄被解密，文件顯示，Meta 的高管在與AI 研究團隊的討論中明確表示LibGen 的數據是“我們知道是盜版的”，並同意使用該數據來提高Llama3的性能。在一封電子郵件中，Meta 的產品管理總監Sony Theakanath 指出，雖然使用LibGen 的決定引發了輿論風險，但其他AI 公司也在使用類似的數據，這使得Meta 的團隊感到這條路並非孤例。

此外，Meta 的員工也在郵件中提到，直接使用公司IP 位址進行種子下載可能不妥，並對此行為表示擔憂。然而，在祖克柏「從高層推動」使用LibGen 資料集的情況下，Meta 在AI 競賽中的求勝心態顯露無遺。這事件也再次引發了外界對大型科技公司在版權問題上的關注與質疑。

這項版權訴訟的結果可能會對其他正在進行的類似案件產生重要影響，尤其是涉及圖像、音樂和文學等創作作品的使用問題。隨著科技公司對原創內容的需求不斷增加，原創內容創作者的權益將成為關注的焦點。

常見問題