近日,隨著Meta 公司在一場關於版權的集體訴訟中披露的文件浮出水面,該公司利用一個名為Library Genesis(LibGen)的盜版電子書圖書館來訓練其最新的AI 聊天機器人Llama3的消息引發了廣泛關注。這些文件顯示,Meta 的工程師曾討論過利用LibGen 這一「影子圖書館」 的潛在風險,尤其是在版權和數據所有權問題日益突出的背景下。儘管存在潛在的負面影響和輿論風險,Meta 的執行長馬克・祖克柏依然批准了這項決定。
在法庭的要求下,Meta 內部關於使用LibGen 數據集的機密對話記錄被解密,文件顯示,Meta 的高管在與AI 研究團隊的討論中明確表示LibGen 的數據是“我們知道是盜版的”,並同意使用該數據來提高Llama3的性能。在一封電子郵件中,Meta 的產品管理總監Sony Theakanath 指出,雖然使用LibGen 的決定引發了輿論風險,但其他AI 公司也在使用類似的數據,這使得Meta 的團隊感到這條路並非孤例。
更令人擔憂的是,Meta 的員工還討論瞭如何處理和過濾LibGen 中的文本,以去除版權標識,例如ISBN 和版權聲明。內部備忘錄稱,LibGen 提供的資料「品質高且文件較長,非常適合學習特別專業的知識」。這表明Meta 似乎試圖隱藏其使用未經授權的內容。
此外,Meta 的員工也在郵件中提到,直接使用公司IP 位址進行種子下載可能不妥,並對此行為表示擔憂。然而,在祖克柏「從高層推動」 使用LibGen 資料集的情況下,Meta 在AI 競賽中的求勝心態顯露無遺。這事件也再次引發了外界對大型科技公司在版權問題上的關注與質疑。
這項版權訴訟的結果可能會對其他正在進行的類似案件產生重要影響,尤其是涉及圖像、音樂和文學等創作作品的使用問題。隨著科技公司對原創內容的需求不斷增加,原創內容創作者的權益將成為關注的焦點。
AI課程適合對人工智能技術感興趣的人,包括但不限於學生、工程師、數據科學家、開發者以及AI技術的專業人士。
課程內容從基礎到高級不等,初學者可以選擇基礎課程,逐步深入到更複雜的算法和應用。
學習AI需要一定的數學基礎(如線性代數、概率論、微積分等),以及編程知識(Python是最常用的編程語言)。
將學習自然語言處理、計算機視覺、數據分析等領域的核心概念和技術,掌握使用AI工具和框架進行實際開發。
您可以從事數據科學家、機器學習工程師、AI研究員、或者在各行各業應用AI技術進行創新。