GitHub Copilot 之所以強大,是因為它盜竊了開源代碼
軟體自由保護協會 (SFC)是一家由開源倡導者組成的非營利性社區。今天(本文原文發表於 2022 年 7 月 5 日),它發布了一篇抨擊性的博文,宣布退出 GitHub,並請求其成員及支持者公開譴責該平台。SFC 與 GitHub 的如此紛爭,源於這一頗受指責的舉動:微軟和 OpenAI 訓練了一個名為 Copilot 的 AI 系統,而其訓練數據的來源,是那些使用了開源許可證公開的代碼。開源代碼不是捐款箱,不是想拿多少就拿多少,想怎麼用就怎麼用的。
它更像是攝影作品。即便攝影師沒有向你收取照片的使用費,你仍需要在該署名的地方進行署上來源。據 SFC 的一篇 博文 所述,Copilot 在使用他人的代碼片段時,並沒有保留來源信息:
「這反映了 GitHub 長期以來的問題,也是我們必須一齊放棄 GitHub 的關鍵原因。從 Copilot 中,從 GitHub 的代碼託管服務中,從我們所見的基本每個領域,我們都發現 GitHub 的行為比其同行要差得多。我們也不相信 Amazon、Atlassian、GitLab 等其他盈利性的代碼託管平台,能有傑出的表現。然而,將 GitHub 的行為與其同行相對比較一下,就能發現 GitHub 的行為要差得多了。」
GitHub 是全世界事實上的開源代碼倉庫。它是 YouTube、Twitter 和 Reddit 的混合體,但專為程序員及其代碼服務。自然,替代品是有的。但是,從一個代碼倉庫生態切換到另一個,並不等同於用 Instagram 來替代 TikTok。微軟在 2018 年花了 70 多億美元來收購 GitHub。從那時起,微軟就利用其 OpenAI 的主要受益者的地位,來共同開發 Copilot。並且,要訪問 Copilot 服務,只能通過微軟的特別邀請,或者支付訂閱費。該舉激怒了 SFC 及其他開源倡導者,因為微軟和 OpenAI 實際上在將他人的代碼貨幣化,同時讓使用這些代碼的人們不能正確地表明歸屬信息。
Copilot 必須毀滅。或者,微軟和 OpenAI 可以造一台時光機,然後穿越到過去,將 Copilot 資料庫中的每一點數據做標記,從而能夠為所有輸出提供正確的署名。但是,與其去關心你產品或者服務中的倫理問題,不如去鼓動人們,去開拓那荒野西部似的監管環境,後者總是更加簡單的。
(題圖:MJ/1a101872-c0d6-475e-b3e2-3646c9a2d66b)
作者:Laveesh Kocher 選題:lkxed 譯者:Peaksol 校對:wxy
本文轉載來自 Linux 中國: https://github.com/Linux-CN/archive