SFC 批评 GitHub Copilot 盗取了开源代码,还剥夺了署名权:所以它表现很出色

SFC 批评 GitHub Copilot 盗取了开源代码,还剥夺了署名权:所以它表现很出色
2022年07月02日 19:52 云头条

广大开源倡导者组成的非营利性社区软件自由保护协会(SFC)今天在一篇措辞严厉的博文中宣布退出GitHub,还敦促成员和支持者一边倒地谴责该平台。

不妨先剧透一下:SFC与GitHub闹得不愉快源于前者指责:微软和OpenAI用根据开源许可证发布的数据来训练这个名为Copilot的AI系统。

开源代码不像捐款箱:你想取多少就完全可以取多少,并以你选择的任何方式使用它。

开源代码更像是照片。虽然摄影师并不对你就使用其某张照片收取费用,但你依然需要注明出处,在道德上和法律上向对方表示应有的感谢。

据SFC网站上的一篇博文声称,Copilot在使用别人的代码片段时根本没有这么做,显得很不厚道:

这让人想起了GitHub长期存在的问题,以及我们必须共同抛弃GitHub的主要原因。我们已经从Copilot、GitHub的核心托管服务以及它努力的几乎所有方面看到,GitHub的行为比同行劣迹斑斑得多。我们不认为亚马逊、Atlassian、GitLab或其他任何营利性托管服务商的做法尽善尽美。然而,将GitHub的行为与这些同行的行为作一番横向比较,就会发现GitHub的行为要糟糕得多。

背景:GitHub是全世界事实上的开源代码存储库。它如同集YouTube、Twitter和Reddit于一身,但面向的群体是程序员及他们编写的代码。

当然,外头有其他选择。但从一个代码存储库生态系统切换到另一个生态系统与将Instagram换成TikTok不是一回事。

微软在2018年以超过70亿美元的价格收购了GitHub。从那以后,微软利用其作为OpenAI主要赞助商的地位,共同致力于开发Copilot。要访问及使用Copilot,唯一的方法是通过微软的特别邀请或付费订阅。

SFC及其他开源倡导者之所以深感不安,是由于微软和OpenAI本质上使用别人的代码大发其财,还剥夺了那些使用代码的人注明代码出处、给予应有感谢的能力。

换句话说:微软在窃取人们的劳动成果,剥夺署名权,并通过算法将其出售给他人。

解决办法:杀死Copilot。或者,微软和OpenAI可以打造一台时间机器,回到过去,标记Copilot数据库中的每个数据点,以便可以构建第二个模型,对他人编写的每行代码注明出处,给予应有的感谢。

但是面对简直可以随心所欲的监管环境,趁机盘剥他人总是比关心自己所提供的产品和服务符合伦理道德要来得容易。

说到AI让人类生活更轻松的具体实例,GitHub的Copilot首当其冲。一些繁琐的事情可能需要开发人员花数小时来处理,Copilot却可以使它们变得就像摁按钮或输入几行文本一样简单。

这方面有几个先例。GPT-3和Dall-E使用人类生成的媒体的数据库来生成新的输出。

但是这些生成器与Copilot有一个关键的区别。以大画家莫奈的风格画一只鸭子或者让GPT-3给你讲一则关于快乐狗的故事是一回事。从数据库中的文件原封不动地逐行重复代码片段并不是以别人的风格编写代码,而是赤裸裸地盗用别人的代码。

有时可能比这来得还要微妙。当然,有时解决代码编写问题的方法不止一种。编写代码又常常既是一门科学,又是一门艺术。

然而就因为你可以用iPhone拍下落日的照片,并不意味着就可以盗用别人的日落照片,声称这是你自己拍的照片,然后卖给别人。

到头来,这并不重要。Copilot大受欢迎。开发社区似乎绝对喜欢它。它在媒体界得到的褒奖远比批评多得多。

暂且不说它最终会对开源社区产生什么影响。如果你完全在无偿工作,结果只是为微软赚钱,谁还需要开源存储库?

最要命的是,你别无选择。没有选择加入或选择退出一说。微软和OpenAI拥有你的数据,没有什么能阻止它们用你的数据做它们想做的任何事情。抵抗是徒劳无益的。

声明原文:https://sfconservancy.org/blog/2022/jun/30/give-up-github-launch/

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部