「这个案例生动地诠释了AI平民化效应。」
九成资产被骗,起诉费用高达80万美元!且看受骗人如何利用AI绝地反击。
第一次由OpenAI o1 pro引导的诉讼,或许也是美国联邦法院系统中首次由AI引导的诉讼, 近日由Steve Sokolowski公布了其中的细节。
目前,诉讼已经开庭。
事件回顾
2022年,美国发生了多起投资诈骗案,其中Steve&Chirs Sokolowski兄弟俩被骗走了九成净资产, 需要80万美元保证金才能立案。
他们一生辛勤工作、生活节俭并做好了将来退休后的计划,但当时完全没有想到自己有机会能伸张正义。
原告花了几年时间联系各种律师和诉讼融资公司。诉讼融资公司可以垫付前期需要的费用,等胜诉后再收回垫付的资金并抽取一定比例的提成,但前提是纠纷必须先立案。Steve Sokolowski兄弟却无力支付律师费到法庭立案。
他们陷入了一个循环:诉讼融资公司希望得到一份起诉状,而律师们则希望得到费用来撰写起诉状。
要打破这个循环几乎是不可能的——甚至要让这些公司回电话都十分困难。
当Steve拨打匹兹堡律师事务所Leech Tishman的电话时,他们的电话突然打不通了。
随后,有位律师在大约两周后才回电。Steve再次拨打电话,却始终没有收到回复,不禁感叹:「这就是法律行业的运作方式。」
因此,法律系统中的一个主要弱点在于,当被告将你洗劫一空时,你根本负担不起费用起诉他们。如果被告拿走的钱少一些,你可能留下足够的资金聘请律师。从本质上来说,欺诈越大,越有可能逃脱惩罚:这无疑鼓励了被告普遍采取「一不做,二不休」的策略。
然而,最终Claude 3.5 Sonnet发布了,它终于能够评估法律(尽管在解释训练数据中的判例价值时, 仍然存在错误)。
接着,OpenAI的o1 pro改变了一切。OpenAI的o1 pro是一种通用人工智能(AGI)系统,Steve认为:「它比我接触过的任何律师都要聪明。」
o1工作流 :找到相关证据
当OpenAI o1 pro发布时,Steve立即注册并将其与Gemini Experimental 1206进行了比较。然后,确定两者都适合推进诉讼工作,但o1在理解案例法和预测辩护方面明显更优越。
兄弟俩确定了完整的工作流:
1 另一原告Chris创建了一个证据数据库,翻阅了案件的档案,并编写了Python脚本,生成了数千行数据,包含Genesis破产案件中的全部条目,还包括来自其他针对Genesis和DCG诉讼的法庭记录条目。
2 然后,利用o1对最重要的文件进行了总结(忽略了诸如服务证明和出庭通知等条目)。
3 最终,得到了可以放入单一上下文窗口的摘要。模型可以在单一上下文窗口进行推理并定位到最相关的证据。o1认为,几乎第50至90段中的所有引述都是该案的有用证据,并且它总是逐字正确地引用它们。
Gemini工作流:持续评估
由于Gemini Experimental 1206版本可能没有「思考」或进行多轮思考,它在某些情况下比o1更容易发生幻觉。
然而,不知为何,虽然在各种工作成果中,Gemini评估用户工作的能力很有用, 但Gemini在方面显得更具争论性和更加消极。
使用Gemini的关键在于,它通常在开始时会非常消极。它评估了第一版的起诉状,认为该起诉状可能会被驳回。Gemini 1206(但不包括早期版本)在多次运行中非常一致,允许通过相同的提示词对同一结果进行持续的评估。
Steve将起诉状输入Gemini至少100次,并要求它给出反馈,它总会提供反馈,甚至包括「给你一个建议:这不像律师写的风格。」
AI模拟法庭
当起诉状接近完成时,兄弟俩在去年12月20日到30日进行了一系列模拟。
圣诞节这一天,OpenAI流量可能较少,他们充分利用这一机会,可以长时间地使用o1 pro。
虽然o1擅长起草文件,但o1 pro的推理能力才得以继续进行诉讼。
Steve采用的方法就是通过AI模拟法庭审判流程。
一开始,Steve通过将起诉状直接粘贴到o1 pro中,并要求它评估驳回的辩护意见来进行模拟。但后来,Steve偶然间发现了一个新的思路:如果让o1 pro首先生成驳回动议,它的准确度会更高。
因此,提示词是这样的:「你是一个经验丰富的辩护律师,这对我的事业至关重要。考虑所有可能的驳回理由,无论其强弱。然后,写出你能想到的最全面的驳回动议,代表被告 [在此插入每个被告的名字,重复 3 次]。输出你完整的驳回动议,提交到法庭并供法官审理。」
接下来,在动议生成后,提示词是:「你是一个联邦法官。评估这份起诉状和辩方的驳回动议。输出一个全面的裁决,说明你是否允许此案继续进入证据交换阶段。确保决定的每一部分都能得到解释。」
Steve模拟了多次,最后「法官」在10次模拟中一次也没有拒绝动议。
使用Gemini时,「法官」基于最终的起诉状10次模拟中拒绝了2次动议,但其推理显示它误解了事实。
虽然边际收益已经开始递减,但Steve不能确定这些驳回是由于Gemini较弱的推理能力(毕竟事实如此),还是因为忘记加入自以为众所周知的关键事实信息。而后者可能导致人类法官也误解起诉状。
预测胜率
他们还利用o1 pro进行概率分析,评估其可能采取的不同立场——从可能提出的主张到诉讼策略。
他们让o1 pro给出不同立场下的胜诉几率,特别是揭露特定事实时。他们利用Claude 3.5 Sonnet和Gemini 1206交叉检查了这些胜诉几率。
因为生活与此案息息相关,他们继续通过多个模型进行交叉验证。但他们已经意识到o1 pro的准确度非常高,以至于如果有必要,它可以成为唯一依赖的分析工具。
o1 pro可以通过利用被告自己的立场(因为他们涉及了大量诉讼),来预测他们在此案中的辩词。这对两兄弟帮助非常大。
他们还能够创建一个数据库,以便被告在提交动议时,迅速判断是否与过去三年的法庭文件相互矛盾。
最后,他们通过两天的模拟,利用不同的模型彼此对抗,评估了被告可能会采用的辩护策略。
他们观察了AI模型如何执行这些策略。然后,更进一步,告诉模型故意采用一些策略,如「提交无理动议」、「威胁原告寻求制裁」、「通过消耗原告的耐性让他们放弃」、「尽可能多地加入被告」、「提交大量交叉诉讼和反诉」、「互相推卸责任」等等。
一旦被告采取这些策略,却不知道原告对此早有准备。
诉讼计划
在诉状提交之前,他们使用o1制定了诉讼计划。
例如,模型预测诉讼将需要大约1300小时的工作。它预测创建诉状需要160小时,这与实际花费的220小时非常接近,因为很多工作仅仅是反复阅读像联邦证据规则这样的文件。
他们还要求o1和o1 pro制定一个主线时间表,并明确需要进一步发现的证据。幸运的是,在这种情况下,所需的大部分证据已经是公开的(正如诉状所述)。所需的少量证据是由模型建议的,Steve利用额外的知识编辑了o1 pro的计划。
回应「否定者」
尽管细节直到诉状提交后才公开,但原告Steve在网上早已明确,这个案件即将开庭,并且它将由AI指导。
最常见的批评之一是,这样的案件需要多年的努力,「你不知道你在陷入什么。」
Steve回应了这种批评:
「第一点是,我们显然知道此案将耗费数年的精力;o1 pro实际上估计的时间比我们最初预测的2000小时要少。然而,鉴于我们90%的净资产都被被告拿走了,我们所花时间的经济价值莫过于打这个官司。」
「至于有人批评我们在没有律师的情况下,接手这么大的一个案子会让我们付出很多,但我们根本没有付出任何代价。在此之前,这个案子的价值为零,因为没有大笔保证金,没有律师会接手这个案子,而且正如我们前面所说,被告拿走了我们所有的钱。现在,既然已经立案,它的价值就不止是零了。即使胜诉几率很低,AI公平竞争的环境也使其值得一试。」
但说到胜算,无论是原告自己的估计还是模型的估计,其实都不低。而且原告对胜算也非常乐观。他们已经削减了开支,腾出了未来几年的时间。现在Steve利用晚上和假期阅读《美国民事诉讼规则》和有关欺诈的判例法。
他们将通过法律庭审来解决这个问题,争取因被告的故意行为而获得应得的三倍赔偿,必要时将为上诉进行辩护,如果真的到了那一步,他们将迫使被告破产。
Steve表示:「为了胜利, 我们全力以赴。」
虽然Altman和OpenAI经常受到批评,但在这种情况下,Steve要感谢他们给予了机会,让他们有机会实现花费20年规划的生活。
Steve说,这次努力是「AGI让世界变美好」的一个具体的例子。
背景信息
该诉讼案名为Sokolowski等诉Digital Currency Group等,指控被告Barry E. Silbert和前Genesis Global Trading首席执行官Michael Moro欺诈Stephen Sokolowski和Christopher Sokolowski。
原告称被告明知故犯地签署了一份虚假的11亿美元的本票,该本票随后被用来生成虚假资产负债表,导致原告依赖虚假的负债表决定是否续借给Genesis的贷款。起诉状封面如下:
根据宾夕法尼亚州不公平贸易行为和消费者保护法所允许的三倍损害赔偿,该诉讼要求被告返还从原告那里欺诈所得的数字货币,当前价值为2607万美元。
由于Sokolowski两兄弟仅在去年12月就花费了超过200小时处理此案,因此本文无法涵盖AI在法律设定中的所有细节,但原告Steve表示「会尽力提供初步的一般概述,待后续补充更多细节」。
在接下来的几周里,Steve将继续发表有关此案的文章,讨论申诉准备期间的情况。其中一篇文章将讨论每种模式的具体提示和优缺点。
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有