
近期,DeepSeek在持续引起社会各界的广泛关注。它不仅打破了算力堆积的发展模式,还以其卓越的技术实力推动了AI生态的全面繁荣。
截至2025年2月,万得DeepSeek指数年内猛涨超过60%以上,且有愈演愈烈之势。同时,多只人工智能主题ETF年内收益惊人,最高收益超500%,也进一步印证了市场对AI技术的热烈追捧。
但是DeepSeek并非在AI领域的“独舞者”,诸如文心一言、秘塔搜索、KIMI等公开AI大模型平台同样在百花齐放。
面对琳琅满目号称要“赋能法律人”“替代律师”的AI们,法律人们难免心动:如果能熟练掌握这些法律AI,是否可以大幅提升工作效率?
但问题也随之而来——AI的生成结果靠不靠谱?在众多选择中,哪个AI最靠谱好用呢?

01
这一次,我们从案例出发,看看各大AI针对同一困境给出的不同“解”法。
示例:
某有限责任公司的股东A认缴了100万元的出资,但一直未实际缴纳。公司因经营不善陷入债务危机,债权人起诉公司要求清偿债务,同时针对股东A,债权人该如何维护自身权益?
结合《公司法》进行回答。
————
各AI平台在不同状态下也给出的不同解法:
01. DeepSeek
【V3+联网】:
DeepSeek-V3在联网情况下仍然引用2018年第四次修正后的《公司法》,而非2023年的最新版本。

但进一步明确要求“请引用2023年修正后《公司法》的新内容进行回答”时,DeepSeek-V3迅速“反应过来”,引用了正确的法律条文,并给出了合适的答案。

【R1+联网】
拥有深度思考功能的DeepSeek-R1则毫不意外地表示:

但通过在秘塔搜索(metaso.cn)中运用DeepSeek-R1模型联网搜索,得到的回答非常全面,覆盖了各种情况,堪称本次实验中表现最全面的AI工具之一。
更重要的是,它准确引用了最新的《公司法》,并提出了较为合理的解决方案,展现了其在复杂法律问题上的强大潜力。

02. Qwen2.5-Max
Qwen2.5-Max是一款在超大规模数据上训练的大型语言模型,具备强大的逻辑推理、多语言支持、代码写作能力,尤其在复杂任务处理和多步骤推理中表现出色,此前在难以作弊的 Arena 榜单上,一度超越 DeepSeek-V3,一时风头无两。

然而,尽管其知识库覆盖到2024年12月,理论上应覆盖新版《公司法》的Qwen2.5-Max的初次回答同样出现了法条引用错误的问题,其提出的第46条和第83条内容均与新版《公司法》不相符。

尽管点名要求引用2023版《公司法》的第54条回答问题,Qwen仍然在沿用过时的《公司法》进行作答。

但在第二次点出问题后,Qwen终于给出了合适的答案。

遗憾的是,Qwen2.5-Max目前并不支持联网。若非如此,Qwen2.5-Max回答问题的准确性一定会有所提升。
03. KIMI
出乎意料的是,KIMI大模型的表现居然是最好的,在运用了正确的法条的同时,也给出了几个非常合理的答复。

根据小编以上的小测验来看:
总体来看,KIMI在回答基础法律问题的时候,能比较快地找到正确的法律和法条,并进行回答。
而相比之下其他的AI模型在处理特定的问题的时候,需要二次、甚至三次提醒,才能得出答案。
02
AI技术的百花齐放,让法律人们的“工具箱”变得琳琅满目,每个模型都有自己的“特长”。
但也正因如此,它们在面对不同的法律需求时,表现也参差不齐。
所以在这里,小编也要提醒大家:AI在法律领域具有潜力,但目前还在“实习期”。
我们在选择AI工具时,不能盲目跟风,而是要根据具体需求来挑选合适的“搭档”。
毕竟,选错了工具,就像拿着一把螺丝刀去修水管,不仅效率低,还可能把事情搞砸。所以,在使用AI辅助工作时,一定要牢记“检查+核验”的原则。
03
近日,由微软与卡内基梅隆大学合作开展的新研究揭示了一个令人担忧的现象:
过度依赖人工智能可能会对人们的批判性思维产生负面影响,进而导致认知能力的退化。
而AI技术的局限终将被更先进的模型所超越,或许还会涌现更多创新的科技手段,助力法律人轻装上阵。
令人担心的是,随着AI技术的不断进步,法律人们是否会逐渐丧失对案件的主导权?如果有一天,AI不仅能帮你查法条、写文书,还能替你出庭辩护,甚至直接做出判决,那究竟是谁在审判?谁在辩护?
AI时代的到来,究竟开创了人类探索的新篇,还是智慧消灭前的预兆?这个问题值得我们深思。
而法律人们要始终记住:法律,作为一门人文科学,终究离不开人的理性与判断。
如爱因斯坦所言:
“科学没有永恒的可信性”。
愿法律人在AI的羽翼下,不忘初心,以诗意的情怀,继续书写法律与人性的华美乐章,让正义之花在每一次裁决中绚丽绽放。
4001102288 欢迎批评指正
All Rights Reserved 新浪公司 版权所有
