斯坦福法学院搞了一个研究,发现AI已经超越法学教授了。
他们让16位法学教授,把AI写的答案和教授写的答案放一起做盲评,在将近3000次对比中,75%的情况下教授们更喜欢AI的回答。
要知道,法律这个学科没有标准答案,两个完全相反的论点可能都站得住脚,因此更考验答题者的推理、判断和对模糊地带的把握能力。
这才是这个研究厉害的地方。
再说出的那40道合同法的问题,都是学生下课或office hour会问的那种。
教授自己先写答案,然后AI也写一份,最后大家交叉盲评。结果AI的表现跟参与研究中最强的那位人类教授基本持平。
另外在答案质量方面,AI也全面碾压了。评审们觉得AI的回答会误导学生的比例有大约3.5%,而教授同行写的答案被认为有误导性的比例是12%。也就是说,在教学安全性上,AI反而翻车更少。
耶鲁法学院的合作教授Sarath Sanga表示:在大多数AI被测试的领域里都存在正确答案,如编程、数学,但法律里没有。他们想验证的是AI能不能达到律师之间互相评判的专业标准。
领头的斯坦福教授Julian Nyarko表示,这个研究证明的是AI回答的质量过关了,但怎么把AI工具落地到教学里、真正帮到学生,现在谈还太早。

