律师也要职业危机?ChatLaw帮助普通人拥有自己的法律顾问
ChatLaw法律大模型近期出圈,发布上线当日即登顶知乎热搜榜第一,在Github已有近3k的star,被网友戏称之为大型模型中的“罗翔老师”。
ChatLaw法律大模型介绍
ChatLaw开源法律大模型来自北京大学ChatExcel课题组,目前仅提供学术参考的版本,其底座为姜子牙-13B、Anima-33B,模型使用大量法律新闻、法律论坛、法条、司法解释、法律咨询、法考题、判决文书等原始文本来构造对话数据,致力于给大众提供普惠的法律服务。
目前ChatLaw系列有三个版本:
- ChatLaw-13B:这是基于姜子牙Ziya-LLaMA-13B-v1(一个基于LLaMA 13B针对中文优化的微调的版本 huggingface.co/IDEA-CCNL/Ziya…)训练,这个版本中文支持很好,但是受模型参数大小的限制,逻辑能力相对较弱。
- ChatLaw-33B:这是基于Anima(一个开源的基于QLoRA的33B中文大语言模型)训练的版本,逻辑推理能力比较强,但是由于Anima中文语料不足,问答时经常会出现英文数据。
- ChatLaw-Text2Vec:使用了93万条判决案例做成的向量数据集,基于BERT训练的相似度匹配模型,可以根据用户提问的内容检索到最相关的法律条文。
模型架构:
总体架构需要涉及到三个模型,Keyword LLM,Law LLM(Embedding Model),ChatLaw LLM。
- Keyword LLM:用于将用户口语化的诉求转化为法律行业关键词,并用于检索知识库中的法律知识,作者专门加了这个步骤,改善因纯向量检索得到的知识效果可能不太好的问题。
- Law LLM:是作者专门训练的法律领域的BERT embedding模型,用于直接根据用户口语化表达检索相关法律知识,这个和关键词检索是结合使用。
- ChatLaw LLM:是最终的融合大模型,可以对检索出来的结果进行分析,提取关键内容,过滤不相关内容,最终生成相关回复。
训练数据:
训练数据主要由论坛、新闻、法条、司法解释、法律咨询、法考题、判决文书组成,随后经过清洗、数据增强等来构造对话数据。
官方地址:https://www.chatlaw.cloud
GitHub地址:https://github.com/PKU-YuanGroup/ChatLaw
ChatLaw Demo测试体验
ChatLaw 的学术 Demo 版本目前可以试用,遗憾的是没有接入法律咨询功能,只提供了简单的对话咨询服务。这里尝试问了几个问题,来测试ChatLaw与ChatGPT的对比效果。
问题一:在中国,音乐作品有哪些著作权权利?
ChatLaw
ChatGPT
问题二:另一半婚前贷款买的房子,婚后房子涨价了,如果离婚我有份额吗?
ChatLaw
ChatGPT
问题三:提出执行异议被驳回,但不提出执行异议之诉,而是另行提出所有权确认之诉,所有权确认之诉的审理能否阻却拍卖的执行程序?
ChatLaw
ChatGPT
通过对上述对比结果,我们发现相同问题下ChatLaw的回答更加专业,极大的解决了GPT的幻觉问题,同时得出以下观察结果:
- 引入与法律相关的问答和法规条文的数据,可以在一定程度上提高模型在问答上的表现。
- 加入特定类型任务的数据进行训练,模型在该类任务上的表现会明显提升。例如,ChatLaw 模型优于 ChatGPT 的原因是文中使用了大量的国内法律训练数据。
律师也要职业危机?ChatLaw帮助普通人拥有自己的法律顾问相关推荐
- 大数据会消灭律师这一职业吗?
所评图书: 书名:<法律人的明天会怎样?> 作者:(英)理查德·萨斯坎德 译者:何广越 出版社:北京大学出版社 出版日期:2015年10月 法律市场正在迎来剧变.所谓法律市场,指的是以市场 ...
- 职业危机的本质,是你始终停留在“新手期”
从我经手的职业咨询案例来看,很多人过了三十岁,会隐隐感到一丝不安与恐慌:到了三十五岁这个分水岭,有的就面临着尴尬的境地:除了一把年纪,该有的专业积累几乎为零,还是在吃毕业时的老本,拿着一份和能力不相称 ...
- 那些还在传程序猿35岁职业危机
那些还在传程序猿35岁职业危机的,来看看阿里这位马上40岁的程序猿怎么说- 管他什么35岁职业危机,自己把自己的身体照顾好,按时休息,保持锻炼运动,35岁也能用25岁的体力和外貌,而不是担心危机,与其 ...
- 浅谈程序员35岁职业危机
背景 最近帮一位资深架构大佬内推,结果最后被人事告知由于年纪超过35岁而被婉拒. 以往自己对于网上经常谈到的程序员只能干到35岁都是置若罔闻的态度,虽然嘴上也常常拿这话和朋友调侃,但内心却一直笃定,只 ...
- 大龄焦虑?如何看待程序员35岁职业危机?
往期精选(欢迎转发~~) Java全套学习资料(14W字),耗时半年整理 消息队列:从选型到原理,一文带你全部掌握 肝了一个月的ETCD,从Raft原理到实践 我肝了三个月,为你写出了GO核心手册 领 ...
- ChatGPT会取代律师这份职业吗?
如今,一种新型的人工智能威胁再次来袭,律师们可能会感到似曾相识的感觉.有人警告称,类似于ChatGPT的软件,因为具有类似于人类的语言流畅性,可能会取代大部分法律工作. 人工智能的进步曾让人们预测, ...
- 35岁职业危机本质是什么
35岁职业危机本质是什么? 文章来源是珠峰架构张仁阳老师的内部分享 简单来说,35岁职业危机的本质就是,丧失了"职场资本". 什么是职场资本?就是一个人在职场上,所拥有的稀缺技能. ...
- 职业危机:从无到有,从弱到强;反思再反思和应对措施
一.写在开头 每天每周不写点东西,不把脑中的疑惑写明白,就感觉不到每天的进步. 每天没进步,这北漂生活,何时是个头啊. 可以北漂10年,也可以20年,但不可能是一辈子. 因为我不是北京人呐. 二.持续 ...
- 对抗35岁职业危机,你要做好这三件事
对抗35岁职业危机,你要做好这三件事 前言 一.别从事不具备核心能力的工作. 二.选择成长型的工作 建立起你核心的可迁移能力. 即便是大厂,也要看是哪个车间. 同行的人,比要去的远方更重要. 在工作中 ...
最新文章
- PHP文件上传和文件操作案例
- JavaScript 消息框
- Python爬虫入门并不难,就看你如何选择?
- java 异步 web_Java web spring异步方法实现步骤解析
- Activiti工作流引擎使用
- Lambda expressions are not supported at language level ‘5‘
- 蠕变断裂 ansys_如何避免范围蠕变,以及其他软件设计课程的辛苦学习方法
- CCIE理论-第七篇-SD-WAN网络(二)
- 国家自然科学基金项目经费怎么用有了新规定
- 诗与远方:无题(七十三)
- python文本替换 数据库_用几行python代码实现大量文本文件里的文本替换
- 系统学习机器学习之正则化(二)
- 02.规划过程组表格-沟通管理计划
- Linux工作队列实现机制
- fanuc机器人示教器输入中文注释
- java 加载3d模型_实现在Java 3D中载入外部3D模型文件方法详解
- Web应用程序项目某某某已配置为使用IIS。无法访问IIS元数据库。您没有足够的特权访问计算机上的IIS网站
- 大神李沐被曝离职!投身大模型创业,GitHub项目已开
- 2021年中国亚马逊耳环市场趋势报告、技术动态创新及2027年市场预测
- 基于SSM实现的云商城购物系统