ChatLaw法律大模型近期出圈,发布上线当日即登顶知乎热搜榜第一,在Github已有近3k的star,被网友戏称之为大型模型中的“罗翔老师”。

ChatLaw法律大模型介绍

ChatLaw开源法律大模型来自北京大学ChatExcel课题组,目前仅提供学术参考的版本,其底座为姜子牙-13B、Anima-33B,模型使用大量法律新闻、法律论坛、法条、司法解释、法律咨询、法考题、判决文书等原始文本来构造对话数据,致力于给大众提供普惠的法律服务

目前ChatLaw系列有三个版本:

- ChatLaw-13B:这是基于姜子牙Ziya-LLaMA-13B-v1(一个基于LLaMA 13B针对中文优化的微调的版本 huggingface.co/IDEA-CCNL/Ziya…)训练,这个版本中文支持很好,但是受模型参数大小的限制,逻辑能力相对较弱。

- ChatLaw-33B:这是基于Anima(一个开源的基于QLoRA的33B中文大语言模型)训练的版本,逻辑推理能力比较强,但是由于Anima中文语料不足,问答时经常会出现英文数据。

- ChatLaw-Text2Vec:使用了93万条判决案例做成的向量数据集,基于BERT训练的相似度匹配模型,可以根据用户提问的内容检索到最相关的法律条文。

模型架构:

总体架构需要涉及到三个模型,Keyword LLM,Law LLM(Embedding Model),ChatLaw LLM。

- Keyword LLM:用于将用户口语化的诉求转化为法律行业关键词,并用于检索知识库中的法律知识,作者专门加了这个步骤,改善因纯向量检索得到的知识效果可能不太好的问题。

- Law LLM:是作者专门训练的法律领域的BERT embedding模型,用于直接根据用户口语化表达检索相关法律知识,这个和关键词检索是结合使用。

- ChatLaw LLM:是最终的融合大模型,可以对检索出来的结果进行分析,提取关键内容,过滤不相关内容,最终生成相关回复。

训练数据:

训练数据主要由论坛、新闻、法条、司法解释、法律咨询、法考题、判决文书组成,随后经过清洗、数据增强等来构造对话数据。

官方地址:https://www.chatlaw.cloud

GitHub地址:https://github.com/PKU-YuanGroup/ChatLaw

ChatLaw Demo测试体验

ChatLaw 的学术 Demo 版本目前可以试用,遗憾的是没有接入法律咨询功能,只提供了简单的对话咨询服务。这里尝试问了几个问题,来测试ChatLaw与ChatGPT的对比效果。

问题一:在中国,音乐作品有哪些著作权权利?

ChatLaw

ChatGPT

问题二:另一半婚前贷款买的房子,婚后房子涨价了,如果离婚我有份额吗?

ChatLaw

ChatGPT

问题三:提出执行异议被驳回,但不提出执行异议之诉,而是另行提出所有权确认之诉,所有权确认之诉的审理能否阻却拍卖的执行程序?

ChatLaw

ChatGPT

通过对上述对比结果,我们发现相同问题下ChatLaw的回答更加专业,极大的解决了GPT的幻觉问题,同时得出以下观察结果:

- 引入与法律相关的问答和法规条文的数据,可以在一定程度上提高模型在问答上的表现。

- 加入特定类型任务的数据进行训练,模型在该类任务上的表现会明显提升。例如,ChatLaw 模型优于 ChatGPT 的原因是文中使用了大量的国内法律训练数据。

律师也要职业危机?ChatLaw帮助普通人拥有自己的法律顾问相关推荐

  1. 大数据会消灭律师这一职业吗?

    所评图书: 书名:<法律人的明天会怎样?> 作者:(英)理查德·萨斯坎德 译者:何广越 出版社:北京大学出版社 出版日期:2015年10月 法律市场正在迎来剧变.所谓法律市场,指的是以市场 ...

  2. 职业危机的本质,是你始终停留在“新手期”

    从我经手的职业咨询案例来看,很多人过了三十岁,会隐隐感到一丝不安与恐慌:到了三十五岁这个分水岭,有的就面临着尴尬的境地:除了一把年纪,该有的专业积累几乎为零,还是在吃毕业时的老本,拿着一份和能力不相称 ...

  3. 那些还在传程序猿35岁职业危机

    那些还在传程序猿35岁职业危机的,来看看阿里这位马上40岁的程序猿怎么说- 管他什么35岁职业危机,自己把自己的身体照顾好,按时休息,保持锻炼运动,35岁也能用25岁的体力和外貌,而不是担心危机,与其 ...

  4. 浅谈程序员35岁职业危机

    背景 最近帮一位资深架构大佬内推,结果最后被人事告知由于年纪超过35岁而被婉拒. 以往自己对于网上经常谈到的程序员只能干到35岁都是置若罔闻的态度,虽然嘴上也常常拿这话和朋友调侃,但内心却一直笃定,只 ...

  5. 大龄焦虑?如何看待程序员35岁职业危机?

    往期精选(欢迎转发~~) Java全套学习资料(14W字),耗时半年整理 消息队列:从选型到原理,一文带你全部掌握 肝了一个月的ETCD,从Raft原理到实践 我肝了三个月,为你写出了GO核心手册 领 ...

  6. ChatGPT会取代律师这份职业吗?

    如今,一种新型的人工智能威胁再次来袭,律师们可能会感到似曾相识的感觉.有人警告称,类似于ChatGPT的软件,因为具有类似于人类的语言流畅性,可能会取代大部分法律工作. 人工智能​的进步曾让人们预测, ...

  7. 35岁职业危机本质是什么

    35岁职业危机本质是什么? 文章来源是珠峰架构张仁阳老师的内部分享 简单来说,35岁职业危机的本质就是,丧失了"职场资本". 什么是职场资本?就是一个人在职场上,所拥有的稀缺技能. ...

  8. 职业危机:从无到有,从弱到强;反思再反思和应对措施

    一.写在开头 每天每周不写点东西,不把脑中的疑惑写明白,就感觉不到每天的进步. 每天没进步,这北漂生活,何时是个头啊. 可以北漂10年,也可以20年,但不可能是一辈子. 因为我不是北京人呐. 二.持续 ...

  9. 对抗35岁职业危机,你要做好这三件事

    对抗35岁职业危机,你要做好这三件事 前言 一.别从事不具备核心能力的工作. 二.选择成长型的工作 建立起你核心的可迁移能力. 即便是大厂,也要看是哪个车间. 同行的人,比要去的远方更重要. 在工作中 ...

最新文章

  1. PHP文件上传和文件操作案例
  2. JavaScript 消息框
  3. Python爬虫入门并不难,就看你如何选择?
  4. java 异步 web_Java web spring异步方法实现步骤解析
  5. Activiti工作流引擎使用
  6. Lambda expressions are not supported at language level ‘5‘
  7. 蠕变断裂 ansys_如何避免范围蠕变,以及其他软件设计课程的辛苦学习方法
  8. CCIE理论-第七篇-SD-WAN网络(二)
  9. 国家自然科学基金项目经费怎么用有了新规定
  10. 诗与远方:无题(七十三)
  11. python文本替换 数据库_用几行python代码实现大量文本文件里的文本替换
  12. 系统学习机器学习之正则化(二)
  13. 02.规划过程组表格-沟通管理计划
  14. Linux工作队列实现机制
  15. fanuc机器人示教器输入中文注释
  16. java 加载3d模型_实现在Java 3D中载入外部3D模型文件方法详解
  17. Web应用程序项目某某某已配置为使用IIS。无法访问IIS元数据库。您没有足够的特权访问计算机上的IIS网站
  18. 大神李沐被曝离职!投身大模型创业,GitHub项目已开
  19. 2021年中国亚马逊耳环市场趋势报告、技术动态创新及2027年市场预测
  20. 基于SSM实现的云商城购物系统

热门文章

  1. 基于springboot高校学生健康打卡系统021009
  2. 使用F12调调伤眼睛的网页背景色
  3. 使用阿里云镜像加速安装docker
  4. 事件标志组/信号量区别_sdchguyi_新浪博客
  5. WACV 2021 论文大盘点-智能驾驶篇
  6. php正则匹配中文冒号,识别中文字符和标点符号的正则表达
  7. dplyr-summarise 数据分组进行统计描述
  8. Android数据存储、文件存储、SQLite数据库简单使用、 sharedPreferences存储(五)
  9. 微信小程序安装与开发步骤
  10. 每日一句学英语0418