【重磅】清华大学法学院教授何海波:以数据推动法治(视频+PPT)

本讲座选自清华大学法学院教授何海波于2018年3月23日在RONG系列——“大数据与司法”专场论坛上所做的题为《以数据推动法治》的演讲。

以下为讲座现场视频,视频时长约20分钟,wifi用户及流量土豪请随意,图文版回顾见下文:

https://v.qq.com/x/page/d0613u5evr6.html

清华大学法学院教授何海波发表“以数据推动法治”的主题演讲,为大家介绍了他本人针对智慧司法所做的研究。何教授呼吁社会各界能够同心推动数据融合、数据开放,发挥数据的价值,为人民造福

 

演讲正文:

1、中国裁判文书网

2014年,最高法院建立了全国统一的裁判文书公开评判,把全国各地法院制作的判决书、裁定书和其他的文书都统一上传到中国裁判文书网。截止目前,已经积累了4337万裁判文书。通常一份裁判文书有几页纸,长的有几十页,四千多万裁判文书包含了巨大的信息金库。今天能走到这一步,得益于高法院,特别是周强院长的大力支持

2、最高法院的推进在制度上的体现

第一,原来规定主要的裁判文书公开,而现在法院对外发布的裁判文书几乎都公开,这是一个巨大的进步。

第二,在推进机制上,最早规定的是公开的裁判文书要请法院主管领导签字再上传。因为这样很麻烦,大家都不愿意公开,所以公开的成效不显著。后来,规则改为凡是不公开的裁判文书,需要主办法官说明理由,并且请法院的主管领导签字。因此,数量迅速上升。

3、判决书上网

2010年,当我在北大读研究生的时候,发表过一篇文章,叫判决书上网。我曾设想全国的裁判文书都上传到一个统一的网站,使大家都能查阅。当时,我自己都觉得这是很浪漫的想象,没想到今天它在很大程度上已经实现了。不但法院对外的裁判文书公开,而且前几天最高法院发布规定,内部的一些审判流程的文书,今后也要公开。

所以,这个裁判文书公开的数据库会越来越庞大。今天,它已经是世界上最庞大的法律文书的数据库。这也是其他国家难以想象的。

当然,这有我们的制度优势。我们最高法院一声令下,全国就可以干起来。然而,美国的最高法院没有这样的权利。即使国会有这样的权力,最多也只能管联邦系统的,管不了州法院。这也体现了我们的制度优势,也得益于决策者的魄力和雄心。

昨天,我检索了一下,裁判文书网上历年的裁判文书数量从2001年开始算(几乎是忽略不计),到13年、14年迅猛增长。17年做出来的裁判文书数量已经很大,每天以几万的数量在增长,每年以上千万的数量在增长,今后增长的可能是几千万的数量。

如下图所示:

裁判文书的公开对司法的管理,对法学的研究,对法制建设都带来了巨大的影响。原来法院系统搞一点数据,最高法院制发一个统计样表,基层层层填报。你如果看法院的统计表,一张统计表几千个数据,背后不知道要多少人工。

4、统计方式的改进

现在,从理论上来讲,这些数据都可以在法院的数据库里自动生成,而且还有一个好处更迅速。如果等一层一层上报,即使一些单向的统计数据也得一个星期,而现在几分钟就能生成,这在过去完全无法想象。

而且,统计的项目,几千个都算小的。理论上讲,你要几万个,几百万个都能够做到。

如上图所示,我用最高法院统计公布的数据,画了一个刑事诉讼的数据,背后不知道有多少人工的付出。但至少在理论上,今后我们可以用几个小时的时间来实现这种统计的结果。

5、评估司法改革的绩效、法律运转

这种研究还可以用来评估司法改革的绩效,评估法律运转的方式。我们都说法院规定是一回事,实际怎么样又是另一回事。

那么我们怎么样能知道法律的实际运转呢?

1统计分析

这方面有不少学者做了一些研究。比如,统计离婚案子,到底离婚的多少是有小孩的,平均结婚多少年,是男方提出多,还是女方孩提出多。根据一个法院的经验,根据纸面上的数字统计是很困难的,而且还有人力的限制。我们有同事找一波学生,统计八千份案件,那是极限。现在我们完全可以实现对几百万几千万的裁判书进行统计分析。

2)人民陪审员

我自己不久前做了一个小的项目,来评估司法改革的项目,就是人民陪审员。中国坐在法庭上审案子的除了法官,还有一种人叫人民陪审员,理论上讲他就是普通的老百姓。

最近中央有一个要求,随机的抽取老百姓担任陪审员,陪审员随机的参与案子,能做到吗?我对裁判文书分析以后发现并没有做到,有些法院,我看一些陪审员三年里边能审上千个案子,我右边列的都是三年里边审过上千个案子,这还是根据公布的裁判文书做的统计。

实际上,他们审理的案子是翻倍的,可能他审理的案子比法官还多,这样肯定不是随机挑选出来的,他们是职业陪审员

3不忘初心

不管是什么原因,我们司法改革的初衷是没有实现的。这使我们反省我们原来的目标设定是对还是错。这样一种数据对我们改革决策是有意义的。

我自己也参与一些司法改革过程的讨论,我原来感觉我们法学院的学者对现实太无知。我们坐在那里尽管名义上是专家,我们都在拍脑袋说话,但是有这些数据支撑以后,局面稍微改观一些。

6、增强可预见性,实现同案同判

当然,裁判文书还有更多的意义。我们对海淀的裁判文书进行分析以后,能够得出一个结论:当一个案子到了以后,能预测法官未来怎么判案,以及过去某一个案子判法是不是有点离奇。

尽管法院不是说必须跟绝大多数案子判决保持一致,但是在法治社会,只有同类的案子做到同样的判决,才符合这样的要求。

那么对这种海量的裁判文书怎么保证同类同判?

我们原来搜索关键词,比如杀人罪,什么时候被该判死刑,什么时候不该判死刑。但是它的缺点是什么,必须找到一个关键词如果关键词找不到,不确定,就没法进行是否是同类的甄别。

我跟清华大学计算机的老师、博士生一起合作,试图利用人工语言的识别来确定同类案子比如我们日常语言里面,我在公交车上丢了一个手机,有人捡走不还我,他是不是构成盗窃罪或者什么犯罪?如果用这样的语言去检索,他识别不了。法律说的是我在公家车上丢失了一个财物,人家拾到不还,是不是构成盗窃罪?就是有一个特定场景的交通工具,这需要自然语言识别

我这个课题只做了一半,我希望人工智能的发展能帮助我们法律界实现这样的梦想。

7、存在的问题

第一,裁判文书公开存在的问题

(1)裁判文书公开尽管取得了过去难以想象的巨大进步,但是它改进的空间仍然是非常大。还有许多应当公开的裁判文书没有公开

原因是多方面的,其中一个可能是技术原因如果一个法官办结的案子,法官一点击自动就能上传,以后就有更多的裁判文书可以上传。现在法官交给审管办,审管办再省管办,经过层层转折,而且也有在上传的过程中丢失数据。

公开不到位还可能有制度原因如果我们把裁判文书公开作为法官结案的程序之一,那肯定做到该上传的都上传,现在没有这样的要求。

2文书的关联性还有待改进

现在都是按照文书来上传,就没有建立关联。一个案子除了一审还有二审,有的还有再审,怎么样能把这些文书关联起来,让我们知道这都是一个案子的裁判文书。现在还没有解决这个问题。

3文书中敏感信息的处理不规范

我们裁判文书不是把内容百分之百的都公开,如果涉及到敏感信息,比如离婚案子几乎不公开,还有一些涉及到应当公开的裁判文书。但是有些信息不公开,比如涉及到个人隐私的,还有身份证号码是不公开的。

现在网上公开有两个相反的情况,有一些是应当做隐蔽处理的没有隐蔽,把人家的隐私公开了,还有的是过分的隐蔽,把何海波变成了某某某,他住在北京市海淀区哪里,这些信息也都去掉了,这对文书的利用带来了很大的影响。

比如我要做一个课题——地方保护,如果把当事人的地址都隐掉了,我都没法判断他跟法院是不是同一个地方,这对我们的研究带来很大的影响。

第二,使用中的问题

网速不稳定,经常进不去。检索也有待改进。

8、建议

第一,进一步推动裁判文书的上传工作

把法院内部的硬件建设和制度建设同步推进,除了以内部考评促进法官公开,还要引入外部测评机制。

二,加强法院与数据公司的合作

现在去看法院的裁判文书,禁止为了商业目的去复制,法院的意思是说大家都用我的,你们自己不许用。但是,法院又挡不住那么多的数据公司利用爬虫去爬这个数据。

我参与法院讨论的时候,我认为裁判文书是公共的信息,免费提供。现在我改变了观念,一般的老百姓自己在裁判文书网检索是可以免费使用,但是对数据公司可以收一点费用,人家也不用爬虫了,把能够公开的数据整体给人家,数据公司也能够公开的竞争。

法院主要是汇集裁判文书进行初步的检索,然后把数据给数据公司,让数据公司进行深加工,法院不要跟数据公司去竞争,法院做法院的,数据公司不管是在界面上,检索能力上都可以比法院做的更深入,更漂亮。法院自己去做这样的事情吃力不讨好,而且很难真正做好。

第三,建立法院和学者、数据公司的全面合作

公开的裁判文书有很多局限,我们想利用全数据进行研究,但是就会碰到很多的阻碍,你这个学者是不是可靠?何海波是什么人?你想干什么?利用这个研究是不是要做对法院和政府形象不利的事情?他就有很多顾虑。

顾虑不是没有道理,但是要有适当的界限。我们建立一个机制,让学者和法院融洽的合作。如果让学者参与,我们可以做更多更好的数据。因为我们有更鲜明的问题意识,我们也有更具体专业的法律知识,我们有更充裕的时间,我们可以花几个月甚至几年时间做一个课题,这是法院的同志做不到的。法院他们能做的就是领导要什么赶紧给什么。这方面法院建立一个更良好的机制,跟学界,跟数据公司建立合作关系。

9、想法

建立法制需要几样东西。

第一,需要法制靠人来运作

第二,需要制度需要一些规则

第三,法律除了硬件之外,法律也需要数据这种数据的挖掘提取,为我们中国正在成长的法制提供一个强大的助推力量。如果我们能够把数据建设搞好,我想对中国法制的推进功劳应当是不小的。

谢谢大家!

整理:杜佳豪

【重磅】清华大学法学院教授何海波:以数据推动法治(视频+PPT)相关推荐

  1. 何海波:以数据推动法治(附PPT、视频)

    2018年3月23日,清华校内举办了"清华RONG系列论坛之司法大数据专场"活动,清华大学法学院教授何海波发表"以数据推动法治"的主题演讲,为大家介绍了他本人针 ...

  2. 法大大联合清华大学法学院研讨“电子证据与劳动法”

    近日,由清华大学法学院主办.法大大和白话劳动法协办的"电子证据与劳动法"研讨会在清华大学举行,活动邀请了数十位来自全国各地的学术界.司法界和市场方的专家.学者,围绕电子证据.劳动法 ...

  3. 获奖者:武永卫,男,清华大学计算机系教授、博士生导师,《大数据》杂志编委。...

    武永卫,男,清华大学计算机系教授.博士生导师,<大数据>杂志编委.主持过"863"计划."973"计划.国家自然科学基金.CNGI.欧盟FP6.中法 ...

  4. 获奖者:舒继武,男,清华大学计算机系教授、博士生导师,教育部长江学者特聘教授,国家杰出青年基金获得者,《大数据》杂志编委。...

    舒继武,男,清华大学计算机系教授.博士生导师,教育部长江学者特聘教授,国家杰出青年基金获得者,<大数据>杂志编委.主持了国家"863"计划重大专项.国家科技重大专项.国 ...

  5. 清华大学王建民:在大数据的思维下,人人都是冰冷的数据包?

    文章来源:慕华学堂 王建民,清华大学软件学院院长.数据科学研究院副院长.研究领域包括大数据与知识工程.非结构化数据管理.业务过程与产品生命周期管理.数字版权与系统安全技术.数据库测试技术等. 在近日刚 ...

  6. 清华大学张长水教授:机器学习和图像识别(附视频、PPT下载)

    本篇干货整理自清华大学自动化系教授张长水于2018年4月27日在清华大学数据科学研究院第二届"大数据在清华"高峰论坛主论坛所做的题为<机器学习和图像识别>的演讲. 注: ...

  7. 全职任教清华,73岁丘成桐受聘清华大学讲席教授

    来源:机器之心 机器之心编辑部 首位华人诺贝奖获得者杨振宁先生,首位华人图灵奖获得者姚期智先生,首位华人菲尔兹奖获得者丘成桐先生,现已齐聚清华. 正值清华大学求真书院成立一周年之际,担任求真书院院长的 ...

  8. 清华大学刘知远教授新作,图神经网络最佳解锁方式 | 送书福利

    学习图神经网络,你怕了吗? 深度学习领域的顶级大会(International Conference on Learning Representations),在几个月前,有人分析了提交给该大会的论文 ...

  9. 清华大学数学教授吐槽不会做孙子的小学奥数:这学的不是数学,是戏法

    这几天,清华大学教授王文湛的一个老视频火了.去年9月,他在一场演讲活动中,批评大众忽视数学基础教育的重要性,感慨现在太多孩子扎堆学奥数,学的不是数学,而是技巧.戏法."我的孙子,小学六年级也 ...

最新文章

  1. 如何在Tensorflow.js中处理MNIST图像数据
  2. Ajax传递路径问题及解决
  3. JQuery实现Ajax跨域访问--Jsonp原理
  4. hdu1024 最大m子序列和
  5. php 导出csv 转义 逗号转义,在csv php中转义换行符
  6. 十、Go协程的调度,互斥锁,计数器和线程池
  7. 心电信号的PQRST模拟matlab代码(转载+自己调研汇总)
  8. regex 正则表达式_使用正则表达式(Regex)删除HTML标签
  9. 每日一题——leetcode237 删除链表中的结点
  10. 【云栖直播】精彩推荐第3期:个性化推荐系统搭建实践
  11. linux下无法删除文件夹,linux服务器下完美解决无法删除虚拟主机文件或文件夹...
  12. 数据挖掘:模型选择——监督学习(回归)
  13. unity WebGL射线检测
  14. PHP1c型GNAS,【临床研究与实践】儿童假性甲状旁腺功能减退症20例临床特征与GNAS基因缺陷分析...
  15. 经典算法-BF算法(字符串匹配)
  16. c语言中的加减乘除字母,C语言加减乘除运算
  17. 如何及时汇报反馈工作
  18. 微信小程序php开发实例,微信小程序教程之demo:猫眼电影实例
  19. 华为ensp,wireshark3.0.0,virtualbox 5.2.22 安装包
  20. Python 实现远程服务器(ssh)批量执行命令

热门文章

  1. 【合作】云计算基础架构【图】
  2. DirectX12(D3D12)基础教程(三)——使用独立堆以“定位方式”创建资源、创建动态采样器、初步理解采取器类型
  3. vue 上实现无缝滚动播放文字系统公告
  4. EasyX学习笔记(二、黑客帝国数据流)
  5. 【分布式系统】唯一ID生成策略总结
  6. 蛊惑者马云发家史(曾推毛氏运动唐僧团队)二
  7. android9.0官方壁纸,Android 9.0 修改默认壁纸(主壁纸和wapppaper)
  8. MySQL多表查询大全(超精确)
  9. 并发编程之CPU缓存架构缓存一致性协议详解(二)
  10. 使用UnrealPak.exe创建Pak文件