裁判文书数据搜索新网站【有法网】

前言

作为同行,关注了不少法律类网站,最近发现了一个新网站:有法网,部分功能相当北大法宝等收费网站。

初探

  1. 首页比较简洁,只有一个关键词输入框,能够根据关键词智能提示。

  2. 搜索后进入有法网搜索页,搜索结果比较详细,事实、裁判理由、判决结果都有。缺点市搜索页的加载速度一般,1s到10多s不等。

  3. 有法网搜索页有个高级搜索功能,与裁判文书网类似,该有的都有。

    按城市、案件类型、法律依据搜索看一下。
    图被吃了
    这次加载速度还算挺快。其它搜索条件就不一一试了。

小技巧:在案件名称中输入“判决书”就可以搜索判决书的文书了。
  1. 进入详情页youfawang.cn/detail/b4a0dc658f7c33874a446c41b60acd62.html看下,秒速打开。内容很详细,刑|期、处|罚、律师、律师事务所等都有,还有被告详细信息。

    貌似就这些。
    比较期待它的数据分析功能,因为它所含有的字段信息挺全面,分析维度更多。

正题,分析网站源码

  1. F12 大法一走,直接死循环,不让分析。小case,参照之前的文章解析解除禁用。
  2. 看一下搜索参数。
    网站发私信来请不要公开详细分析,你懂的。
  3. 其实整体流程走下来,也没太大难度。

难点:

  1. 后台人机识别验证;
  2. sojson加密,其实可以忽略,没什么用。
  3. 检测到异常请求的话,需要登录。

结语

看到有层出不穷的法律类网站出来,还是感到挺欣慰的,方便了法律工作者。还是那句话,爬虫请限制请求频率,做个有职业素养的程序猿,不要给对方服务器造成太大压力。

裁判文书数据搜索新网站【有法网】相关推荐

  1. A股上市公司裁判文书数据

    一.数据简介   裁判文书上网是司法公开的重要一环,2013年11月13日最高人民法院审判委员会第1595次会议通过,自2014年1月1日起施行的最高人民法院<关于人民法院在互联网公布裁判文书的 ...

  2. 裁判文书数据-大数据分析用例

    caipanwenshu 裁判文书数据 可以用来做简单的分词,NLP,统计,分析,顺便完成一个毕设 中国裁判文书,‎刑事案件 民事案件 行政案件 赔偿案件 执行案件 数据说明: 链接:https:// ...

  3. 百度/谷歌/搜狗/360搜索/新网站提交与收录入口

    1.百度新站提交与收录入口 首先进入网站收录入口,符合要求的1个月内一般会收录. http://www.baidu.com/search/url_submit.html · 一个免费登录网站只需提交一 ...

  4. 【基础】裁判文书数据粗略分析,pyecharts的基本用法

    [基础]裁判文书数据粗略分析,pyecharts的基本用法 前言: 想介绍一下pyecharts的基本用法,就做个统计吧,数据来源于中国裁判文书网,关于"合同诈骗"刑事数据统计. ...

  5. 2021年10月最新使用selenium爬取裁判文书数据(本文仅供技术交流使用)

    作为一个java菜鸡,想了解一下python的爬虫,据说文书网反爬很厉害,遍去试试 好嘛 我去,啥啊,不讲武德 这个网站的特点首先符合了政府网站响应慢的特点,7百亿的访问量...,再加上时时刻刻的小机 ...

  6. 2021-04-01裁判文书网数据python爬虫更新下载

    长期持续更新数据 2020-11-08裁判文书网数据python爬虫更新下载添加链接描述 截至3月已从数据库中下载1亿1200万条裁判文书数据,有需要数据的伙伴可以(。・∀・)ノ゙嗨前台QQ7900- ...

  7. 2020-11-08裁判文书网数据python爬虫更新下载

    2020年9月1日更新 文书网2020年8月31日晚更新之后就需要手机注册验证登录了,所以,账号是个问题. 分析 1. 登录 比较简单哦,主要难题是多账号的登录及session的更新维护. 2.其它 ...

  8. [请教]关于超大数据量网站的数据搜索和分页的实现方法

    请教像阿里巴巴这样的数据量过百万的网站,其数据搜索和分页是如何实现的? 我个人是用全文索引做的,把物品名和物品简介放在一起,检索这个字段. 分页是用存储过程做的, CREATE PROCEDURE G ...

  9. Python爬虫Selenium手动接管Edge爬取裁判文书网“环境污染”数据(Mac环境)

    目标数据:爬取从2007年到2022年,各地级市中级法院历年关于"环境污染"的裁判文书数量. 由于裁判文书网需要登录,Selenium手动接管爬取可避免频繁登录造成的封号风险. S ...

最新文章

  1. hadoop大数据--深入讲解hdfs源码
  2. C++阶段01笔记02【数据类型(整型、sizeof关键字、实型(浮点型)、字符型、转义字符、字符串型、布尔类型 bool、数据的输入)】
  3. C语言数据结构与算法
  4. 理解流量监管和整形的关键算法—令牌桶
  5. python代码测试_Python入门学习系列——Python代码测试
  6. english 2012020601
  7. 京东11.11晚8开启四小时累计售出商品超1.9亿件
  8. mysql的设计模式_数据库设计中使用设计模式
  9. 关于java是最好的语言的段子_疯狂java——第一章 java语言概述与开发环境
  10. 涂抹Oracle—三思笔记之一步一步学Oracle
  11. mysql 字符串拼接 null_mysql字符串拼接并设置null值的实例方法
  12. java中solr的面试题_面试:----利用solr实现商品的搜索功能
  13. 如何做无线抄表既SCADA无线数据采集管理系统
  14. C语言中文件指针,文件位置指针,详细解析
  15. 推荐10个国外的开源免费的.NET CMS系统
  16. 日常篇(持续更新ing)
  17. java EE crm代码_基于jsp的小型企业CRM-JavaEE实现小型企业CRM - java项目源码
  18. 赫兹的单位换算_hz是什么单位(频率和赫兹的换算)
  19. 韭菜简史:快招加盟的致富骗局
  20. HR/FR/EFR/AMR

热门文章

  1. 2021-11-16爬取淘宝商品信息时如何获取cookie
  2. java中文数字与阿拉伯数字相互转换
  3. RecyclerView使用GridLayoutManager 设置间距一致大小
  4. Konga面板接入LDAP踩坑实战
  5. 什么叫能力不行,什么叫术业有专攻
  6. Debian 安装 ldac
  7. pytorch1.13启用caffe2
  8. linux 安装 T400 无线网卡驱动
  9. 头文件和库函数的区别
  10. UCOSIII任务调度和任务切换