裁判文书数据搜索新网站【有法网】
裁判文书数据搜索新网站【有法网】
前言
作为同行,关注了不少法律类网站,最近发现了一个新网站:有法网,部分功能相当北大法宝等收费网站。
初探
首页比较简洁,只有一个关键词输入框,能够根据关键词智能提示。
搜索后进入有法网搜索页,搜索结果比较详细,事实、裁判理由、判决结果都有。缺点市搜索页的加载速度一般,1s到10多s不等。
有法网搜索页有个高级搜索功能,与裁判文书网类似,该有的都有。
按城市、案件类型、法律依据搜索看一下。
图被吃了
这次加载速度还算挺快。其它搜索条件就不一一试了。
小技巧:在案件名称中输入“判决书”就可以搜索判决书的文书了。
- 进入详情页youfawang.cn/detail/b4a0dc658f7c33874a446c41b60acd62.html看下,秒速打开。内容很详细,刑|期、处|罚、律师、律师事务所等都有,还有被告详细信息。
貌似就这些。
比较期待它的数据分析功能,因为它所含有的字段信息挺全面,分析维度更多。
正题,分析网站源码
- F12 大法一走,直接死循环,不让分析。小case,参照之前的文章解析解除禁用。
- 看一下搜索参数。
网站发私信来请不要公开详细分析,你懂的。 - 其实整体流程走下来,也没太大难度。
难点:
- 后台人机识别验证;
- sojson加密,其实可以忽略,没什么用。
- 检测到异常请求的话,需要登录。
结语
看到有层出不穷的法律类网站出来,还是感到挺欣慰的,方便了法律工作者。还是那句话,爬虫请限制请求频率,做个有职业素养的程序猿,不要给对方服务器造成太大压力。
裁判文书数据搜索新网站【有法网】相关推荐
- A股上市公司裁判文书数据
一.数据简介 裁判文书上网是司法公开的重要一环,2013年11月13日最高人民法院审判委员会第1595次会议通过,自2014年1月1日起施行的最高人民法院<关于人民法院在互联网公布裁判文书的 ...
- 裁判文书数据-大数据分析用例
caipanwenshu 裁判文书数据 可以用来做简单的分词,NLP,统计,分析,顺便完成一个毕设 中国裁判文书,刑事案件 民事案件 行政案件 赔偿案件 执行案件 数据说明: 链接:https:// ...
- 百度/谷歌/搜狗/360搜索/新网站提交与收录入口
1.百度新站提交与收录入口 首先进入网站收录入口,符合要求的1个月内一般会收录. http://www.baidu.com/search/url_submit.html · 一个免费登录网站只需提交一 ...
- 【基础】裁判文书数据粗略分析,pyecharts的基本用法
[基础]裁判文书数据粗略分析,pyecharts的基本用法 前言: 想介绍一下pyecharts的基本用法,就做个统计吧,数据来源于中国裁判文书网,关于"合同诈骗"刑事数据统计. ...
- 2021年10月最新使用selenium爬取裁判文书数据(本文仅供技术交流使用)
作为一个java菜鸡,想了解一下python的爬虫,据说文书网反爬很厉害,遍去试试 好嘛 我去,啥啊,不讲武德 这个网站的特点首先符合了政府网站响应慢的特点,7百亿的访问量...,再加上时时刻刻的小机 ...
- 2021-04-01裁判文书网数据python爬虫更新下载
长期持续更新数据 2020-11-08裁判文书网数据python爬虫更新下载添加链接描述 截至3月已从数据库中下载1亿1200万条裁判文书数据,有需要数据的伙伴可以(。・∀・)ノ゙嗨前台QQ7900- ...
- 2020-11-08裁判文书网数据python爬虫更新下载
2020年9月1日更新 文书网2020年8月31日晚更新之后就需要手机注册验证登录了,所以,账号是个问题. 分析 1. 登录 比较简单哦,主要难题是多账号的登录及session的更新维护. 2.其它 ...
- [请教]关于超大数据量网站的数据搜索和分页的实现方法
请教像阿里巴巴这样的数据量过百万的网站,其数据搜索和分页是如何实现的? 我个人是用全文索引做的,把物品名和物品简介放在一起,检索这个字段. 分页是用存储过程做的, CREATE PROCEDURE G ...
- Python爬虫Selenium手动接管Edge爬取裁判文书网“环境污染”数据(Mac环境)
目标数据:爬取从2007年到2022年,各地级市中级法院历年关于"环境污染"的裁判文书数量. 由于裁判文书网需要登录,Selenium手动接管爬取可避免频繁登录造成的封号风险. S ...
最新文章
- hadoop大数据--深入讲解hdfs源码
- C++阶段01笔记02【数据类型(整型、sizeof关键字、实型(浮点型)、字符型、转义字符、字符串型、布尔类型 bool、数据的输入)】
- C语言数据结构与算法
- 理解流量监管和整形的关键算法—令牌桶
- python代码测试_Python入门学习系列——Python代码测试
- english 2012020601
- 京东11.11晚8开启四小时累计售出商品超1.9亿件
- mysql的设计模式_数据库设计中使用设计模式
- 关于java是最好的语言的段子_疯狂java——第一章 java语言概述与开发环境
- 涂抹Oracle—三思笔记之一步一步学Oracle
- mysql 字符串拼接 null_mysql字符串拼接并设置null值的实例方法
- java中solr的面试题_面试:----利用solr实现商品的搜索功能
- 如何做无线抄表既SCADA无线数据采集管理系统
- C语言中文件指针,文件位置指针,详细解析
- 推荐10个国外的开源免费的.NET CMS系统
- 日常篇(持续更新ing)
- java EE crm代码_基于jsp的小型企业CRM-JavaEE实现小型企业CRM - java项目源码
- 赫兹的单位换算_hz是什么单位(频率和赫兹的换算)
- 韭菜简史:快招加盟的致富骗局
- HR/FR/EFR/AMR