beautifulsoup 搜索第二个标签_自定义网站搜索教程
1、说明
自定义网站源是为了更大限度的扩展搜索结果,如果不会自定义也没关系,使用APP中推荐源就可以了,推荐源免嗅探,直接就能播放。
2、基本原理与参数
自定义站源规则,说白了就是APP直接请求所填的搜索网址,得到返回的 html 后,根据对应标签来定位,获取指定内容包括:text(也就是文字),href(详情链接)。
一般格式 class/id/tag.属性名@tag.标签名.定位数字@获取内容的类型
3、网站案例说明
我们拿 https://53ys.cc/ (网站域名更改了,之前是https://wsys.tv) 这个网站来说一下具体的规则。
浏览器打来网站后,F12或者右键选择“检查”选项以后,就打开了开发者模式,再刷新下网页,让网站显示手机适配模式。点击网站中的搜索功能,这里我们以搜索“钢铁”为例,搜索地址为 https://53ys.cc/vodsearch/so.html?wd=钢铁
4、完整规则
先给出如下网站完整规则,后面根据序号,详细说明每个的含义。
1、网站名称:无双电影
2、搜索优先级:1 (说明:优先级的意思就是当添加了多个站源时首先搜索哪一个网站)
3、请求类型:get(说明:网站的搜索提交规则为get请求)
4、请求编码:utf-8(说明:请求搜索词的编码类型,也就是“钢铁”两个汉字的编码类型,一般为跟网页编码一样)
5、网页编码:utf-8(说明:查看网页
头里面的编码规则,如果不填写跟网站相同的规则,请求后容易乱码)
6、HttpUserAgent (说明:一般请求为手机类型,这样页面能简单快速一点)
7、网站URL:https://53ys.cc (说明:网站的首页地址,此项为判断此站源的唯一标识)
8、搜索地址:https://53ys.cc/vodsearch/so.html?wd={search} (说明:在地址栏中获得网站的搜索网址,并且对应的搜索关键词用{search}来替代)
9、搜索结果列表规则:class.fed-part-layout fed-back-whits.0@tag.dl(说明:此项就是来获得搜索结果列表。上面规则的意思就是:全部html中的第1个的这个里面的全部tag标签为dl的内容。这样就会得到下面html返回的共10个内容。)
10、搜索结果列表每项地址规则:tag.h1.0@tag.a.0@href(说明:此项就是来获得每一项结果的具体url地址。上面规则的意思就是:第一个 h1 标签中的第一个 a 标签中的href内容,也就是“/detail/178525.html”。当防止出现相同标签的时候,可以加数字定位,第一个是 0,第二个是 1,第三个是 2,以此类推,默认不写的话就是所有的。)
11、搜索结果列表每项地址前缀:https://53ys.cc(说明:前面我们已经获取了每项结果的地址为“/detail/178525.html”,可以看出是个不完整的url,所以这一项的意思就是给他添加前缀补充完整,即“https://53ys.cc/detail/178525.html”)
12、搜索结果列表每项标题:tag.h1@tag.a@text(说明:每项结果的标题,规则的意思就是 h1 标签中的 a 标签中的text内容,因为只有一个h1标签以及其中只有一个a标签,所以定位数字默认可以不填写,获得文本内容即“钢铁侠”)
这样一个完整的网站搜索源就填写完成了,点击页面中的测试,来测试下搜索成功后,就可以保存了!
完整规则Json格式如下:
{
"name":"无双电影",
"serialNumber":"1",
"reqType":"get",
"reqCharset":"utf-8",
"htmlCharset":"utf-8",
"userAgent":"",
"baseUrl":"https://53ys.cc",
"searchUrl":"https://53ys.cc/vodsearch/so.html?wd={search}",
"ruleResultList":"class.fed-part-layout fed-back-whits@tag.dl",
"ruleResultLink":"tag.h1@tag.a@href",
"resultLinkPrefix":"https://53ys.cc",
"ruleResultTitle":"tag.h1@tag.a@text"
}
- ENJOY -
beautifulsoup 搜索第二个标签_自定义网站搜索教程相关推荐
- wp自定义帖子没标签_拼多多搜索智能推广和自定义推广区别在哪里?
大家好我是牧童,商家在开多多搜索的时候,会发现推广方案中有个智能推广以及自定义推广,很多商家不知道该如何选择,然后就两个计划都建了. 之后会发现有的时候智能推广的数据要比自定义推广好,但有的时候智能推 ...
- 钢铁苍穹html5,自定义网站搜索教程
1.基本原理与参数自定义站源规则,说白了就是APP直接请求所填的搜索网址,得到返回的 html 后,根据对应标签来定位,获取指定内容包括: text(也就是文字),href(详情链接). 一般格式 ...
- 搜索不包含关键词_秘迹搜索——不记录关键词、不追踪、过滤广告的搜索引擎...
今天,我们带来了一个可以保护个人隐私的网络搜索服务--秘迹搜索.秘迹搜索不会记录用户输入的查询关键词,真正做到搜索不留痕,彻底摆脱定向广告的骚扰. 谈到保护隐私,先来看看其他的网络搜索引擎是如何获取用 ...
- ecshop 搜索热词推荐_拼多多搜索推广实操——如何选择正确的关键词实现高投产!...
原标题:拼多多搜索推广实操--如何选择正确的关键词实现高投产! 大家好我是拼多多运营林枫,每天都会更新新的内容哦,没关注的记得关注一下哦! 今天和大家讲讲搜索推广怎么正确选择有效的关键词,很多商家可能 ...
- java自定义分页标签_自定义分页标签--仿javaeye分页效果
效果如图: 1.JSP规范1.1版本后增加了自定义标签库.实现自定义标签的步骤 (1)开发自定义标签处理类. (2)建立*.tld文件. (3)在web.xml中增加自定义标签的定义. (4)在jsp ...
- 网页搜索怎么显示排名_深圳seo搜索排名优化效果怎么样
效果怎么样l31b10seo搜索排名优化深圳,企业商家为了自己的网站有更好的排名,获得更好的流量,往往会采用SEO优化,那么SEO优化有哪些方法呢?或者是哪些方法更有效呢? 这是一个多媒体的时代,内容 ...
- 搜索功能java代码_简单的搜索框代码实现
简单的搜索框页面功能的实现(代码如下) String path = request.getContextPath(); String basePath = request.getScheme()+&q ...
- python核心教程第二版答案_《python核心教程》课后题答案注解
生成一个有N个元素的由随机数n组成的列表,其中N和n的取值范围分别为:(1 # -*- coding: utf-8 -*- def randomlist(): import random #导入随机模 ...
- 搜索Maven依赖资源_搜索Maven工件_搜索Maven构件_搜索依赖_搜索构件_搜索工件
文章目录 依赖索引 索引文件 更新存放在本地的远程仓库的资源索引以及本地仓库的资源索引 macOS 下索引文件的路径 在 pom.xml 页面内按快捷键 ⌘+N 搜索构件 在资源库管理中,创建资源库时 ...
最新文章
- Product Orders(生产订单)状态相关函数BAPI
- 如何获取iOS设备的IP地址
- Dominating Patterns
- 每日一皮:原型还可以啊,怎么上线后就这样了。。。
- asp.net 页面之间跳转的几种方法及区别(转)
- mysql最大并行用户设置_mysql 优化配置
- idea设置默认maven路径(2020版idea)
- WebDev.WebServer40.exe已停止工作
- 查找算法之二 二分查找(C++版本)
- Binary Tree Right Side View 二叉树右视图
- java计算机毕业设计房产中介管理系统源码+系统+lw+数据库+调试运行
- 我的求学十年(00至10):从中学到大学,年少轻狂立大志
- “蔚来杯“2022牛客暑期多校训练营5:A Don‘t Starve
- 计算机控制系统开环控制有什么特点,自动控制系统基本控制方式?各有什么特点?...
- 汽车喇叭语音芯片,警报音效ic选型
- Windows下的pixhawk环境搭建
- 【转】一个老程序员的心理话
- 关于iphone4如何强制降级ios6.1.3
- 2023郑州大学工商管理学硕专业考研成功经验分享
- 计算机游戏攻略66 关,一笔画攻略,一笔画攻略66关
热门文章
- vSphere 7 Kubernetes 初体验
- 签名证书无效”-在vCenter Server Appliance 6.5 / 6.7上使用Shell脚本重新生成和替换已过期的STS证书(76719)
- SSO单点登录学习总结(1)——单点登录(SSO)原理解析
- java 求集合真子集_【同步练习】高一高中数学必修1集合的关系与元素性质
- linux磁盘管理(挂载,分区)
- 使用 pyinstaller 打包 py 文件成 exe 程序
- ionic 图片加载失败,显示默认图片代替
- 『Material Design 入门学习笔记』前言
- linux read命令详解
- delphi DBgrid 使用大全