百度新闻搜索参数精解
百度提供了很好的搜索接口,但官方网站上没有提供各参数的意义,经过半天的研究,得出下面的结果,贡献出来供大家使用。
搜索入口:
http://news.baidu.com/ns?
简单搜索参数:
bt=1220198400起始时间戳
et=1220457599结束时间戳
si=站内搜索网址
rn=10显示的条数
tn=newsdy关键词位于
ie=gb2312
ct=0结果排序方式,0按时间排序,1按相关性排序
class=0新闻分类
word=%C4%E3+%CE%D2+%CB%FB
pn=10起始数,下页的起始数=pn+rn
cl=2
bs=%C4%E3&前一搜索条件
sr=0
例如
http://www.baidu.com/baidu?word=%CE%D2&submit=%B0%D9%B6%C8%D2%BB%CF%C2&tn=bds&cl=3&ct=2097152&si=www.guoxue.com&s=on
http://news.baidu.com/ns?bt=1220198400&et=1220457599&si=www.guoxue.com&rn=10&tn=newsdy&ie=gb2312&ct=0&class=0&word=%C4%E3&pn=50&cl=2&from=news
http://news.baidu.com/ns?word=w+&tn=newsdy&from=news&ie=gb2312&bs=%C4%E3&sr=0&cl=2&rn=20&ct=0
http://news.baidu.com/ns?word=%CB%FB&tn=newsdy&from=news&ie=gb2312&bs=w&sr=0&cl=2&rn=20&ct=0
高级搜索参数:
from=news
cl=2
bt=0,1220284800起始时间戳
y0=2008
m0=9
d0=2
y1=2008
m1=9
d1=2
et=0结束时间戳
q1=360包含以下全部的关键词,空格用+代替
submit=%B0%D9%B6%C8%D2%BB%CF%C2&百度一下
q3=包含以下任意一个关键词
q4=不包含以下关键词
s=1时间选择,1模糊,2精确
mt=0 模糊时间,0全部时间,1最近一小时,24最近一天。。。
lm=0
begin_date=2008-9-2
end_date=2008-9-2
tn=newsdy关键词位于,newsdy新闻全文中,newstitledy新闻的标题中
ct=0结果排序方式,0按时间排序,1按相关性排序
rn=20显示的条数
class=0新闻分类,0全部新闻,2">国内新闻,1">国际新闻,3">体育新闻,4">娱乐新闻,5">社会新闻,6">财经新闻,7">互联网新闻,8">科技新闻,9">房产新闻,10">汽车新闻,11">教育新闻,12">健康新闻
q6=限定要搜索的新闻源
例如
百度新闻搜索参数精解相关推荐
- python爬百度新闻_PY爬取百度新闻搜索所有结果
#!/usr/bin/python # -*- coding: utf-8 -*- #coding=utf-8 from bs4 import BeautifulSoup import request ...
- JVM内存管理------垃圾搜集器参数精解
转载自 JVM内存管理------垃圾搜集器参数精解 垃圾搜集器选择参数 UseSerialGC:开启此参数使用serial & serial old搜集器(client模式默认值). U ...
- python爬取百度新闻_火车浏览器网络爬虫实践6:以“陕茶”为例爬取百度新闻搜索结果...
每天进步一点点,这是我2019年的小目标. 这是第6次学习与实践笔记了,这一次咱们把对象转移到百度搜索去,尝试使用火车浏览器爬虫工具来采集百度新闻搜索的结果,并做简单数据可视化展示. 01 抓取需求 ...
- python新闻关键词次数_使用python抓取百度搜索、百度新闻搜索的关键词个数
由于实验的要求,需要统计一系列的字符串通过百度搜索得到的关键词个数,于是使用python写了一个相关的脚本. 在写这个脚本的过程中遇到了很多的问题,下面会一一道来. ps:我并没有系统地学习过pyth ...
- 百度搜索结果页url参数详解
在百度首页输入任意关键词搜索之后,我们跳转到搜索结果页面,在浏览器的网址栏我们可以看到很长的一串url地址.那么,你真的了解这一串url的含义吗? s?:搜索 百度搜索结果页使用了重定向,因此我们看到 ...
- Selenium实现百度自动搜索操作详解
目录 一.安装selenium第三方库 二.安装浏览器驱动 三.配置驱动器环境变量 1.项目环境变量 2.系统环境变量配置 四.项目实战 五.完整代码 一.安装selenium第三方库 使用pip安装 ...
- 百度搜索结果页面的参数 搜索历史记录(rsv_sug)
介绍完了和相关搜索 f=1 有关的4个百度网页搜索参数原先查询字符串(oq), 相关提示位置(rsp), 相关搜索_语义关联性(rs_src), 上下页切换(rsv_ers),接下来是讲解与搜索框提示 ...
- python3-爬虫-百度新闻结果
百度新闻结果爬虫 1. 获取新闻结果页面内容 在百度新闻搜索"清华大学",得到页面图如下: #百度新闻搜索--清华大学#获取对应页面的所有相关信息 import requests ...
- 怎么才能让百度新闻源收录你的网站?
1.百度新闻源是什么? 微知以前在千万不要订阅百度新闻中说到过,百度新闻源采集来的一些文章实在是没有什么很大的价值可言 以前微知曾经订阅过一段时间,但是那个效果让人不敢恭维 但是不得不说,像百度新闻这 ...
最新文章
- malloc函数具体解释
- Android开发如何双击返回键退出程序
- 策略模式(stragegy)
- android脚步--Relativelayout设置
- CodeForces - 1141CPolycarp Restores Permutation搜索+剪枝
- nginx+tomcat7+memcached
- zookeeper多种方式安装
- WebSocket connection to,Error during WebSocket handshake: Unexpected response code: 404
- noi.ac #529 神树的矩阵
- Python机器人-最简单的机器人答复
- 外设驱动库开发笔记28:W5500以太网控制器
- 关于帧差法的想法(opencv)
- java knn kd树_KD树实现KNN
- 674138《JavaScript框架设计(第2版)》_司徒正美
- 一篇我觉得不错的文章
- Java猜数字大小游戏
- 数学之美系列二十四 -- 谈谈动态规划与如何设计动态规划算法
- 数据库之postgreSql时间计算,例如获取前一天、后一天等。
- 旅行照片剪辑--扬州篇
- 31套VTK3D图像体绘制/VTK光线投射法/VTK三维重建程序源码