介绍:

搜索引擎查询日志库设计为包括约1个月(2008年6月)Sogou搜索引擎部分网页查询需求及用户点击情况的网页查询日志数据集合。为进行中文搜索引擎用户行为分析的研究者提供基准研究语料

格式说明:

数据格式为

访问时间\t用户ID\t[查询词]\t该URL在返回结果中的排名\t用户点击的顺序号\t用户点击的URL

其中,用户ID是根据用户使用浏览器访问搜索引擎时的Cookie信息自动赋值,即同一次使用浏览器输入的不同查询对应同一个用户ID

相关任务:

相关性排序

用户兴趣挖掘

查询扩展

新词发现

相关资源:

成果列表:

1.Predicting Epidemic Tendency through Search Behavior Analysis.

Danqing Xu, Yiqun Liu, Min Zhang, Liyun Ru, Shaoping Ma. In Proceedings of the 22nd International Joint Conference on Artificial Intelligence (IJCAI-11) (Barcelona, Spain).

2.How do users describe their information need: Query recommendation based on snippet click model

Yiqun Liu, Junwei Miao, Min Zhang, Shaoping Ma, Liyun Ru. Expert Systems With Applications. 38(11): 13847-13856, 2011.

3.Automatic Search Engine Performance Evaluation with Click-through Data Analysis.

Yiqun Liu, Yupeng Fu, Min Zhang, Shaoping Ma, Liyun Ru, Poster proceedings of the 16th International World Wide Web Conference (WWW07), 2007, Banff, Alberta, Canada.

4.基于用户行为分析的搜索引擎自动性能评价

刘奕群,岑荣伟,张敏,马少平。软件学报,2007

5.Automatic Query Type Identification Based on Click Through Information

Yiqun Liu, Min Zhang, Liyun Ru, Shaoping Ma, Asia Information Retrieval Symposium(AIRS06), in LNCS Vol. 4182: pp. 593-600, 2006.

6.基于大规模日志分析的网络搜索引擎用户行为研究.

余慧佳,刘奕群,张敏,茹立云,马少平, 第三届学生计算语言学研讨会(SWCL2006).

下载:

下载前请仔细阅读“搜狗实验室数据使用许可协议”,请在使用了本语料库的论文、技术报告等研究成果中添加如下参考文献引用:Yiqun Liu, Junwei Miao, Min Zhang, Shaoping Ma, Liyun Ru. How Do Users Describe Their Information Need: Query Recommendation based on Snippet Click Model. Expert Systems With Applications. 38(11): 13847-13856, 2011.

Please read the "License for Use of Sogou Lab Data" carefully before downloading.

迷你版(样例数据, 376KB):tar.gz格式,zip格式

精简版(一天数据,63MB):tar.gz格式,zip格式

反馈:

在线上反馈留下您的宝贵意见和建议。

在资源下载FAQ中查找您遇到的资源下载问题的答案

搜狗排名检测PHP,搜狗实验室相关推荐

  1. 搜狗收录查询-搜狗排名查询

    网站收录对于网站关键词排名和权重提升能够起到至关重要的作用,查询网站收录主要有2种方式:最为常见的方式就是site指令和关键词查询,网站要获得更多流量,就必须关注收录问题,网站只有在被收录的基础上才能 ...

  2. 搜狗站群之搜狗泛目录实现搜狗大量泛收录

    搜狗站群怎样做才能增加搜狗收录?怎样让搜狗站群搜狗快速收录成为大家非常关心的问题,今天来分享一下搜狗站群快速收录的方法. 增加搜狗站群原创文章.针对文章的标题和内容,可以解释搜狗对原创文章的重视.原始 ...

  3. 搜狗蜘蛛池之搜狗泛站群技巧详解

    搜狗新站怎么快速收录?已经搜狗首页收录的怎么增加搜狗内页收录?搜狗蜘蛛池没有作用?搜狗蜘蛛池可以实现搜狗的百万甚至千万蜘蛛吗?这些问题是很多搜狗做站的朋友经常问我的问题,这期我针对这些问题说说我个人的 ...

  4. 搜狗收录域名之搜狗自带蜘蛛

    搜狗收录域名可以促进搜狗收录吗?搜狗收录域名的好处是什么?搜狗收录怎么选择?这些都是做搜狗的站长比较关心的点.今天关于搜狗收录域名我说下我的个人观点. 什么是搜狗收录域名?人们都知道每个域名都是权重这 ...

  5. 搜狗权重批量查询 搜狗权重批量查询系统

    最近入职了北京的一家SEO公司,接手管理了100多个网站,领导让我每天检测搜狗权重,但是我手动一个一个非常的耗时间,有没有什么方法可以快速批量查询搜狗权重呢?     当我操作网站数量多的时候,最近使 ...

  6. 对话搜狗陈伟,揭秘搜狗AI合成主播背后的前沿技术

    导语:近日,雷锋网就"搜狗分身"技术以及升级后的AI合成主播,与搜狗语音技术交互中心的陈伟进行了面对面的交流. 2019年2月19日,搜狗和新华社新媒体中心联合推出的全球首个站立式 ...

  7. 为什么要做搜狗推送?搜狗推送工具介绍

    为什么要搜狗推送: 搜狗资源搜索平台专门为站长为站长提供链接提交通道,帮助搜狗spider抓取您的网站.搜狗搜索会按照自身算法处理,决定是否收录你的网站. 搜狗推送方式: 搜狗搜索资源平台不像百度搜索 ...

  8. 搜狗手机浏览器_搜狗推广开户费多少钱?【搜狗开户代理商】

    搜狗开户流程 提供落地页审核 提供服务器ip 安排解析 账户预存款4000币 上传关键词及素材 开启广告上线 福如海广告,搜狗开户代理商 全国行业开户,有无资质均可 手机:18705657032[同微 ...

  9. 搜狗Sogou拼音输入法,搜狗高速浏览器(IE浏览器内核)

    搜狗Sogou拼音输入法,搜狗高速浏览器(IE浏览器内核) 1.搜狗Sogou拼音输入法:超强互联网词库:搜狗拼音输入法利用搜索引擎技术,根据搜索词生成的输入法互联网词库,能够覆盖所有类别的流行词汇. ...

最新文章

  1. 嵌套 思维导图_工作小Tips:如何用思维导图来整理你的汇报
  2. matlab程序崩溃怎么解决,java – 如何避免MATLAB崩溃打开太多的数字?
  3. 项目管理过程中的一些注意事项
  4. 【Tools】VMware虚拟机三种网络模式详解和操作
  5. Python学习 Day 025 -模块相关
  6. 事件通知方式实现的重叠I/O模型
  7. pythonmysqlconnector_python操作mysql——mysql.connector
  8. Jupyter Tool
  9. mongo-java-driver 的简单使用(1)
  10. EMC Isilon存储数据恢复成功案例
  11. python输出数字三角形_python 数字三角形
  12. 需要一张可视化三维地图?这样炫酷的3D全景地图,你也可以拥有
  13. EagleEye:一种用模型剪枝的快速衡量子网络性能的方法
  14. WireShark的过滤语法
  15. FPGA中LUT初步学习
  16. 自定义输入框可一键清除
  17. 多传感器融合标定方法汇总
  18. STM32堆栈溢出的主要的问题和现象
  19. vue3.0“ Uncaught TypeError: Cannot read property ‘use‘ of undefined”报错解决......
  20. NET Core 模板项目 - NuGet

热门文章

  1. ERROR: commit 3cff883: missing Change-Id in message footer
  2. jiavascript 精华收集
  3. 云上VPC网络规划实战
  4. Mysql5.7.24安装版的下载与安装
  5. mvp的全称_MVP、VIP……这些常见的英文缩写你知道它的全称吗?
  6. DC-3靶场搭建及渗透实战详细过程(DC靶场系列)
  7. mysql密码加强_MySQL 密码加强插件_mysql
  8. java中无法解析字符串_关于java:从输入中解析字符串作为参数问题
  9. AES加密算法(Rijndael算法)
  10. 关于Windows系统白名单程序(自动提权autoElevate)