当当网自营图书数据(183万图书数据及182万图片数据)
本文原创作者: 数据超市 (http://www.data-shop.net)
本文原始链接:http://www.data-shop.net/2018/07/book_dangdang-201805/
数据说明:
当当网的当当自营图书(http://book.dangdang.com/)数据,图书数据总数1,838,706条,图片文件总数1,827,427个。2018年5月份采集。
更新时间:
2018年5月份。
详细字段说明:
‘当当ID’, ‘ISBN’, ‘书名’, ‘副书名’, ‘丛书名’, ‘作者’, ‘出版社’, ‘出版时间’, ‘分册名’, ‘分册号’, ‘版次’, ‘印次’, ‘开本’, ‘页数’, ‘字数’, ‘印刷时间’, ‘包装’, ‘定价’, ‘分类号’, ‘分类名称’, ‘内容推荐’, ‘作者简介’, ‘目录’, ‘图片’, ‘所属分类’
示例数据:
点击查看在线示例数据
数据格式:
CSV(最通用的数据交换格式)
字符编码:
GBK。
说明:该文章为 数据超市 (http://www.data-shop.net)原创文章 ,您除了可以发表评论外,还可以转载到别的网站,但是请保留源地址,谢谢!!(尊重他人劳动,我们共同努力)
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/30303165/viewspace-2213313/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/30303165/viewspace-2213313/
当当网自营图书数据(183万图书数据及182万图片数据)相关推荐
- Tensorflow2.* 加载和预处理数据之用 tf.data 加载磁盘图片数据(4)
Tensorflow2.* 机器学习基础知识篇: 对服装图像进行分类 使用Tensorflow Hub对未处理的电影评论数据集IMDB进行分类 Keras 机器学习基础知识之对预处理的电影评论文本分类 ...
- 前嗅教你大数据:批量采集/下载网页中的图片数据
l 采集网站 [场景描述]采集revisionvillage网页中所有真题图片的数据. [源网站介绍]revisionvillage,国外知名IB真题网站,每道题都有视频讲解的IB数学刷题网站. [使 ...
- 最后三天!当当网3折购书优惠码限时抢
感谢这世界的程序员 可以说,没有程序员,就没有现在多姿多彩的互联网. 程序员们通过coding改变世界,创造更加美好的生活.也以实际行动在浮躁的世界里,坚持自己对于知识.技术和创新的追求. 让我们一起 ...
- 疯狂android讲义第4版光盘_卧槽!当当网又又又可以 4 折买书了!!跟我一起薅羊毛了!...
囤书囤书 我们一起阅读经典,紧跟前沿技术不掉队 这次继续给爱读书的你们最大的优惠力度 当当网自营图书大促 >> 每满100减50 << 满200减100 满300减150 满 ...
- scrapy爬取当当网
春节已经临近了尾声,也该收收心了.博客好久都没更新了,自己在年前写的爬虫也该"拿"出来了. 本次爬取的目标是当当网,获取当当网所有的书籍信息.采用scrapy+mongodb来采集 ...
- python爬取当当网商品评论
python爬取当当网商品评论 本案例获取某鞋评论作为例 案例目的: 通过爬取当当网商品评价,介绍通过结合jsonpath和正则表达式获取目标数据的方法. 代码功能: 输入爬取的页数,自动下载保存每页 ...
- 基于Pytorch、Keras、Tensorflow的图片数据生成器搭建
1. 前言 作为一个对三种深度学习框架(Tensorflow,Keras,Pytorch)刚刚完成入门学习的菜鸟,在实战的过程中,遇到了一些菜鸟常见问题,即图片数据加载与预处理.在刚刚接触深度学习的时 ...
- python爬虫beautifulsoup爬当当网_利用python爬虫可视化分析当当网的图书数据!
导语 这周末就分享个小爬虫吧.利用Python爬取并简单地可视化分析当当网的图书数据. 开发工具 Python版本:3.6.4 相关模块: requests模块: bs4模块: wordcloud模块 ...
- 利用python爬虫可视化分析当当网的图书数据
导语 这周末就分享个小爬虫吧.利用Python爬取并简单地可视化分析当当网的图书数据. 开发工具 **Python版本:**3.6.4 相关模块: requests模块: bs4模块: wordclo ...
最新文章
- 爱了爱了!0.052 秒打开 100GB 数据,这个Python开源库火爆了!
- Django源代码写DetailView与ListView
- 我看中国软件---管理篇
- (王道408考研数据结构)第四章串-第一节:串的定义和基本操作及存储结构
- 世界坐标与像素坐标的相互转换
- git分布式版本管理系统和github平台
- github Repository not found 解决办法
- 交互设计软件 html,交互设计工具篇
- 昂贵的聘礼 - poj 1062 (Dijkstra+枚举)
- 关于C#编译器错误CS0685(VS2005)
- 上位机plc编程入门_上位机-使用C#编程语言编写PLC上位机软件-技术论坛-西门子中国...
- 逆矩阵和伴随矩阵(Inverse matrix and adjoint matrix)
- Latex中的括号用法总结
- CS231n课程笔记翻译:卷积神经网络笔记
- How to craw the Info of BiliBIli with python
- ping不通云服务器,ping不通云服务器是什么原因
- 用java实现图片合并与折叠
- 一正云系统服务器搭建,腾正云服务器
- 计算机安全检查表,电脑安全自我检查表.doc
- SwiftUI中应用Hero动画(Hero Animation)时一些需要填的坑
热门文章
- 不愧是阿里P8!2021最新阿里Java面经
- 九月腾讯,创新工场,淘宝等公司最新面试三十题(第171-200题)
- 关键字、主关键字和长尾关键字的区别
- 张晓萌《韧性》_00_面对不确定,怎样提高心理韧性?
- Windows 8的用户模式Shim Engine小探及利用
- python画恐龙_教你用Python实现谷歌的小恐龙游戏
- 送书!狼书三卷终大成,狼叔亲传Node神功
- INA169NA/3K 德州TI 2.7V 至 60V、440kHz 可变增益电流感应放大器
- 达观数据:文档智能审阅系统
- 2020年茶艺师(初级)考试题及茶艺师(初级)新版试题