本文原创作者: 数据超市 (http://www.data-shop.net)
本文原始链接:http://www.data-shop.net/2018/07/book_dangdang-201805/

数据说明:
当当网的当当自营图书(http://book.dangdang.com/)数据,图书数据总数1,838,706条,图片文件总数1,827,427个。2018年5月份采集。

更新时间:
2018年5月份。

详细字段说明:
‘当当ID’, ‘ISBN’, ‘书名’, ‘副书名’, ‘丛书名’, ‘作者’, ‘出版社’, ‘出版时间’, ‘分册名’, ‘分册号’, ‘版次’, ‘印次’, ‘开本’, ‘页数’, ‘字数’, ‘印刷时间’, ‘包装’, ‘定价’, ‘分类号’, ‘分类名称’, ‘内容推荐’, ‘作者简介’, ‘目录’, ‘图片’, ‘所属分类’

示例数据:
点击查看在线示例数据

数据格式:
CSV(最通用的数据交换格式)

字符编码:
GBK。

说明:该文章为 数据超市 (http://www.data-shop.net)原创文章 ,您除了可以发表评论外,还可以转载到别的网站,但是请保留源地址,谢谢!!(尊重他人劳动,我们共同努力)

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/30303165/viewspace-2213313/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/30303165/viewspace-2213313/

当当网自营图书数据(183万图书数据及182万图片数据)相关推荐

  1. Tensorflow2.* 加载和预处理数据之用 tf.data 加载磁盘图片数据(4)

    Tensorflow2.* 机器学习基础知识篇: 对服装图像进行分类 使用Tensorflow Hub对未处理的电影评论数据集IMDB进行分类 Keras 机器学习基础知识之对预处理的电影评论文本分类 ...

  2. 前嗅教你大数据:批量采集/下载网页中的图片数据

    l 采集网站 [场景描述]采集revisionvillage网页中所有真题图片的数据. [源网站介绍]revisionvillage,国外知名IB真题网站,每道题都有视频讲解的IB数学刷题网站. [使 ...

  3. 最后三天!当当网3折购书优惠码限时抢

    感谢这世界的程序员 可以说,没有程序员,就没有现在多姿多彩的互联网. 程序员们通过coding改变世界,创造更加美好的生活.也以实际行动在浮躁的世界里,坚持自己对于知识.技术和创新的追求. 让我们一起 ...

  4. 疯狂android讲义第4版光盘_卧槽!当当网又又又可以 4 折买书了!!跟我一起薅羊毛了!...

    囤书囤书 我们一起阅读经典,紧跟前沿技术不掉队 这次继续给爱读书的你们最大的优惠力度 当当网自营图书大促 >> 每满100减50  << 满200减100 满300减150 满 ...

  5. scrapy爬取当当网

    春节已经临近了尾声,也该收收心了.博客好久都没更新了,自己在年前写的爬虫也该"拿"出来了. 本次爬取的目标是当当网,获取当当网所有的书籍信息.采用scrapy+mongodb来采集 ...

  6. python爬取当当网商品评论

    python爬取当当网商品评论 本案例获取某鞋评论作为例 案例目的: 通过爬取当当网商品评价,介绍通过结合jsonpath和正则表达式获取目标数据的方法. 代码功能: 输入爬取的页数,自动下载保存每页 ...

  7. 基于Pytorch、Keras、Tensorflow的图片数据生成器搭建

    1. 前言 作为一个对三种深度学习框架(Tensorflow,Keras,Pytorch)刚刚完成入门学习的菜鸟,在实战的过程中,遇到了一些菜鸟常见问题,即图片数据加载与预处理.在刚刚接触深度学习的时 ...

  8. python爬虫beautifulsoup爬当当网_利用python爬虫可视化分析当当网的图书数据!

    导语 这周末就分享个小爬虫吧.利用Python爬取并简单地可视化分析当当网的图书数据. 开发工具 Python版本:3.6.4 相关模块: requests模块: bs4模块: wordcloud模块 ...

  9. 利用python爬虫可视化分析当当网的图书数据

    导语 这周末就分享个小爬虫吧.利用Python爬取并简单地可视化分析当当网的图书数据. 开发工具 **Python版本:**3.6.4 相关模块: requests模块: bs4模块: wordclo ...

最新文章

  1. 爱了爱了!0.052 秒打开 100GB 数据,这个Python开源库火爆了!
  2. Django源代码写DetailView与ListView
  3. 我看中国软件---管理篇
  4. (王道408考研数据结构)第四章串-第一节:串的定义和基本操作及存储结构
  5. 世界坐标与像素坐标的相互转换
  6. git分布式版本管理系统和github平台
  7. github Repository not found 解决办法
  8. 交互设计软件 html,交互设计工具篇
  9. 昂贵的聘礼 - poj 1062 (Dijkstra+枚举)
  10. 关于C#编译器错误CS0685(VS2005)
  11. 上位机plc编程入门_上位机-使用C#编程语言编写PLC上位机软件-技术论坛-西门子中国...
  12. 逆矩阵和伴随矩阵(Inverse matrix and adjoint matrix)
  13. Latex中的括号用法总结
  14. CS231n课程笔记翻译:卷积神经网络笔记
  15. How to craw the Info of BiliBIli with python
  16. ping不通云服务器,ping不通云服务器是什么原因
  17. 用java实现图片合并与折叠
  18. 一正云系统服务器搭建,腾正云服务器
  19. 计算机安全检查表,电脑安全自我检查表.doc
  20. SwiftUI中应用Hero动画(Hero Animation)时一些需要填的坑

热门文章

  1. 不愧是阿里P8!2021最新阿里Java面经
  2. 九月腾讯,创新工场,淘宝等公司最新面试三十题(第171-200题)
  3. 关键字、主关键字和长尾关键字的区别
  4. 张晓萌《韧性》_00_面对不确定,怎样提高心理韧性?
  5. Windows 8的用户模式Shim Engine小探及利用
  6. python画恐龙_教你用Python实现谷歌的小恐龙游戏
  7. 送书!狼书三卷终大成,狼叔亲传Node神功
  8. INA169NA/3K 德州TI 2.7V 至 60V、440kHz 可变增益电流感应放大器
  9. 达观数据:文档智能审阅系统
  10. 2020年茶艺师(初级)考试题及茶艺师(初级)新版试题