这是菜鸟学Python的第99篇原创文章

阅读本文大概需要3分钟

引用

学Python这么久了,回首想想自己看过的Python书也不少,到底哪本书最牛,哪本书最火呢,哪个出版社出版的Python最多的,实力最强,这一系列的问题我都想知道.于是我就做了一个全网Python书的排行榜,前面两篇文章分别从思路和爬虫的角度去给大家分享,今天我就从数据的角度来给大家排个榜吧

一共1218本Python的书,有国人写的,也有老外写的,也有日本人写的,我把这些书全部存入了SQL数据库中,下面就给大家分享一下数据分析的结果

0.准备工作

1).数据存入了sqlite db里面,建了一个 books的表格,我把"作者","书名","ISDN","页数","价格","出版社","出版日期","点评人数","翻译","链接","评分",一共11个维度全部存入表里

数据库books表头是:

HEADERS=['author', 'book', 'isdn', 'page', 'price','pub_company', 'pub_date', 'rating_people','translator', 'url', 'vote_num']

2).建一个class 专门查询

为了方便,我们把连接数据库和关闭数据库都提取到类里面的两个方法

连接SQLite3其实还好,但是如果用MySQL的时候,要用connect可能会报错,所以建议都加异常保护.

查询的方法我们可以封装在类里面,这样清晰简单些

1.出版社Top10

在1200多本Python书中,到底哪家出版社出版的书最多呢:

发现出版最多的是"Packt Publishing",然后就是人邮

2.评分最高Top10:

相信很多同学买书的时候,一定会查这本书的评分如何,我这里列出了评分最高的10本书,看看有没有你心仪的哪本

第一名是"Fluent Python",第二名:"流畅的Python"其实一个是英文版,一个是中文版,看来流畅的Python目前是头牌

有同学一定不服气,说我心目中的Python Cookbook, Python核心编程也是很不错呀,为啥连前10都没有上榜

好,确实不太公平,如果一本书10人评价,10个人都是给高分,这样是不是样本太少了,好我们继续往下看

3.人气最高Top15:

为了更公平的评价到底哪一本才是人气最高的书,我们综合"点评人数"和"评分"两个维度去分析,把这两个数据相乘,Python好书太多了,我取前15名:

原来人气最高的是"Python基础教程" 1518个点评,7.9分

我最喜欢的"A byte of Python"排第4

4.出版社哪家Python书最牛:

下面是我写这个程序的最初的目的,我就想知道哪家出版社的Python书卖的最好,最牛呢(因为有4家出版社陆陆续续跟我联系过关于出书的事情)。其实要分析也很简单,把Top10的出版社的出版的书的评分求和,然后求均值再排序就可了

第一名:实力最强的看来是"机械工业出版社"

第二名:人民邮电出版社

第三名:O'Reolly Media

其实第二名和第三名比分很接近了

6.出版Python最多的是哪一年

大家是不是也先想知道,这么多Python书,到底哪一年出版的书最多呢,

从这个数字的背后也反应了Python是从哪一年开始火起来了,不信我们分析一下

我们把数据库里面的出版日期全部提取出来,然后稍微要进行一下数据清洗,因为日期里面有'September 2007','2007年9月','April 09, 2007','2017-9','2017-8-25',5种杂乱的数据格式,我用正则进行了清洗(插一句正则对数据分析来说非常非常重要,不懂的小伙伴可以看我的历史文章,有详细的介绍)

然后把年份过滤提取,在用colleaction里面的Counter进行排序

发现年份最多的是2015年,其次是2016年,正好是Python开始火的时候

[(u'2015', 167), (u'2016', 144), (u'2017', 97)]

7.其他有趣的发现

1).Python书名最长的:174个字符

2).日期最老的Python书:1975年就出版了

3).页数最多的Python书:有1632页

4).页数最少的Python书

书名叫:Good morning,Little Python! 只有12页

结论:

好,今天的全网分析Python书,结论篇,就讲道这里,这个实战项目算是结束了,后面还有很多好玩的文章要跟大家分享,数据分析是一个非常有趣的话题。这个实战项目有兴趣的小伙伴,也可以自己动手写一下哦。源码我会放github上,到时会通知大家,若有什么问题,也欢迎留言讨论一下.另外过两天还有送书的活动,大家敬请期待~~

关注微信公众号“菜鸟学python”,获得更多免费电子书和源码资料

python有什么好玩的书_史上最全的Python书排行榜|你想知道的都在这里相关推荐

  1. python高分书籍推荐_史上最全的Python书排行榜|你想知道的都在这里

    原标题:史上最全的Python书排行榜|你想知道的都在这里 感谢关注天善智能,走好数据之路↑↑↑ 欢迎关注天善智能,我们是专注于商业智能BI,大数据,数据分析领域的垂直社区,学习,问答.求职一站式搞定 ...

  2. python 完全面向对象_史上最全的Python面向对象知识点疏理

    原标题:史上最全的Python面向对象知识点疏理 面向对象技术简介 类: 用来描述具有相同的属性和方法的对象的集合.它定义了该集合中每个对象所共有的属性和方法.对象是类的实例.class 类变量:类变 ...

  3. python各种包安装顺序_史上最全的Python包管理工具:Anaconda教程

    事实上Anaconda 和 Jupyter notebook已成为数据分析的标准环境. 简单来说,Anaconda是包管理器和环境管理器,Jupyter notebook 可以将数据分析的代码.图像和 ...

  4. python源代码最多的学习网站_史上最全Python学习资料大合集分享

    Python有多火就不用说了,之前也零散地分享过一些Python学习开发资料. 本次将分享Python学习资料合集.合集哦,你品,你细品! 在分享之前,还是要啰嗦一下,不然文章字数太少,不太好看. P ...

  5. python最全知识点_史上最全的Python面向对象知识点疏理

    51CTO诚邀您9月23号和秒拍/国美/美团元专家一路聊智能CDN的优化之路,抓紧时光哦! 面向对象技巧简介 类: 用来描述具有雷同的属性和办法的对象的集合.它定义了该集合中每个对象所共有的属性和办法 ...

  6. python期末知识点_史上最全的Python知识点整理之基本语法

    一.程序的格式框架 1.缩进 缩进是指每行语句前的空白区域,用来表示Python程序间的包含和层次关系. 一般语句不需要缩进,顶行书写且不留空白. 当表示分支.循环.函数.类等含义,在if,while ...

  7. python中debug有什么用途_史上最方便的Python Debug工具

    最近在github上冒出了一个python的debug神器PySnooper,号称在debug时可以消灭print.那么该工具有哪些优点呢,如何使用该工具呢.本文就介绍该工具的优缺点和使用方式. 前言 ...

  8. python类对象点处折行_史上最全的Python面向对象知识点疏理(对象是类的实例)

    (对象是类的实例) 面向对象技术简介 类:用来描述具有相同的属性和方法的对象的集合.它定义了该集合中每个对象所共有的属性和方法.对象是类的实例.class 类变量:类变量在整个实例化的对象中是公用的. ...

  9. python学生管理系统用列表_史上最全面的python学生管理系统教程(二)

    序言 这篇我们来讲该软件的数据保存方式,由于想到要简便快捷,所以我采用了sqlite3数据库,该数据库操作简单方便,而且易于管理,并且SQLite是一个进程内的库,实现了自给自足的.无服务器的.零配置 ...

最新文章

  1. Photoshop CS5软件安装资料及教程
  2. C语言编程题显示日历,C语言日历问题
  3. python3精要(50)-类
  4. C#使用Ado.net读取Excel表的代码
  5. C#LeetCode刷题之#500-键盘行(Keyboard Row)
  6. MNIST机器学习入门
  7. Hibernate POJO在序列化(JSON)时遇到的若干问题
  8. HDFS-HA的配置-----自动Failover
  9. java怎样中断函数_Java中断一个线程操作示例
  10. DataLogic 工业串口扫码器Python读取说明
  11. 如何注册自己的OpenAI/ChatGPT账号?
  12. 日历控件(bootstrap-datetimepicker.js)
  13. 决策易贴心黑科技第2波,智能巡店更高效!
  14. 百度云不限速详细教程
  15. 什么是nvm,nvm详解
  16. 相濡以沫与相忘于江湖
  17. 大数据运维学习成长路线
  18. pyshark引用TShark时:TShark not found的解决方法
  19. mysql表名备注_「备注」mysql添加备注信息 - seo实验室
  20. 【人工智能】拥抱人工智能,从机器学习开始

热门文章

  1. 此程序将从您的计算机删除adobe,电脑中安装Adobe软件时提示该程序已安装的最佳解决方案...
  2. STM32硬件看门狗的使用
  3. 文献—Emergent simplicity in microbial community assembly--论文全过程详细阅读整理与翻译
  4. 流程挖掘的价值:头部制造业千万级增长的底牌
  5. Spring,Spring MVC及Spring Boot区别,你分清了吗
  6. SECS/GEM使用
  7. Android之数据存储-刘志远-专题视频课程
  8. Codevs 1219 骑士游历
  9. python 股票盯盘v2.0
  10. python里小于号怎么打_如何在嵌入xml的python脚本中使用大于或小于符号?