2022年第01周。

这一周的Python语言学习,记录如下。

01

pip工具使用知识

1 pip是什么?

pip是一个用Python写的用于安装和管理包的包管理系统。它连接一个叫做Python Package Index的在线公共包存储库。它通过配置,也可以连接其它包库。

2 pip使用知识

2.1 安装包

常用命令

pip install some-package-name

若需要指定特定的版本安装

pip install some-package-name==1.2.2 --force-reinstall

force-reinstall用于指示重新安装指定版本的包。

也可以指定版本的范围安装

pip install some-package-name>=1.3.0,<1.4.0 --force-reinstall

2.2 卸载包

卸载包很容易,执行如下操作

pip uninstall some-package-name

2.3 从Python工作环境的requirement.txt的文件安装包

例如,我们有一个Python工作环境的requirement.txt文件。

pandas==1.2.5
numpy==1.21.1

安装这些包

pip install -r requirement.txt

2.4 如何生成requirement.txt文件

我们进入自己的Python工作环境,使用如下命令,获取工作环境的配置包文件

pip freeze > requirement.txt

2.5 获取已经安装包的信息

我们想知道已经安装了那些Python包

pip list

进一步,结合grep命令,搜索到你感兴趣包的是否安装。

pip list | grep pandas

2.6 了解包更详细信息

我们想了解包更详细的信息

pip show some-package-name

2.7 检查包之间兼容问题

我们想了解包之间兼容的信息

pip check

02

模型保存为pickle

1 pickle是什么?

pickle是Python中序列化对象的标准方式。

我们可以使用pickle操作来序列化机器学习模型,并将序列化的格式保存到一个文件中。以后,我们可以加载这个文件来反序列化模型,用它来做新的预测。

2 代码演示

我们基于一份公开的糖尿病发病数据集,构建逻辑回归模型,并保存模型,后来加载模型,用于新样本的预测。

import os
import pandas as pdfrom sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_scoreimport pickle
import warnings
warnings.filterwarnings('ignore')url = "https://raw.githubusercontent.com/jbrownlee/Datasets/master/pima-indians-diabetes.data.csv"
names = ['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class']
dataframe = pd.read_csv(url, names=names)
array = dataframe.values
X = array[:,0:8]
y = array[:,8]test_size = 0.33
seed = 7
# 数据计划分
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=test_size, random_state=seed)# 拟合模型
model = LogisticRegression()
model.fit(X_train, Y_train)# 模型保存
model_folder = './model/'
if not os.path.exists(model_folder):os.makedirs(model_folder)filename = model_folder + 'LR_2022_week1_finalized_model.sav'
pickle.dump(model, open(filename, 'wb'))# 加载模型
loaded_model = pickle.load(open(filename, 'rb'))# 模型的效果分析
pred_result = loaded_model.predict(X_test)model_result = accuracy_score(y_test, pred_result)print(round(model_result, 2))

运行结果

0.79

03

pdf与docx互相转换操作

1 简介

pdf和docx是两种常用的格式文件,如何用Python实现彼此的转换?我们可以使用pdf2docxdocx2pdf两个包来做这个有趣的事情。

2 安装库

执行如下命令

pip install pdf2docx
pip install docx2pdf

若是已经安装,请忽略

3 pdf转换为docx示范

pdf文件全部页面转换为docx

方法一:

# 方法1
from pdf2docx import Converterpdf_file = './file/sample.pdf'
docx_file = './file/sample.docx'cv = Converter(pdf_file)
cv.convert(docx_file)
cv.close()

方法二:

# 方法2
from pdf2docx import parsepdf_file = './file/sample.pdf'
docx_file = './file/sample2.docx'parse(pdf_file, docx_file)

pdf文件部分页面转换为docx

# 指定单独PDF页面转化为docx
from pdf2docx import Converterpdf_file = './file/sample.pdf'
docx_file = './file/sample2.docx'pages_list = [0]cv = Converter(pdf_file)
cv.convert(docx_file, pages=pages_list)
cv.close()

4 docx转换为pdf示范

docx文件转换为pdf

from docx2pdf import convertdocx_file = './file/input.docx'
pdf_file = './file/output.pdf'convert(docx_file, pdf_file)

关于pdf和docx相互转换操作,你有什么问题,请扫描文末二维码,添加我微信,一起讨论。


往期精彩回顾适合初学者入门人工智能的路线及资料下载(图文+视频)机器学习入门系列下载中国大学慕课《机器学习》(黄海广主讲)机器学习及深度学习笔记等资料打印《统计学习方法》的代码复现专辑
AI基础下载机器学习交流qq群955171419,加入微信群请扫码:

【Python】Python语言学习:pip工具使用知识,模型保存pickle,PDF与docx相互转换处理...相关推荐

  1. 【Python】pip工具使用知识,模型保存pickle,PDF与docx相互转换处理

    2022年第01周. 这一周的Python语言学习,记录如下. 01 pip工具使用知识 1 pip是什么? pip是一个用Python写的用于安装和管理包的包管理系统.它连接一个叫做Python P ...

  2. python pip工具命令_转载 Python 安装setuptools和pip工具操作方法(必看)

    本文章转载自 脚本之家 http://www.jb51.net  感谢! setuptools模块和pip模块是python进行第三方库扩展的极重要工具,例如我们在需要安装一些爬虫或者数据分析的包时就 ...

  3. ubuntu16.04 python版本切换以及pip工具基本知识点总结

    基本知识点: 1.ubuntu16.04自带python2.7 和python3.5,不要卸载系统自带的python2.7或3.5. 2. /usr/bin/python 和/usr/bin/pyth ...

  4. R语言学习二——工具的使用

    R语言学习(二) 本章学习R语言相关开发工具的使用: 软件下载 软件安装 RStudio的使用 R扩展包的安装与载入 容易遇到的问题 一.软件下载(RStudio) Rstudio下载地址 选择免费版 ...

  5. python 学习(pip工具的安装)

    mac 电脑上使用终端命令 curl https://bootstrap.pypa.io/get-pip.py | python3 基于Python 3 pip --version pip3 list ...

  6. 怎么安装python3.7 setuptools与pip_如何安装python到setuptools、pip工具安装

    一.python安装 1.基础开发库apt-get install gcc apt-get install openssl libssl-dev 2.安装数据库和开发库 apt-get install ...

  7. 《python自动化》学习笔记:正则表达式基础知识

    模式匹配与正则表达式 匹配步骤: 1用 import re 导入正则表达式模块 2.用 re.compile()函数创建一个 Regex 对象 ​ 3.向 Regex 对象的 search()方法传入 ...

  8. Scala语言学习开发工具(一)

    一:下载与安装 确保你本地已经安装了 JDK 1.5 以上版本,并且设置了 JAVA_HOME 环境变量及 JDK 的 bin 目录 下载 https://www.scala-lang.org/dow ...

  9. 升级 python 2.6.6 到 2.7.14 版本(pip工具安装)

    CentOS 6 系统默认 Python 版本是:2.6.6 平时在使用中遇到很多的库要求是 2.7.x 版本的库,比如使用 ConfigParser 库,在 2.6 版本库就不支持没有 value ...

最新文章

  1. 为了上班摸鱼,我用Python开发“BOSS来了”
  2. mysql索引4种结构_mysql索引:四种类型,两种方法
  3. 我也分享一个c# ini操作类
  4. mysql 5.7.11 授权_mysql 5.7.11 安装配置教程
  5. [Java基础]方法引用
  6. maven如何合并两个war到一个war项目中
  7. 浅谈C++中内存泄漏的检测
  8. VSCode 中使用Git实践,学会了效率翻倍
  9. 如果“定位BUG”有等级的话,你是什么段位?
  10. 如何把握软件产品的质量
  11. mysql 单例模式_php基于单例模式封装mysql类完整实例
  12. 图片双面打印顺序混乱_为什么双面打印一面是正的一面是反的?
  13. 杰理AD142A AD145A系列芯片的功能简介
  14. Arora is a lightweight cross-platform web browser.
  15. java-php-python-springboot网上租贸系统计算机毕业设计
  16. 电脑安装不上chrome浏览器
  17. Delphi的常用函数
  18. Springboot整合JdbcTemplate实现分页查询
  19. 使用Qt学习C语言编程2(加入工具链)
  20. android stdudio OpenCV NDK 开发环境搭建 之找查条形码

热门文章

  1. MyEclipse中用Maven创建Web项目
  2. js一个典型的对象写法,推荐使用这种格式,用于处理图像的基本方法、
  3. OpenFlow: Enabling Innovation in Campus Networks
  4. 如何优化页面的响应速度 以及如何减少项目初次加载时间(转https://www.cnblogs.com/MarcoHan/p/5295398.html)...
  5. JavaScript能力测评经典题及答案(一:数组之查找组元素位置)
  6. 最完美的Linux桌面软件
  7. js 调用父窗口的方法
  8. 有关于近期大量数据库暴光的分析
  9. TApplication与主消息循环
  10. 软件学院学习体验之三