1. 用Python搭建数据科学环境

今天,在本篇Python数据科学教程中,我们将看到Python的数据科学环境设置。此外,我们将告诉你数据科学环境设置需要安装的所有内容,如Python、Anaconda、Miniconda。除此之外,我们还将看到如何为Data Science Environment Setup设置虚拟环境,以及导入Data Science Packages。今天,我们将指导您设置机器,以便您可以开始您的数据科学之旅。 在你开始之前,我们建议你先阅读一下Python数据科学入门,以便你回来的时候,事情变得更加流畅。

那么,让我们开始Python数据科学环境设置。

2. 安装Python

在此之前,你应该先在你的机器上安装Python。你可以参考《在Windows上安装Python的分步指南》。

虽然2.7被广泛采用,但3.x将接管未来,并且已经开始留下它的痕迹。除此之外,有些软件和功能并不向后兼容。所以,请自行选择吧。

3. 获取Anaconda的数据科学环境设置

Python数据科学环境设置

数据科学环境设置--安装Anaconda

Anaconda是一个用于数据科学和机器学习的Python发行版。它是免费和开源的,使管理和部署包变得简单。

它有1000多个数据科学包和Conda包。它自带的其他工具有核心Python、IPython等。

a. Anaconda导航仪

Anaconda 随附了一个虚拟环境管理器--Anaconda Navigator。这是一个桌面GUI,可以让你启动应用程序和管理包、环境和conda的通道。这让你可以绕过命令行命令。导航器在Anaconda云上或Anaconda的本地仓库中搜索一个包,并安装、运行和更新它们。它有以下应用程序

  • Glueviz
  • Jupyter Notebook
  • JupyterLab
  • Orange 3 App
  • VSCode
  • RStudio
  • Rodeo
  • Spyder
  • QTConsole

Anaconda会给你两个包管理器--pip和conda。当一些包在conda中不可用时,你可以使用pip来安装它们。请注意,使用 pip 来安装 conda 也可用的包可能会导致安装错误。

b. 安装Anaconda

要下载Anaconda发行版,你可以使用官方下载页面。

Anaconda | Individual Edition

在这里,你可以选择你的平台,然后选择安装程序。为此,你可以选择你想要的版本,以及是32位还是64位。

要使用conda安装软件包,你可以使用下面的命令-

conda install scipy

4. 安装Miniconda

Miniconda是conda的最小化安装程序;一个小型的Anaconda的引导版本。它是免费的,并与conda、Python以及pip和zlib等包一起发布。这让你可以从conda中安装超过720个包。由于Miniconda是Anaconda的轻量版,它可以让你下载得更快。

要安装Miniconda,你可以进入下面的页面--。

Miniconda - Conda documentation

在这里,选择你的平台,然后根据你的机器需求,选择32位或64位的安装程序。

5. 设置虚拟环境

既然,我们在这里谈的是用Python建立一个数据科学环境,那么我们就来了解一下什么是虚拟环境。好吧,虚拟环境可以让我们用我们想要的包,或者根据项目的需要,创建不同的Python版本。这样的环境可以帮助我们确保包的版本和Python及其包管理器的版本之间没有冲突。你应该看看这篇关于如何创建Python虚拟环境并安装包的博客。

现在,让我们看看如何用 Anaconda 创建一个虚拟环境。在 Anaconda 提示符中使用下面的命令----。

这应该能让你了解Anaconda提示的样子。现在,要激活这个环境,你可以键入-

conda activate demo

这让你开始使用它。现在要停用它,请尝试

conda deactivate

下面的命令告诉你所有存在的环境;星号(*)标志着当前的环境。

conda info -e

6. 重要的Python数据科学软件包

在数据科学工作中,在1000多个可用的软件包中,你将需要一些能让你实现基本功能的软件包。让我们快速看看其中的一些包。

a. NumPy

正如前面充分讨论过的,NumPy可以让你处理大型的、多维的数组和矩阵。为了对这些进行操作,它还为我们提供了各种高级数学函数。

b. SciPy

Scipy是一个用于科学和技术计算的Python库,是免费和开源的。SciPy的模块包括那些用于

  • Optimization
  • Linear algebra
  • Integration
  • Interpolation
  • Special functions
  • FFT
  • Signal and Image processing
  • ODE solvers

c. Matplotlib

到目前为止,我们已经使用Matplotlib绘制了许多我们需要开始可视化的数字。其中一些是气泡图和散点图。这是一个带有Python的绘图库,并且扩展了NumPy。通过面向对象的 API,它可以让你将绘图嵌入到应用程序中。为此,它使用了 Tkinter、Qt、GTK+ 和 wxPython 等 GUI 工具箱。

d. Pandas

我们已经学习了大量的Pandas教程。pandas是Python的一个软件库,它应该是为数据操作和分析服务的,它是免费的,可以让你使用数据结构和操作来操作数字表格和时间序列。它是免费的,可以让你使用数据结构和操作来操作数值表和时间序列。

e. scikit-learn

scikit-learn是一个Python的软件机器学习库。它是免费的,并提供了不同的分类、回归和聚类算法

  • Support Vector Machines
  • Random forests
  • Gradient boosting
  • K-means
  • DBSCAN

我们通常将它与NumPy和SciPy一起使用

f. Seaborn

最后,seaborn是一个Python的可视化库,基于matplotlib。它可以让我们以统计学的方式进行数据可视化,并提供高级界面,从而产生有吸引力的图形。

7. 如何获得Jupyter笔记本?(我们也可以用jupyter lab)

正如我们前面所看到的,Jupyter Notebook自带Anaconda。要运行它,你可以进入你的虚拟环境,然后输入以下内容--。

jupyter notebook

你也可以用pip-

python3 -m pip install --upgrade pip.
python3 -m pip install jupyter

笔记本的样子是这样的

你可以在 http://localhost:8888/ 找到这个。

现在要在这里运行Python,你可以创建一个新文件。它看起来像这样-

您可以使用右上角的注销按钮退出。

让我们修改一下Python Array模块

那么,这就是用Python进行数据科学环境设置的全部内容。希望大家喜欢我们的讲解。

8. 结论:数据科学环境设置

因此,在本篇Python数据科学环境设置教程中,我们讨论了数据科学环境设置需要安装的所有内容。此外,我们看看Python包,如Numpy、Scipy、matplotlib。至此,我们结束了我们的数据科学环境设置教程,关于如何为数据科学设置机器。不过,如果有任何关于Python数据科学环境设置的疑问,欢迎在下面的评论中提出你的问题。

visio 科学图形包_【数据科学的python系列3】Python数据科学环境设置相关推荐

  1. python123查找指定字符输入m_大数据应用人才培养系列教材 Python语言 刘 鹏 张 燕 总主编 李肖俊 主编 刘 河 钟 涛 副主编....

    Presentation on theme: "大数据应用人才培养系列教材 Python语言 刘 鹏 张 燕 总主编 李肖俊 主编 刘 河 钟 涛 副主编."- Presentat ...

  2. python 数据科学书籍_您必须在2020年阅读的数据科学书籍

    python 数据科学书籍 "We're entering a new world in which data may be more important than software.&qu ...

  3. python快速入门系列_十五分钟快速入门系列:Python基础

    Python是一种面向对象的解释型语言, 源码和解释器CPython遵循 GPL协议. 年份 事件 1989 荷兰人Guido van Rossum发明 1991 第一个公开发行版发行 当前版本 3. ...

  4. eview面板数据之混合回归模型_【视频教程】Eviews系列25|面板数据回归分析之Hausman检验及本章常见问题解答...

    点击上方关注我们! 本期我们学习Eviews统计建模最后一部分--面板数据回归分析Hausman检验及本章常见问题解答.实操:Hausman检验判断是固定效应模型还是随机效应模型上期我们讲到模型判断若 ...

  5. python系列教程-python前世今生以及windows下环境的安装

    文章目录 一.python的前世今生 1.1 Python的起源 二.为什么要学习python 2.1.从语言排行榜上看 三.python的安装 3.1 python下载 3.2 自定义安装路径,以及 ...

  6. python系列-认识python

    1.python是怎么出现的 2.python的发展 3.Python的用途 目前python语言可谓炙手可热,开发,测试.运维还有人工智能.数据分析等板块都是他们的影子. python是什么?pyt ...

  7. csdn最新最牛最细python系列【python高阶:自动化相关技能】 python全栈自动化测试系类4-4

    目录 [python之smtplib模块发送邮件] 1.tls模式加密 2.ssl加密,默认加密端口是465 MIMEApplication模块添加附件: [python编程之ini文件处理-conf ...

  8. 青少年python系列 33.python安装非内置模块

    青少年python教学视频ppt源码 青少年python系列目录_老程序员115的博客-CSDN博客 简介 python内置模及其内部的功能函数,是无法满足我们编程需求的.这时候如果有能够满足我们需要 ...

  9. 青少年python系列 2.Python简介

    青少年python系列目录_老程序员115的博客-CSDN博客 青少年python教学视频ppt源码  Python来源 Python的创始人为Guido van Rossum.1989年圣诞节期间, ...

最新文章

  1. 如何设置网页自动刷新(JSP,JS,HTML)
  2. sql序列(2) sql语句功能表
  3. Java三大主流开源工作流引擎技术分析
  4. linux时间同修改,linux 系统时间修改同步
  5. AQS理解之二,自己设计一个锁
  6. html中文字过长 自动隐藏,css 实现文字过长自动隐藏功能
  7. Fedora/Redhat 在线安装更新软件包,yum 篇 ── 给新手指南 (转载)
  8. java map isempty_Java HashMap isEmpty() 使用方法及示例
  9. Java nginx 双向ssl_Nginx配置单项SSL以及双向SSL
  10. ubuntu postgresql9.5 源码安装
  11. new_picview_PicView图片浏览器
  12. PX4开源软件框架简明简介
  13. 推荐 | 南方医院历时4年构建新HIS系统
  14. 对已存在的标签元素添加子元素
  15. Ubuntu网络连接激活失败
  16. [转] 关于浏览器假死的原因分析和代码优化
  17. android官方开发文档中学英文-uniformly distributed int(均匀分布的整数)
  18. m基于LS+变步长LMS的Volterra级数数字预失真DPD系统matlab仿真
  19. 创业:房多多--如何成功从红海杀出一片天空
  20. [国家集训队]阿狸和桃子的游戏(贪心)

热门文章

  1. 教练我想学python_教练,我想学Python:(3)列表和切片,边学习边刷leetcode,三,与,边学边,LeetCode...
  2. 安全出口指示灯警报、如何解除呢
  3. sqlite中字符串含有单引号的处理
  4. RabbitMQ生产者和消费者Java实现
  5. c#里面的combobox在代码中怎么根据它的text获取它的index?
  6. 分治比赛选手循环问题
  7. CCN(content centric networking)介绍
  8. 基于jquery的tab切换
  9. 颇有微词 小模式 大蓝海 by 曹继忠 - 2013中国SEO排行榜
  10. UVA 10118 Free Candies