-介绍-

使用SAS超过5年后,我决定离开我的舒适圈。作为一名数据科学家,寻找其他有用的工具是必须的。幸运的是,我没有花太多时间来决定 - Python是我的目标对象。

我不喜欢复杂编码,事实证明,编码实际上非常简单!

我在一周内学会了Python的基础知识。而且,从那时起,我不仅深入探索了这种语言,而且还帮助了许多其他人学习这门语言。Python最初是一种通用语言。但是,多年来通过强大的社区支持,这种语言得到了专门的数据分析库和预测建模库支持。

本次<人人都是数据科学家>长系列教程中,我们将通过“预测一个贷款是否会被批准”、“室内用户运动预测“、“使用机器学习和深度学习预测股票价格”多个案例项目从头开始用Python学习数据科学。

-P1准备阶段-

用于数据分析的Python基础知识

如何安装Python?

安装Python有两种方法:

  1. 您可以直接从其官方网站下载Python并安装所需的单个组件和库

  2. 或者,您可以下载并安装包含预安装库的软件包。我建议下载Anaconda。

第二种方法提供了无忧安装,因此我建议初学者使用。使用这种方法是你必须等待整个包升级,即使你对单个库的最新版本感兴趣。除非您正在进行前沿的统计研究,否则无关紧要。

选择开发环境

安装Python后,有多种选择环境的选项。以下是3种最常见的选项:

  1. 基于终端/外壳
  2. IDLE(默认环境)
  3. Jupyter notebook

  4. 虽然合适的环境取决于您的需求,但我个人更喜欢Jupyter notebook。它在编写代码本身时为文档提供了很多的功能,例如Markdown。你可以选择以组块的形式运行代码(而不是逐行执行)。

我们将使用Jupyter环境来完成这个完整的教程。

Python库和数据结构

Python数据结构

以下是一些在Python中使用的数据结构。您应该熟悉它们,以便在适当时使用它们。

  1. 列表 - 列表是Python中最通用的数据结构之一。可以通过在方括号中编写逗号分隔值列表来简单地定义列表。 列表可能包含不同类型的项目,但通常项目都具有相同的类型。Python列表是可变的,列表的各个元素可以更改。

  2. 字符串 - 字符串可以简单地通过使用单(’),双(“)或三(”’)引号来定义。用牛栏引号(“’)括起来的字符串可以跨越多行,并且经常在文档字符串中使用(Python的记录函数的方式)。\用作转义字符。请注意,Python字符串是不可变的,因此您无法更改部分字符串。

  3. 元组 - 元组由逗号分隔的多个值表示。元组是不可变的,输出由括号括起,以便正确处理嵌套的元组。此外,即使元组是不可变的,如果需要,它们也可以保存可变数据。由于元组是不可变的并且无法更改,因此与列表相比,它们的处理速度更快。因此,如果您的列表不太可能更改,则应使用元组而不是列表。

  4. Dictionary - Dictionary是一组无序的Key,一对大括号创建一个空字典: {}。

Python迭代和条件构造

像大多数语言一样,Python也有一个FOR循环,它是最广泛使用的迭代方法。它有一个简单的语法:

for i in [Python Iterable]:
expression(i);

这里“Python Iterable”可以是列表,元组或其他高级数据结构,我们将在后面的章节中探讨。让我们看一个简单的例子,确定一个数字的阶乘。

fact=1
for i in range(1,N+1)face*=1;

来到条件语句,它们根据条件执行代码片段。最常用的构造是if-else,语法如下:

if [condition]:__execution if ture__
else:__execution if false__;

例如,如果我们要打印数字N是偶数还是奇数:

if N%2=0:print('Even')
else:print('Odd');

既然您已经熟悉Python基础知识,那么让我们更进一步。如果您必须执行以下任务,该怎么办

  1. 乘以2个矩阵

  2. 找到二次方程的根

  3. 绘制条形图和直方图

  4. 制作统计模型

  5. 访问网页

如果你试图从头开始编写代码,它将成为一场噩梦,你将不会在Python上停留超过2天!但不要担心。值得庆幸的是,有许多预定义的库,我们可以将它们直接导入到我们的代码中,让我们的生活更轻松。

例如,考虑我们刚看到的阶乘示例。我们可以一步完成:

math.factorial(N);

当然,我们需要为此导入数学库。下一篇P2让我们来探讨各种数据科学库。

如果您想支持小编,不用您赞赏,更需要您的转发!阅读数是小编文章最直观的感受。

如有疑问咨询请加官微:fintechapplab!

“人人都是数据科学家从新开始用Python学习数据科学的完整教程P1相关推荐

  1. python怎么重新开始_人人都是数据科学家从新开始用Python学习数据科学的完整教程P3...

    上周一P2篇大家熟悉一些有用的库来学习Python.P3篇让我们学习如何用Pandas在Python中进行探索型数据分析. 为了进一步探索我们的数据,让我向您介绍另一种动物(好像Python还不够!) ...

  2. 独家 | 数据科学家对可复用Python代码的实用管理方法(附链接)

    作者:Matthew Mayo, KDnuggets翻译:殷之涵校对:欧阳锦本文约3000字,建议阅读5分钟本文为大家介绍了四种关于复用Python代码的管理方法,以提高代码的效率及可读性等. 标签: ...

  3. “数据科学家”或许不再性感,但“数据团队”的产业化才刚开始 | 专访领英全球数据科学团队负责人...

    来源:大数据文摘 本文约5750字,建议阅读6分钟. 本文为清华大学大数据研究中心联合大数据文摘发起的年度白皮书<顶级数据团队建设全景报告>系列专访的第二篇内容.<报告>囊括专 ...

  4. “数据科学家”或许不再性感,但“数据团队”的产业化才刚开始 | 专访领英全球数据科学团队负责人

    大数据文摘出品 作者:魏子敏.夏雅薇.牛婉杨 定下"顶级数据科学团队"这个研究话题时,我们第一时间想到了领英(LinkedIn). 2008年,正是在这家公司,DJ Patil建立 ...

  5. layui 数据表格下拉框_layui学习——数据表格嵌套下拉列表,并实现动态更新

    layui学习--数据表格嵌套下拉列表,并实现动态更新 项目中有些字段的数据为固定的几个值,这些字段在数据表格中显示为汉字,但在数据库中以数字形式存储,例如:仓库属性(0:普通仓/1:检验仓/2:报废 ...

  6. 大数据数据科学家常用面试题_进行数据科学工作面试

    大数据数据科学家常用面试题 During my time as a Data Scientist, I had the chance to interview my fair share of can ...

  7. 人人都是程序员的节奏,Python 纳入高考

    近期,浙江省信息技术课程改革方案出台,Python 确定进入浙江省信息技术高考,从2018年起浙江省信息技术教材编程语言将会从 VB 更换为Python. 国家这是要花大力气打造爱我中华,人人都是程序 ...

  8. 人人都可以创造自己的AI:深度学习的6大应用及3大成熟领域

    导读:深度学习,也称"阶层学习"或"分层学习",是基于学习数据表征的更广泛的机器学习方法系列的一部分,而不是基于特定任务的算法.深度学习通过组合低层特征形成更加 ...

  9. 【友盟+】首席数据科学家李丹枫:用数据指导创业

    3月26日,[友盟+]首席数据科学家李丹枫出席了第三届黑马运动会,在"企业级服务+电商+本地生活O2O+汽车后市场联合论坛"中担任项目路演环节的评委. (图为[友盟+]首席数据科学 ...

  10. 从图像处理到语音识别,25款数据科学家必知的深度学习开放数据集

    选自Analytics Vidhya,作者:Pranav Dar,机器之心编译. 本文介绍了 25 个深度学习开放数据集,包括图像处理.自然语言处理.语音识别和实际问题数据集. 介绍 深度学习(或生活 ...

最新文章

  1. 【29.42%】【POJ 1182】食物链
  2. C语言数组的一些运算*a,a+1,a+1,a+0
  3. 科大星云诗社动态20211202
  4. Ubuntu中update-alternatives命令(版本切换)
  5. 4,postman和newman的联合使用
  6. 安卓自定义时间选择器_微信小程序拾色器(颜色选择器)组件
  7. Lambda表达式在Java 8中的简单应用
  8. 设计模式(五)--工厂模式汇总
  9. ActionScript 3.0 学习笔记三
  10. 异常:fatal: unable to access 'https://git.oschina.net/pcmpcs/library.git/': Could not resolve host...
  11. mysql 126_MySQL教程126-MySQL事务隔离级别
  12. 外部表不是预期的格式 解决方案
  13. BlueViewer 地图加载分析(C#)
  14. 各种免费在线工具收集
  15. QT on Android的rtsp播放器demo
  16. 2022年上半年系统分析师上午真题及答案解析
  17. sfm点云代码_SfM实现过程分析
  18. JVM垃圾回收机制【简单介绍】
  19. 阿里云注册域名,购买云服务器,备案,域名解析图文教程
  20. 锐龙r7 4800h性能怎么样

热门文章

  1. 信号与系统----导论1杂谈为什么要学信号与系统
  2. 如果secureCRT安装时位置改变,EVE-NG如何关联secureCRT
  3. 科研ABC - 会议海报制作
  4. OpenGL超级宝典(第7版)环境配置和相关问题
  5. 电子设计大赛应该准备什么
  6. [含论文+源码等]javaweb银行柜员业务绩效考核系统
  7. 关于 创建网络套接字失败 10106
  8. 花椒前端基于WebAssembly 的H.265播放器研发
  9. Ubuntu 20.04 锐捷客户端安装记录
  10. AutoCAD2012从入门到精通中文视频教程 第46课 三维实体及创建实体命令1(个人收藏)