“人人都是数据科学家从新开始用Python学习数据科学的完整教程P1
-介绍-
使用SAS超过5年后,我决定离开我的舒适圈。作为一名数据科学家,寻找其他有用的工具是必须的。幸运的是,我没有花太多时间来决定 - Python是我的目标对象。
我不喜欢复杂编码,事实证明,编码实际上非常简单!
我在一周内学会了Python的基础知识。而且,从那时起,我不仅深入探索了这种语言,而且还帮助了许多其他人学习这门语言。Python最初是一种通用语言。但是,多年来通过强大的社区支持,这种语言得到了专门的数据分析库和预测建模库支持。
本次<人人都是数据科学家>长系列教程中,我们将通过“预测一个贷款是否会被批准”、“室内用户运动预测“、“使用机器学习和深度学习预测股票价格”多个案例项目从头开始用Python学习数据科学。
-P1准备阶段-
用于数据分析的Python基础知识
如何安装Python?
安装Python有两种方法:
您可以直接从其官方网站下载Python并安装所需的单个组件和库
或者,您可以下载并安装包含预安装库的软件包。我建议下载Anaconda。
第二种方法提供了无忧安装,因此我建议初学者使用。使用这种方法是你必须等待整个包升级,即使你对单个库的最新版本感兴趣。除非您正在进行前沿的统计研究,否则无关紧要。
选择开发环境
安装Python后,有多种选择环境的选项。以下是3种最常见的选项:
- 基于终端/外壳
- IDLE(默认环境)
- Jupyter notebook
- …
虽然合适的环境取决于您的需求,但我个人更喜欢Jupyter notebook。它在编写代码本身时为文档提供了很多的功能,例如Markdown。你可以选择以组块的形式运行代码(而不是逐行执行)。
我们将使用Jupyter环境来完成这个完整的教程。
Python库和数据结构
Python数据结构
以下是一些在Python中使用的数据结构。您应该熟悉它们,以便在适当时使用它们。
列表 - 列表是Python中最通用的数据结构之一。可以通过在方括号中编写逗号分隔值列表来简单地定义列表。 列表可能包含不同类型的项目,但通常项目都具有相同的类型。Python列表是可变的,列表的各个元素可以更改。
字符串 - 字符串可以简单地通过使用单(’),双(“)或三(”’)引号来定义。用牛栏引号(“’)括起来的字符串可以跨越多行,并且经常在文档字符串中使用(Python的记录函数的方式)。\用作转义字符。请注意,Python字符串是不可变的,因此您无法更改部分字符串。
元组 - 元组由逗号分隔的多个值表示。元组是不可变的,输出由括号括起,以便正确处理嵌套的元组。此外,即使元组是不可变的,如果需要,它们也可以保存可变数据。由于元组是不可变的并且无法更改,因此与列表相比,它们的处理速度更快。因此,如果您的列表不太可能更改,则应使用元组而不是列表。
Dictionary - Dictionary是一组无序的Key,一对大括号创建一个空字典: {}。
Python迭代和条件构造
像大多数语言一样,Python也有一个FOR循环,它是最广泛使用的迭代方法。它有一个简单的语法:
for i in [Python Iterable]:
expression(i);
这里“Python Iterable”可以是列表,元组或其他高级数据结构,我们将在后面的章节中探讨。让我们看一个简单的例子,确定一个数字的阶乘。
fact=1
for i in range(1,N+1)face*=1;
来到条件语句,它们根据条件执行代码片段。最常用的构造是if-else,语法如下:
if [condition]:__execution if ture__
else:__execution if false__;
例如,如果我们要打印数字N是偶数还是奇数:
if N%2=0:print('Even')
else:print('Odd');
既然您已经熟悉Python基础知识,那么让我们更进一步。如果您必须执行以下任务,该怎么办
乘以2个矩阵
找到二次方程的根
绘制条形图和直方图
制作统计模型
访问网页
如果你试图从头开始编写代码,它将成为一场噩梦,你将不会在Python上停留超过2天!但不要担心。值得庆幸的是,有许多预定义的库,我们可以将它们直接导入到我们的代码中,让我们的生活更轻松。
例如,考虑我们刚看到的阶乘示例。我们可以一步完成:
math.factorial(N);
当然,我们需要为此导入数学库。下一篇P2让我们来探讨各种数据科学库。
如果您想支持小编,不用您赞赏,更需要您的转发!阅读数是小编文章最直观的感受。
如有疑问咨询请加官微:fintechapplab!
“人人都是数据科学家从新开始用Python学习数据科学的完整教程P1相关推荐
- python怎么重新开始_人人都是数据科学家从新开始用Python学习数据科学的完整教程P3...
上周一P2篇大家熟悉一些有用的库来学习Python.P3篇让我们学习如何用Pandas在Python中进行探索型数据分析. 为了进一步探索我们的数据,让我向您介绍另一种动物(好像Python还不够!) ...
- 独家 | 数据科学家对可复用Python代码的实用管理方法(附链接)
作者:Matthew Mayo, KDnuggets翻译:殷之涵校对:欧阳锦本文约3000字,建议阅读5分钟本文为大家介绍了四种关于复用Python代码的管理方法,以提高代码的效率及可读性等. 标签: ...
- “数据科学家”或许不再性感,但“数据团队”的产业化才刚开始 | 专访领英全球数据科学团队负责人...
来源:大数据文摘 本文约5750字,建议阅读6分钟. 本文为清华大学大数据研究中心联合大数据文摘发起的年度白皮书<顶级数据团队建设全景报告>系列专访的第二篇内容.<报告>囊括专 ...
- “数据科学家”或许不再性感,但“数据团队”的产业化才刚开始 | 专访领英全球数据科学团队负责人
大数据文摘出品 作者:魏子敏.夏雅薇.牛婉杨 定下"顶级数据科学团队"这个研究话题时,我们第一时间想到了领英(LinkedIn). 2008年,正是在这家公司,DJ Patil建立 ...
- layui 数据表格下拉框_layui学习——数据表格嵌套下拉列表,并实现动态更新
layui学习--数据表格嵌套下拉列表,并实现动态更新 项目中有些字段的数据为固定的几个值,这些字段在数据表格中显示为汉字,但在数据库中以数字形式存储,例如:仓库属性(0:普通仓/1:检验仓/2:报废 ...
- 大数据数据科学家常用面试题_进行数据科学工作面试
大数据数据科学家常用面试题 During my time as a Data Scientist, I had the chance to interview my fair share of can ...
- 人人都是程序员的节奏,Python 纳入高考
近期,浙江省信息技术课程改革方案出台,Python 确定进入浙江省信息技术高考,从2018年起浙江省信息技术教材编程语言将会从 VB 更换为Python. 国家这是要花大力气打造爱我中华,人人都是程序 ...
- 人人都可以创造自己的AI:深度学习的6大应用及3大成熟领域
导读:深度学习,也称"阶层学习"或"分层学习",是基于学习数据表征的更广泛的机器学习方法系列的一部分,而不是基于特定任务的算法.深度学习通过组合低层特征形成更加 ...
- 【友盟+】首席数据科学家李丹枫:用数据指导创业
3月26日,[友盟+]首席数据科学家李丹枫出席了第三届黑马运动会,在"企业级服务+电商+本地生活O2O+汽车后市场联合论坛"中担任项目路演环节的评委. (图为[友盟+]首席数据科学 ...
- 从图像处理到语音识别,25款数据科学家必知的深度学习开放数据集
选自Analytics Vidhya,作者:Pranav Dar,机器之心编译. 本文介绍了 25 个深度学习开放数据集,包括图像处理.自然语言处理.语音识别和实际问题数据集. 介绍 深度学习(或生活 ...
最新文章
- 【29.42%】【POJ 1182】食物链
- C语言数组的一些运算*a,a+1,a+1,a+0
- 科大星云诗社动态20211202
- Ubuntu中update-alternatives命令(版本切换)
- 4,postman和newman的联合使用
- 安卓自定义时间选择器_微信小程序拾色器(颜色选择器)组件
- Lambda表达式在Java 8中的简单应用
- 设计模式(五)--工厂模式汇总
- ActionScript 3.0 学习笔记三
- 异常:fatal: unable to access 'https://git.oschina.net/pcmpcs/library.git/': Could not resolve host...
- mysql 126_MySQL教程126-MySQL事务隔离级别
- 外部表不是预期的格式 解决方案
- BlueViewer 地图加载分析(C#)
- 各种免费在线工具收集
- QT on Android的rtsp播放器demo
- 2022年上半年系统分析师上午真题及答案解析
- sfm点云代码_SfM实现过程分析
- JVM垃圾回收机制【简单介绍】
- 阿里云注册域名,购买云服务器,备案,域名解析图文教程
- 锐龙r7 4800h性能怎么样