python大数据后期教学_大数据处理之道(十分钟学会Python)
一:python 简介
(1)Python的由来
Python(英语发音:/?pa?θ?n/), 是一种面向对象、解释型计算机程序设计语言,由Guido van Rossum于1989年底发明,第一个公开发行版发行于1991
年。Python语法简洁而清晰,具有丰富和强大的类库。它常被昵称为胶水语言,它能够把用其他语言制作的各种模块(尤其是C/C++)很轻松地联结
在一起。常见的一种应用情形是,使用Python快速生成程序的原型(有时甚至是程序的最终界面),然后对其中有特别要求的部分,用更合适的语言改写,
比如3D游戏中的图形渲染模块,性能要求特别高,就可以用C++重写。
(2)Python 语法简介 ---- 类型转化
int(x [,base ]) 将x转换为一个整数
long(x [,base ]) 将x转换为一个长整数
float(x ) 将x转换到一个浮点数
complex(real [,imag ]) 创建一个复数
str(x ) 将对象 x 转换为字符串
repr(x ) 将对象 x 转换为表达式字符串
eval(str ) 用来计算在字符串中的有效Python表达式,并返回一个对象
tuple(s ) 将序列 s 转换为一个元组
list(s ) 将序列 s 转换为一个列表
chr(x ) 将一个整数转换为一个字符
unichr(x ) 将一个整数转换为Unicode字符
ord(x ) 将一个字符转换为它的整数值
hex(x ) 将一个整数转换为一个十六进制字符串
oct(x ) 将一个整数转换为一个八进制字符串
(3)Python 语法简介 ---- 类型转化
s + r 序列连接
s * n , n * s s的 n 次拷贝,n为整数
s % d 字符串格式化(仅字符串)
s[i] 索引
s[i :j ] 切片
x in s , x not in s 从属关系
for x in s : 迭代
len(s) 长度
min(s) 最小元素
max(s) 最大元素
s[i ] = x 为s[i]重新赋值
s[i :j ] = r 将列表片段重新赋值
del s[i ] 删除列表中一个元素
del s[i :j ] 删除列表中一个片段
(4)(3)Python 语法简介 ---- 类型转化
x >> y 右移
x & y 按位与
x | y 按位或
x ^ y 按位异或 (exclusive or)
~x 按位翻转
x + y 加
x - y 减
x * y 乘
x / y 常规除
x // y 地板除
x ** y 乘方 (xy )
x % y 取模 (x mod y )
-x 改变操作数的符号位
+x 什么也不做
~x ~x=-(x+1)
abs(x ) 绝对值
divmod(x ,y ) 返回 (int(x / y ), x % y )
pow(x ,y [,modulo ]) 返回 (x ** y ) x % modulo
round(x ,[n]) 四舍五入,n为小数点位数
x < y 小于
x > y 大于
x == y 等于
x != y 不等于(与<>相同)
x >= y 大于等于
x <= y 小于等于
二:python应用
(1) 文件处理
filename = raw_input('Enter your file name') #输入要遍历读取的文件路径及文件名
file = open(filename,'r')
done = 0
while not done:
aLine = file.readline()
if(aLine != ''):
print aLine,
else:
done = 1
file.close() #关闭文件解释:
.readline() 和 .readlines() 之间的差异是后者一次读取整个文件,.readlines() 自动将文件内容分析成一个行的列表,该列表可以由 Python 的 for ... in ... 结构
进行处理。另一方面,.readline() 每次只读取一行,通常比 .readlines() 慢得多。仅当没有足够内存可以一次读取整个文件时,才应该使用 .readline()。
如果Python文件读到了文件尾,则会返回一个空字符串‘’,而如果是读到一个空行的话,则会返回一个‘\n’
Python的readline()方法,每行最后都会加上一个换行字符‘\n’。有时候有的文件最后一行没有以‘\n‘结尾时,不返回‘\n’。
readlines()方法返回的是一个列表,而readline()返回一个字符串。
(2)错误处理
Python报错TypeError: ‘str‘ object is not callable
当一般内部函数被用作变量名后可能出现此错误。比如:
range=1
for i in range(0,1):
………
就会报这样的错误
这样的错会报在for行,但是时间引起的原因却是在range=1这行,如果两行相距较远,怎很难被发现。所以要特别注意不要用内部已有的变量和函数名作自定义变量名。或者str被预先定义了
str=10
for i in range(1,10):
print str(i)
(3) 综合应用,文件读取,控制台读取,时间转化,编码转换
import time
from time import strftime
import sys
reload(sys)
sys.setdefaultencoding('utf8')
# -*- coding: cp936 -*-
print ("Hello, Python!")
#!/usr/bin/python
a = 21
b = 10
c = 0
c = a + b
print "Line 1 - Value of c is ", c
c = a - b
print "Line 2 - Value of c is ", c
c = a * b
print "Line 3 - Value of c is ", c
c = a / b
print "Line 4 - Value of c is ", c
c = a % b
print "Line 5 - Value of c is ", c
a = 2
b = 3
c = a**b
print "Line 6 - Value of c is ", c
a = 10
b = 5
c = a//b
print "Line 7 - Value of c is ", c
# for repeat its
list = [2, 4, 6, 8]
sum = 0
for num in list:
sum = sum + num
print("The sum is:", sum)
# print and Input, assignment
print("Hello, I'm Python!")
name = input('What is your name?\n')
print('Hi, %s.' % name)
# test for
fruits = ['Banana', 'Apple', 'Lime']
loud_fruits = [fruit.upper() for fruit in fruits]
print(loud_fruits)
# open, write and read file
fo = open("./tmp/foo.txt","w+")
fo.write("Python is a gerat language.\nYeah its great!!\nI am zhang yapeng, who are you?\n")
t_str = u'我是张燕鹏,您是什么货色?'
print(t_str)
fo.write(t_str)
fo.close()
#read and write
fr = open("./tmp/foo1.txt","r+")
fw = open("foo_rw.txt","wb")
done = 0;
localtime = time.asctime(time.localtime(time.time()))
print "Local current time : ", localtime
fw.write(localtime + "\n")
while not done:
t_str = fr.readline()
if(t_str != ''):
print "Read String is : ", t_str
fw.write(t_str)
else:
done = 1
fr.close()
fw.close()
# test time (import)
localtime = time.localtime(time.time())
print "Local current time : ", localtime
# format the time from time import strftime
t_time = strftime( '%Y-%m-%d %H:%M:%S', localtime)
print "formatting local current time : ", t_time
# design the time by yourself
year = str(localtime.tm_year)
mon = str(localtime.tm_mon)
day = str(localtime.tm_mday)
hour = str(localtime.tm_hour)
mins = str(localtime.tm_min)
sec = str(localtime.tm_sec)
newtime = u"时间是: " + year + "年" + mon + "月" + day + "日 " + hour + ":" + mins + ":" + sec
print "Local current time : ", newtime
(4)运行图:
(5) 总结:
(1)Python是一门入手非常快的语言,处理大数据的好语言,一些规范非常类似于c++语言,例如语法和一些函数命名,文件的打开和读写,以及
读写方式,非常类似于c++
(2)正如,开头所写的 “python是胶水语言,使用Python快速生成程序的原型(有时甚至是程序的最终界面),然后对其中有特别要求的部分,用更合适
的语言改写,比如3D游戏中的图形渲染模块,性能要求特别高,就可以用C++重写。”
(4)W3CSchool.cc (3)中提到的学习网站是非常基础的人们课程,要是想深入,具体的内容可以百度
python大数据后期教学_大数据处理之道(十分钟学会Python)相关推荐
- python与大数据是什么_大数据和python有什么区别
大数据(big data),IT行业术语,是指无法在一定时间范围内用常规软件工具进行捕捉.管理和处理的数据集合,是需要新处理模式才 能具有更强的决策力.洞察发现力和流程优化能力的海量.高增长率和多样化 ...
- python开发和大数据开发工程师_大数据开发工程师的岗位职责
大数据开发工程师负责该领域的业务需求讨论,完成技术方案及数据开发.下面是学习啦小编整理的大数据开发工程师的岗位职责. 大数据开发工程师的岗位职责1 职责: 1.负责所分管团队的团队建设和日常管理工作; ...
- python大数据好不好学_大数据好学吗?想转行大数据??
作为一名IT从业者,同时也是一名教育工作者,我来回答一下这个问题. 首先,虽然大数据技术具有一定的难度,但是随着大数据技术体系的逐渐丰富和完善,大数据领域对于人才的需求类型也在不断趋于多元化,不同知识 ...
- python大数据就业方向_大数据方向:就业主要从事哪些工作?
你好. 一.大数据就业前景 大数据行业人才稀缺,人才需求量达100万+,随着人工智能.物联网.云计算的快速发展,大数据人才需求也急剧增加,未来还将不断扩大.而且大数据人才的薪资也是普遍较高的,2018 ...
- Hadoop! | 大数据百科 | 数据观 | 中国大数据产业观察_大数据门户
深度好文丨读完此文,就知道Hadoop了! 来源:BiThink 时间:2016-04-12 15:14:39 作者:陈飚 "昔我十年前,与君始相识." 一瞬间Hadoop也到了要 ...
- 搭建高校AI大数据实训室,2019高校大数据科研教学整体解决方案,数道云
伴随着互联网技术的迅猛发展,正在逐步改变传统的高校教育模式,以大数据.云计算.AI等等技术为核心的教育模式正在逐步发展. 高校实行AI大数据实训室有何实质性的效果呢? 大数据的出现催生出产业人才缺口瓶 ...
- hadloop大数据平台论文_大数据平台建设探讨
2019.03 1 概述 大数据平台通过统一的 大数据库实现全省业务信息 的集中 , 该库数据来源于全省各个业务系统和基础数据 库等应用数据 . 位置数据 . 搜索数据等结构化数据 . 半 结构化数据 ...
- 交通大数据应用细分_大数据之路之交通大数据应用总体架构设计
上期简单介绍了大数据,了解了大数据应用的可行性与必然性,事实上也的确如此,大数据在公共管理(某省的最多跑一次),教育行业(某省交通厅大数据建设),税务行业(某省税务大数据平台应用建设),信息管理(某省 ...
- 大数据之父_“大数据之父”舍恩伯格最新演讲:大数据重塑制造业(含视频)...
2019年8月16日,在2019智博会"智造新动能·智联新产业"高峰论坛上,全球知名大数据专家,<大数据时代>作者维克托·迈尔·舍恩伯格先生进行了以"大数据重 ...
最新文章
- Python论做游戏外挂,Python输过谁?
- tableciewCell 样式
- crossover卸载 linux,Ubuntu中卸载CrossOver困难?那是你没学会这个命令
- CTF小工具下载整理
- 深度学习之图像分类(二十一)-- MLP-Mixer网络详解
- PMBOK项目管理知识体系包括哪几个知识领域?
- Linux select函数的使用
- Linux下的clk学习
- GIF录制器之-ScreentoGif--非常好用
- MySQL 常见时间获取整理(当日、当月、当年、上一日、上一月、上一年,当月第一天,当年第一天等等)
- 通过颜色来生成一个纯色图片
- BLF格式的CAN数据
- Prometheus-部署grafana及模板展示
- 存储介质还是存储载体,这不是个问题
- APK包名修改 请问如何修改APK包名
- Unity2D游戏回旋镖实现
- 8.0、软件测试——缺陷(定义和标准)
- 企业信使运营管理平台登陆入口 发送方法
- 因果推断(二)——混杂因子,D-分离,后门准则
- 柯西-施瓦兹(Cauchy-Schwarz)不等式
热门文章
- 使用ABAP调用BRF+ function
- 另一种launch SAP CRM AET的方式
- SAP ABAP OData gateway框架序列化和反序列化(serialization deserialization)的实现逻辑
- SAP ABAP关键字在Chrome浏览器里高亮显示的实现原理 - How is ABAP keyword highlight implemented in Chrome
- SAP CRM my task 6个roundtrip的原理讲解
- SAP Cloud for Customer客户主数据的地图集成
- Jerry的通过CDS view + Smart Template 开发Fiori应用的blog合集
- python 函数可以作为容器对象的元素_python第十二天, 三元表达式, 函数对象,名称空间与作用域,函数的嵌套定义...
- gis怎么通过水库划分子流域_ArcGIS提取小流域——以北京为例,提取出密云水库...
- bs cs架构区别_ehr系统是选择BS还是CS 架构?