1.help()和dir()函数

help()函数与dir()函数都是帮助函数:

help()函数能够提供详细的帮助信息,dir()函数仅是简单的罗列可用的方法。

2.基础数据结构

基础数据类型:数值型、布尔型和字符串型。

2.1 数值型数据有整型(int)和浮点型(float)两种。

数值型数据的计算方法:

加 x+y

减 x-y

乘 x*y

除 x/y

幂次方 x**3

加等 x += 2 在x原有值的基础上再加2

减等 x -= 2 在x原有值的基础上减2

2.2 布尔型数据只有两种类型:True 和 False

2.3 字符串类型

字符串类型用单引号或双引号引起,引号内的内容即为字符串类型(str)。

s1 = 'hello world'

s2= "hello world"

len(s1) = 11 # 字符串计数包含空格

long_str = ' I am a teacher. '

# 去掉字符串左右两边的空格

long_str.strip() -> 'I am a teacher.'

# 去掉字符串左边的空格

long_str.lstrip() -> 'I am a teacher. '

# 去掉字符串右边的空格

long_str.rstrip() -> ' I am a teacher.'

# 将字符串中的teacher替换为student

long_str.strip().replace('teacher', 'student')

->I am a student.

num_str = '123456'

num_str.isdigit() # 判断变量是否为数值型变量

字符串切片

str = 'hello'

# str 01234

# str -5-4-3-2-1

str[1:4] -> 'ell' # 序数从0开始,右区间为开区间

str[1:] -> 'ello'

str[:3] -> 'hel'

# 逆序数

s[-5:] -> 'hello'

s[-4:-1] -> 'ell'

格式化输出

num_s = 100

num_t = 3

test_str = 'hello'

text = 'there are %d students in the classroom and %s' %(num_s, test_str)

text

-> 'there are 100 students in the classroom and hello'

# %d格式化输出数字,%s格式化输出字符串, 括号内的参数按语句中对应的顺序排列。

s = 'hello world hello bigdata hello China'

s.split(' ')

-> ['hello', 'world', 'hello', 'bigdata', 'hello', 'China']

# 以空格作为分隔符将文本拆分为列表

3.判断语句

3.1 if判断

score = 59

if score > 90:

print 'very good.'

elif score > 85:

print 'good.'

elif socre > 70:

print 'just so so.'

else:

print 'not so good'

# if--elif--else

# 每个判断语句写完后记得加冒号":"

3.2 逻辑操作:与(and)或(or)非(not)

A = True

B = False

A and B = False

A or B = True

(not A) or B = False

4.容器

4.1 列表/list

string_list = ['this', 'is', 'a', 'string']

len(string_list) = 4 # len()函数计算列表中元素的个数

string_list[1:3] -> ['is', 'a'] # 列表的切片,同字符串的切片操作类似

列表中的元素没有类型限制,不同数据类型可以添加到同一个列表中。

mass = ['this', 'is', 'good', 3.14, 10]

# 用for循环输出list元素的数据类型

for item in mass:

print type(item)

# 用索引号index输出个性化结果

for index in range(5)

if index % 2 == 0: # 索引号为偶数

print mass[index]

# 用while循环(注重于结束的条件)

index = 0

while index < 2:

print mass[index]

index += 1

append与extend的区别

append可将任何对象添加到list中,甚至包括list。

extend只会将list中的元素添加进去。

sort与sorted的区别

sort()函数改变列表本身的顺序

sorted()函数不改变列表本身的顺序

高级排序

num_list = [1, 2, 3, 4, 5, 6, 7]

print sorted(num_list, reverse = True) # 逆序排列

->[7, 6, 5, 4, 3, 2, 1]

a = ['aa', 'bbbbb', 'ccc', 'dddd']

print sorted(a, key = len) # 按字符串长度排列

->['bbbbb', 'dddd', 'ccc', 'aa']

4.2 字典/dict

字典的查找速度较列表要快很多,原因是字典采用哈希算法(hash),即一个key对应一个value,使用花括号"{}"表示。

Dict = {key1: value1, key2: value2, key3: value3}

pets = {'dogs':3, 'cats':2, 'birds':4}

print pets['dogs'] # 查找键值时使用中括号"[]"

->3

if 'cats' in pets:

print 'I have ' + str(pets['cats']) +'cats.' # 只有字符串才能用"+"号连接,所以pets['cats']返回的值必须用str()函数转换为字符串。

->I have 2 cats.

# for循环遍历字典

for pet in pets:

print 'I have ' + str(pets[pet]) + pet

-> I have 3 dogs

I have 2 cats

I have 4 birds

# 只想取出key

pets.keys() # 会得到由键值组成的列表对象

sum(pets.keys()) # 会得到列表中所有数字的加总和

# 从字典中成对取出数据

for (pet, num) in pets.items(): # 字典中的每一个元素都是一对键值对。

print pet, '=' , num

->dogs = 3

cats = 2

birds = 4

# 字典添加新的键值对

pets['ducks'] = 5

# 字典删除键值对

del pets['ducks']

4.3 文件的读写

in_file = 'shanghai.txt'

for line in open(in_file):

print line.strip().splite(" ")

# 使用"for line in open(file):"这种方式打开的文件不需要关闭句柄。

# strip()函数去除了每个段落前后的空格

# splite(" ")函数将每个段落中的单词以空格作为分隔符拆分为单个的列表元素。

#最后的拆分结果,每个段落组成一个列表,每个段落中的单词成为对应列表中的一个元素

4.4 统计文件中每个单词出现的频次

# 选用字典作为容器

words_count = {} # 创建一个空字典

for line in open('shanghai.txt'):

words = line.strip().splite(" ") # 对文本做处理,去掉段落前后的空格,并以空格作为分隔符拆分段落中的单词,构建列表。

for word in words:

if word in words_count:

words_count[word] += 1 # 如果字典中存在该单词,对应的值+1

else:

words_count[word] = 1 # 如果字典中不存在该单词,在字典中添加一对新的键值对。

#字典里存储的是词和词频

for word in words_count:

print word, words_count[word] # 使用for循环遍历并输出字典中的单词和词频

4.5 定义函数

定义函数要用下面的形式:

def 函数名(函数参数):

函数内容

例如:

def add_num(x,y):

return x+y

add_num(3, 4)

->7

def my_func(list_x):

new_list = []

for item in list_x:

new_list.append(item**3)

return new_list

my_test = [1, 2, 3, 4, 5]

my_func(my_test)

->[1, 8, 27, 64, 125]

# 定义函数自动读取文件并输出文件中的单词和词频

def count_words(in_file, out_file):

words_count = {}

# 对每一行去前后两端的空格,用单词间的空格作为分隔符分拆单词,采用字典记录

for line in open(in_file):

for word in line.strip().rstrip('.').splite(" "):

if word in words_count:

words_count[word] += 1

else:

words_count[word] = 1

# 打开文件并写入结果

out = open(out_file, 'w') # 'w' 代表 'w'riting,这种打开文件的方式最后需要关闭句柄。

for word in words_count:

out.write(word + "#" + str(words_count[word]) + "\n") # 将单词和词频用一定的格式写入文件

out.close # 关闭句柄

# 调用函数

count_words('shanghai.txt', 'words_count.txt')

4.6 list comprehension

当需要对于列表中的每一个元素做相同的操作时,可以采用list comprehension方法。

[需要对item做的操作 for item in list (可选部分:对item的限制条件)]

test_list = [1, 2, 3, 4]

[item**3 for item in test_list]

->[1, 8, 27, 64]

['num_' + str(item) for item in test_list]

->['num_1', 'num_2', 'num_3', 'num_4']

[item**3 for item in test_list if item % 2 == 0] # 对列表中为偶数的元素做立方处理,并输出新的列表

->[8, 64]

[item**4 for item in test_list if item % 2 == 0 and item > 3] # 对列表中为偶数且大于3的元素乘4次方,并输出新的列表。

->[256]

python单词统计、给定一个段落()_数训营第一课笔记:Python基础知识相关推荐

  1. python单词统计、给定一个段落()_自己动手Python写一个词频统计小项目

    这里用python做一个小小的英文词频的统计.当然了,自己写的,就没有停词.计算词语权重这些功能了,纯粹是写写代码练练手. 首先呢,这里是一篇英文文章,就像下面这样的185个小段落,数据量还是不大的, ...

  2. matlab 转换为正整数_【MATLAB】专题1笔记 MATLAB基础知识

    视频课程参考:https://www.bilibili.com/video/BV19J411W7Ta 数值问题-->求解算法-->程序实现-->结果分析 MATLAB  功能  :数 ...

  3. python 图像分析自然纹理方向与粗细代码_数字图像处理与Python实现笔记之基础知识...

    数字图像处理与Python实现笔记之基础知识 摘要 绪论 1 数字图像处理基础知识 1.1 数字图像简介 1.1.1 数字图像处理的目的 1.1.2 数字图像处理的应用 1.1.3 数字图像处理的特点 ...

  4. 数字图像处理与Python实现笔记之基础知识

    数字图像处理与Python实现笔记之基础知识 摘要 绪论 1 数字图像处理基础知识 1.1 数字图像简介 1.1.1 数字图像处理的目的 1.1.2 数字图像处理的应用 1.1.3 数字图像处理的特点 ...

  5. python与数据思维基础笔记_Python小课笔记--Python基础:数据和函数(二)

    截图来自Python小课 文|仟樱雪 在Python小课-1-2节中,已经学习了基础模块--数据--数据类型(整数.字符串),以及基础模块--变量,基础模块--函数(input函数.print函数). ...

  6. 对于一个网络营销新手,需要掌握哪些网络营销基础知识

    其实,说到网络营销,很多人的脑海里都是一个片面的了解,没有一个很全面,很明确的概念,只是知道一些网络营销技巧和方法,就大言不惭的说自己懂"网络营销"了,马找钱在这里就给一些网络营销 ...

  7. python步骤解析 给定一个整数数组和目标值_给定一个整数数组和一个目标值,找出数组中和为目标值的两个数 例如给定nums = [2,7,11,15],target = 9...

    python解决方案 nums = [1,2,3,4,5,6] #假如这是给定的数组 target = 9 #假如这是给定的目标值 num_list = [] #用来装结果的容器 def run(nu ...

  8. Python练习题:---给定一个字符串 {xxx[xxx{xxx}]xx{x[xxx]xxx{xxx}xx}x} 判断其中的 {}[]() 是否成对出现

    给定一个字符串 {xxx[xxx{xxx}]xx{x[xxx]xxx{xxx}xx}x} 判断其中的 {} 是否成对出现 答题思路: 使用堆栈进行解决 我们首先压栈一个左括号,当什么时候检测到与之对应 ...

  9. Python编程 统计Java源文件代码行数,注释行数,空白行数

    每次学习新的语言,就想重新实现一遍做过的课设=,= 这里实现的是"综合性实验 Java源代码分析程序"的第三部分 第二部分见:[Python编程]统计目录下Java源文件的关键字出 ...

最新文章

  1. java 调用计算机程序方法
  2. python一维平滑滤波_高斯滤波器的原理及其实现过程(附模板代码)
  3. Dapr + .NET 实战(十二)服务调用之GRPC
  4. 高级数据结构---并查集
  5. G4560 HD610安装黑苹果Hakintosh
  6. windows系统使用bat命令文件启动redis
  7. springboot源码 红色J_通达信精准指标,精确箱体——(主图 源码)介绍
  8. docker login Error response from daemon: Get http://ip:port/v2/: net/http: request canceled
  9. cmsis-dap ubuntu Error: unable to find CMSIS-DAP device
  10. AI内容生成工具列表,可用于生成 AI 内容的工具列表。具有图像生成、文本生成等功能。
  11. python上方菜单栏不见了_python tkinter-菜单栏
  12. 2019年—BAT大型互联网企业刚出炉的一套面试题(Java岗)
  13. iostextarea获取焦点_jquery – 在iOS上的Safari中针对textarea触发的不一致事件
  14. 设计模式 #1(7大设计原则)
  15. 蓝牙遥控器获取电量GATT
  16. ddm模型公式_用DDM模型来判断市场理论上的合理市盈率
  17. matlab stract结构_科学网—[MATLAB]方便快捷读取结构体里数个结构体内的数据 - 胡振东的博文...
  18. 苹果Beats Flex无线耳机已发布!
  19. 成都大数据培训之log4j slf4j 需要注意的地方
  20. 风雷影音v2.1.1.0落雪梨花绿色精简版【首家独创双播放内核架构、全面支持高清格式】...

热门文章

  1. 14个数据库的设计技巧 (来自Blogcn中我的窝)
  2. 测试香港服务器访问速度的方法
  3. MPLS标签分配控制方式——Vecloud
  4. SDN控制器构建原理方法—Vecloud
  5. 多协议标签交换中的标签指的是什么?—Vecloud微云
  6. Spring文档学习
  7. JMeter压力测试入门教程[图文]
  8. Effective C++ 读书笔记之Part2.Constructors, Destructors, and Assignment Operators
  9. MySQL 唯一索引和普通索引该如何选择?
  10. 72.数据库中什么叫码?