这次作业来源:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2753

1.列表,元组,字典,集合分别如何增删改查及遍历。

(1)列表

list = ['KOBE', 'INGRAM', 'BALL', 7777];
list1 = [1,2,3,4,5];list.append('JAMES');
print ( list);list.extend(list1);
print ( list);list.insert(1,'KUZMA');
print ( list);list[0]='MAGIC';
print ( list);

  

list = ['KOBE', 'INGRAM', 'BALL', 7777];
list1 = [1,2,3,4,5];del list[1];
print (list)list.pop()
print (list)list.pop(1)
print (list)

  

list = ['KOBE', 'INGRAM', 'BALL', 7777];
list1 = [1,2,3,4,5];x = list.index('KOBE');
print(x);y = list[0];
print(y);z = list[1:3];
print(z);

  

list1 = [1,2,3,4,5];print(len(list1));print(max(list1));print(min(list1));

  

(2)元组

tup1 = ('KOBE', 'INGRAM', 'BALL', 7777);
tup2 = (1,2,3,4,5);tup3 = tup1 + tup2;
print (tup3);

  

tup1 = ('KOBE', 'INGRAM', 'BALL', 7777);
tup2 = (1,2,3,4,5);del tup1;

  

tup1 = ('KOBE', 'INGRAM', 'BALL', 7777);
tup2 = (1,2,3,4,5);print ("tup1[0]: ", tup1[0]);
print ("tup1[1:3]: ", tup1[1:3]);

  

(3)字典

dict = {'KOBE': 24, 'JAMES': 23, 'BALL': 2,'KUZMA':0,'INGRAM':14};dict['KOBE'] = 8;
print(dict);dict['HART'] = 5;
print(dict);

  

dict = {'KOBE': 24, 'JAMES': 23, 'BALL': 2,'KUZMA':0,'INGRAM':14};del dict['JAMES'];
print(dict);dict.clear();
print(dict);del dict

  

dict = {'KOBE': 24, 'JAMES': 23, 'BALL': 2,'KUZMA':0,'INGRAM':14};print ( dict['KOBE']);

  

(4)集合

set = {'KOBE', 'JAMES', 'BALL','KUZMA','INGRAM'};
set.add('magic');
print(set);set.update({777,888});
print(set);

  

set = {'KOBE', 'JAMES', 'BALL','KUZMA','INGRAM'};
set.add('magic');
print(set);set.remove('JAMES')
print(set)

  

2.总结列表,元组,字典,集合的联系与区别。

列表(list)是Python中最有用的一种内置类型,是处理一组有序项目的数据结构,或者说,是一个有序对象的集合。

元组(tuple)就是不可更改的列表,一旦创建,便不可更改。除了表示的方式有点不一样、元组的元素不可更改,其他的特性与前面学习的列表基本一致。

字典含义和表示都与我们语义上的感觉近似。像小时候查找汉字,我们通过拼音字母(或笔画)进行索引,Python中的字典我们可以自己定义名字,然后通过这个名字查找到对应的数值。这个名字叫做,对应的数值简称,所以字典也称键值对。需要注意的是,字典没有顺序一说,所有的值仅能用键获取。

简而言之,字典被看作无序的键值对或有名字的元素列表。

集合是无序的对象集,它和字典一样使用花括号{},但没有键值对的概念。它属于可变的数据类型,一般用于保持序列的唯一性——也就是同样的元素仅出现一次。

在使用时一定要注意集合的无序和唯一两个特点,避免出错。

3.词频统计

  • 1.下载一长篇小说,存成utf-8编码的文本文件 file

    2.通过文件读取字符串 str

    3.对文本进行预处理

    4.分解提取单词 list

    5.单词计数字典 set , dict

    6.按词频排序 list.sort(key=lambda),turple

    7.排除语法型词汇,代词、冠词、连词等无语义词

    • 自定义停用词表
    • 或用stops.txt

8.输出TOP(20)

  • 9.可视化:词云

排序好的单词列表word保存成csv文件

import pandas as pdpd.DataFrame(data=word).to_csv('big.csv',encoding='utf-8')

线上工具生成词云:https://wordart.com/create 

转载于:https://www.cnblogs.com/liangqiuhua/p/10538398.html

复合数据类型,英文词频统计相关推荐

  1. 【作业】组合数据类型练习,英文词频统计实例

    1.列表实例:由字符串创建一个作业评分列表,做增删改查询统计遍历操作.例如,查询第一个3分的下标,统计1分的同学有多少个,3分的同学有多少个等. 1 score = list('012332211') ...

  2. 组合数据类型练习,英文词频统计实例9-21

    1.列表实例:由字符串创建一个作业评分列表,做增删改查询统计遍历操作.例如,查询第一个3分的下标,统计1分的同学有多少个,3分的同学有多少个等. >>>score=list('212 ...

  3. 组合数据类型练习,英文词频统计实例上(2017.9.22)

    字典实例:建立学生学号成绩字典,做增删改查遍历操作. sno=['33号','34号','35号','36号'] grade=[100,90,80,120] d={'33号':100,'34号':90 ...

  4. 组合数据类型,英文词频统计

    练习: 1.总结列表,元组,字典,集合的联系与区别. 列表 [,] 有序,可变,值可以重复 元组(,) 有序,不可修改,不可重复 集合可以用set()函数或者{}创建 用,分隔,不可有重复元素,是无序 ...

  5. 组合数据类型练习,英文词频统计实例上

    1.name=['陈楠芸','陈文琪','刘书签','杨必须'] scores=[7,6,6,5] d={'陈楠芸':7,'陈文琪':6,'刘书签':6,'杨必须':5} print(d) #增加 d ...

  6. 组合数据类型练习,英文词频统计实例

    1.列表实例:由字符串创建一个作业评分列表,做增删改查询统计遍历操作.例如,查询第一个3分的下标,统计1分的同学有多少个,3分的同学有多少个等 score=list('21223113321') pr ...

  7. Python 《Hamlet》哈姆雷特英文词频统计

    英文词频统计 关键问题: 1.词语 -- 键 2.相同词语的累加 -- 值 讨论:定义什么数据类型 -- 字典类型 问题描述: I:文件的输入 P:采用字典类型的结构统计词语出现的频率 O:每个单词及 ...

  8. 字符串操作、文件操作,英文词频统计预处理

    1.字符串操作: 解析身份证号:生日.性别.出生地等 凯撒密码编码与解码 网址观察与批量生成 (1)解析身份证: 编译结果: (2)凯撒密码编码与解码 编译结果: 2.英文词频统计预处理 下载一首英文 ...

  9. Hadoop的改进实验(中文分词词频统计及英文词频统计)(1/4)

    声明: 1)本文由我bitpeach原创撰写,转载时请注明出处,侵权必究. 2)本小实验工作环境为Windows系统下的百度云(联网),和Ubuntu系统的hadoop1-2-1(自己提前配好).如不 ...

  10. Hadoop的改进实验(中文分词词频统计及英文词频统计)(4/4)

    声明: 1)本文由我bitpeach原创撰写,转载时请注明出处,侵权必究. 2)本小实验工作环境为Windows系统下的百度云(联网),和Ubuntu系统的hadoop1-2-1(自己提前配好).如不 ...

最新文章

  1. c语言aba字母塔,打印字母金字塔,昨晚看到某个帖子的题目
  2. 构建 编译和运行Urho3D工程
  3. 八十一、最快最优的快速排序和优化
  4. 语言模型微调领域有哪些最新进展?一文详解最新趋势
  5. 【uniapp】 下拉刷新页面
  6. 软件开发中的需求文档由谁来编写_使用 RStudio 中的 Rmarkdown 编写演示文档
  7. MFC下debug改成release版本出现问题及解决办法
  8. 一个简单的MDX案例及说明 (转载)
  9. TCPIP详解 卷一核心概念整理
  10. 变速齿轮”再研究-----(转帖)
  11. https 抓包解密
  12. opencv:图像的读取和显示
  13. java课设迷宫游戏_Java课程设计走迷宫.doc
  14. Win11新电脑开机跳过联网解决方法
  15. 老男孩Docker基础入门培训视频Docker核心原理解(完整版)
  16. C# 在Windows系统下使用蓝牙进行数据通讯
  17. vijos1027-spfa关键路径-休息中的阿呆
  18. Google Earth Engine(GEE)提取点的土壤湿度
  19. 雄关漫道真如铁,而今迈步从头越
  20. tcl c语言笔试题,TCL2014校园招聘笔试真题及答案

热门文章

  1. 数据结构计算机复试题,计算机考研数据结构测试题(四)
  2. 划线价格怎么弄java_京东可以设置划线价格吗?怎么设置?
  3. 【译】A gentle introduction to self-sovereign identity
  4. 【译】权益证明的设计理念
  5. [Android]你不知道的Android进程化(4)--进程通信AIDL框架
  6. JZOJ 5923. 【NOIP2018模拟10.23】Bomb
  7. JZOJ 4238. 【五校联考5day2】纪念碑
  8. Hdu 3062. Party
  9. 和nptf螺纹一样吗_摩托车火花塞长短不同,对发动机有影响吗?
  10. Java初学者习题20道(转)