Python-123 试题 天龙八部
‘’‘《天龙八部》是著名作家金庸的代表作之一,历时4年创作完成。该作品气势磅礴,人物众多,非常经典。这里给出一个《天龙八部》的网络版本,文件名为“天龙八部-网络版.txt”。
问题1:请编写程序,对这个《天龙八部》文本中出现的汉字和标点符号进行统计,字符与出现次数之间用冒号:分隔,输出保存到“天龙八部-汉字统计.txt”文件中,该文件要求采用 CSV 格式存储,参考格式如下(注意,不统计空格和回车字符):
天:100, 龙:110, 八:109, 部:10
(略)
问题2:请编写程序,对《天龙八部》文本中出现的中文词语进行统计,采用 jieba 库分词,词语与出现次数之间用冒号:分隔,输出保存到“天龙八部-词语统计.txt”文件中。参考格式如下(注意,不统计任何标点符号):
天龙:100, 八部:10
(略)```
import jieba
import redef get_input(input_file):with open(input_file, 'r', encoding='utf-8') as f:f0 = f.read()return f0def process_write(origin, destination):d = dict()ls = []for i in origin:d[i] = d.get(i, 0) + 1items = list(d.items())for i in range(len(items)):word, count = items[i]ls.append("{}:{}".format(word, count))l = ','.join(ls)with open(destination, 'w', encoding='utf-8') as f:f.write(l)def process_1(file):for i in ['\n', ' ']:f1 = file.replace(i, '')return f1def process_2(file):# file = re.sub(',|。|“|”|:|;|?|\n| ', '', file) # 用正则替换掉for i in ",。“”:;? ":file.replace(i, "") # 正常的字符替换file.replace('\n', '')f1 = jieba.lcut(file)return f1def main():input_file = "天龙八部-网络版.txt"f0 = get_input(input_file)output_file1 = "天龙八部-汉字统计.txt"f1 = process_1(f0)process_write(f1, output_file1)output_file2 = "天龙八部-词语统计.txt"f2 = process_2(f0)process_write(f2, output_file2)main()
Python-123 试题 天龙八部相关推荐
- python面试题及答案-5个很好的Python面试题问题答案及分析
本文的主要内容是向大家分享几个Python面试中的T题目,同时给出了答案并对其进行分析,具体如下. 本文的原文是5 Great Python Interview Questions,同时谢谢 @非乌龟 ...
- 在python中、下列代码的输出是什么-python面试题详细总结(附答案)
本篇文章给大家带来的内容是关于python面试题总结(附答案),有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助. CPS少儿编程网-Scratch_Python_教程_免费儿童编程学习平 ...
- 2020 年最全 Python 面试题汇总 (四)
@Author:Runsen 文章目录 前言 61.01背包 62.完全背包 63.多重背包 64.多重背包的二进制 65.混合背包 66.Vivio面试真题 67.二维费用的背包问题 68.买卖股票 ...
- python 面试题(3)--- 进制转换
1.二进制.八进制和十六进制的表示方法 代码演示: #二进制 n1 = 0b0101 print(n1)#八进制 n2 = 0o157 print(n2)#十六进制 n3 = 0xF12 print( ...
- 阿里巴巴整理的python_阿里P8大佬整理的2020年最全99道python面试题,文末附答案...
前言: 学习python的优点是什么?python语法非常优雅,简单易学 免费开源 跨平台,可以自由移植 可扩展,可嵌入性强 第三方库丰富 python的应用领域在系统编程中应用广泛,比如说shell ...
- python面试题37道(附答案)看完面试不愁了
1. (1)python下多线程的限制以及多进程中传递参数的方式 python多线程有个全局解释器锁(global interpreter lock),这个锁的意思是任一时间只能有一个线程使用解释器, ...
- 老男孩上海校区Python面试题
python面试题 第一章:python基础 数据类型: 1 字典: 1.1 现有字典 dict={'a':24,'g':52,'i':12,'k':33}请按字典中的 value 值进行排序? 1. ...
- python查询和替换一个文本字符串_【Python】python面试题
一些Python面试题 1. (1)python下多线程的限制以及多进程中传递参数的方式 python多线程有个全局解释器锁(global interpreter lock),这个锁的意思是任一时间只 ...
- python123练习题文库,Python程序设计试题库.doc
Python程序设计试题库.doc .Python程序设计题库一.填空题第一章 基础知识1.Python安装扩展库常用的是_工具.(pip)2.Python标准库math中用来计算平方根的函数是.(s ...
- 史无前例的这个 GitHub 汇总了 300 道 Python 面试题
对于机器学习算法工程师而言,是不可或缺的语言,它的优美与简洁令人无法自拔.那么你了解过Python编程面试题吗?从Python基础到网页爬虫你是否能全方位Hold住?今天,机器之心为读者们推荐一个Gi ...
最新文章
- Oracle快速复制表
- MapReduce1.x与MapReduce2.x差异
- 关于SAP Cloud Platform ABAP环境费用的问题
- python 字典组成的列表 差集_python 中 如何 获取两个 字典组成的列表的差集?
- python画散点图带直线和图例_带图例的Matplotlib散点图
- Android -- 无线网络配置信息的管理者WifiConfigStore简介
- python matplotlib.pyplot报错tk_@邹博,python 中 import matplotlib.pyplot 会报Keyerror 'qt5' 的错...
- 学术论文SCI、期刊、毕业设计中的图表专用软件
- 电商帝国阿里巴巴起跑中国量子产业
- 无人机倾斜摄影三维建模
- 解决webview无法调用支付宝
- Unity XLua Hotfix热更新配置笔记
- dmg文件 linux,Linux通过命令行建立dmg文件的方法
- 动态规划实现生物碱基序列全局匹配
- 2021-06-08STC15F2K602S串口2驱动代码
- code first修改表或字段
- 2022.02.09_Java学习总结_网络编程、正则表达式
- 让我们跳过中年危机,直接聊聊如何善终
- Microsoft Edge:你不能不知道的6个Web开发者工具
- iOS本地存储--c语言方式例子
热门文章
- 【计算机视觉】Histogram of Oriented Gridients(HOG) 方向梯度直方图
- [iOS] stringWithFormat 和 initWithFormat 有何不同?
- Juc00_多线程基础小知识
- python血条游戏代码_手把手Python和pygame游戏开发教程(二)
- 使用站内检索的五大理由
- Java基于JSP野生动物保护网
- CFileDialog使用
- 周卫林谈支付宝大数据技术实践及应用
- 非银机构网络支付新规实施 实名制难在保障信息安全
- chatGPT爆火,什么时候中国能有自己的“ChatGPT“