笔者在读《岛上书店》这本书的时候,发现书中有许多作者提到的各类书籍,当时就有种冲动把所有书名提取成为一个书单,作为以后书目的参考(我知道,以我的...咳咳“尿性”,提取出来也不会好好看...),但还是希望自己能动手做一下。话不多说直接上代码

------------------------------------------------------------------------------------------------------------------------------------------------------------------------

算法一(在读书的时候笔者还在学C,没有接触python,便将想法和以为大佬朋友交流,随后得出以下算法)

import osfile_in=open("C:\\Users\\Lin_C\\Desktop\\岛上书店_python\\daoshangshudian.txt")
st=set([])
try:for line in file_in:nlen=len(line)for i in range(0,nlen):if line[i]=="《":j=iwhile True:i+=1if(i>=nlen or line[i]=="》"):breakif(i+1<nlen and line[i]=="》"): st.add(line[j:i+1])
finally:file_in.close()
for item in st:print(item)

下面是执行结果

------------------------------------------------------------------------------------------------------------------------------------------------------------------------

算法二:正则表达式(以下精简版本是笔者在暑假啃python爬虫的时候,想到之前的想法可以翻新以下,于是“旧瓶装新酒”,得到以下的方法)

#coding=gbk
import os
import rest=set([])
with open("Y:\python_work\数据\daoshangshudian.txt") as f_object:content = f_object.read()results = re.findall('《[^》]+》',content)for result in results:st.add(result)for item in st:print(item)

运行结果如下

注意点:1、第一行的#coding=gbk不可或缺,不然编码报错。2、两种算法每次输出都不按从头至尾的顺序输出

Python提取《岛上书店》书名相关推荐

  1. Python提取岛上书店书中所有书名后做成词云

    通过笔者Python提取<岛上书店>书名这一文章内容中的算法二,我们成功地把<岛上书店>中所有书名提取出来,并保存到同目录下的output.txt文件中.如果单单将这个发到朋友 ...

  2. 书名: 岛上书店 简评:一个书店将各个人物的生活事业联系起来。

    经典句子 因为从心底害怕自己不值得被爱,我们独来独往,然而就是因为独来独往,才让我们以为自己不值得被爱.有一天,你不知道是什么时候,你会驱车上路.有一天你不知道什么时候,你会遇上他(她).你会被爱,因 ...

  3. python取特定年份的数据_python,_怎样用python提取不同股票csv里特定时间段的数据,python - phpStudy...

    怎样用python提取不同股票csv里特定时间段的数据 我有几千只股票的csv数据,需要算所有股票在特定时间段内的收益率. 但是数据里的日期信息并不统一,有的csv到2011年就没有了之后的信息了,有 ...

  4. 用Python提取解析pdf文档中内容

    用Python提取解析pdf文档中内容 文章目录: 参考: 1.https://blog.csdn.net/tmaczt/article/details/82876018 # Tika库 2.http ...

  5. 怎样用Python提取信息呢?分享这3个Python PDF库

    很多时候我们都会用Python去取数据文件,这些文件中很多都是PDF格式,有些PDF文件解析的时候只能解析一部分内容出来,大段的文字没有解析出来,那怎么样才能用Python提取这些信息呢? 下面小千就 ...

  6. [知识图谱实战篇] 三.Python提取JSON数据、HTML+D3构建基本可视化布局

    前面作者讲解了很多知识图谱原理知识,包括知识图谱相关技术.Neo4j绘制关系图谱等,但仍缺少一个系统全面的实例.为了加深自己对知识图谱构建的认识,为后续创建贵州旅游知识图谱打下基础,作者深入学习了张宏 ...

  7. python 替换array中的值_利用Python提取视频中的字幕(文字识别)

    我的CSDN博客id:qq_39783601,昵称是糖潮丽子~辣丽 从今天开始我会陆续将数据分析师相关的知识点分享在这里,包括Python.机器学习.数据库等等. 今天来分享一个Python小项目! ...

  8. python提取html正文为txt,python 提取html文本的方法

    假设我们需要从各种网页中提取全文,并且要剥离所有HTML标记.通常,默认解决方案是使用BeautifulSoup软件包中的get_text方法,该方法内部使用lxml.这是一个经过充分测试的解决方案, ...

  9. python提取数据段_python提取数据段 python数据分析

    如何在python中用slice分段取数据? 执行以下操作:&gt&gt a=range(6)&gt&gt a[0, 1, 2, 3, 4,5]&gt& ...

最新文章

  1. docker load 出错 open /var/lib/docker/tmp/docker-import-837327978/bin/json: no such file or directory
  2. Python命令行可视化库
  3. oracle共享时监听,Oracle监听---共享连接参数配置介绍
  4. 第二十三讲 狄拉克函数(冲激函数)(补充)
  5. flutter 输入框限制输入 数字、小数
  6. php mysql 连接类_深入理解php的MySQL连接类
  7. 开发易于移植的J2ME游戏
  8. anaconda 换源_Anaconda下安装tensorflow1.15过程记录
  9. Fiddler工具的使用与手机app数据抓包
  10. 如何使用EA画ER图?
  11. 计算机网络ospf配置命令,华为OSPF协议基本配置 -电脑资料
  12. 辨别 优盘 真假 [金士顿]
  13. 5-IP地址、端口、DNS服务器
  14. Visualforce 标签(一)
  15. 1010 -- 青蛙的约会
  16. 【Python】python脚本实例
  17. 千兆网络PHY芯片 RTL8211E的实践应用(原理图及PCB实现)
  18. 利用python的turtle库绘制玫瑰的步骤_用python turtle画玫瑰
  19. 「机械工程」力矩,转矩,扭矩的理解
  20. 校园公交车管理系统设计

热门文章

  1. 华中科技大学计算机组成计算机数据表示实验(hust)平台_【2019更新版】西北工业大学计算机软件考研信息汇总...
  2. 教你如何制作APP 赚钱
  3. 知识推理————相关工具介绍(你值得了解)
  4. 腾讯吃鸡 android,腾讯吃鸡安卓版
  5. css给图片底部加阴影,使用CSS给图片添加阴影的方法
  6. 小程序推广多平台推广整合的绝招
  7. 算法训练营 训练 骑士移动(队列)
  8. 怎样理解python中的GIL?
  9. M3DGIS三维虚拟现实数字沙盘电子沙盘大数据人工智能开发视频教程第2课
  10. instagram发布工具_如何从您的计算机发布到Instagram