前言:前两篇转载别人的精彩文章,自己也总结一下吧!

最近又开始用起py,是为什么呢?

自己要做一个文本相似度匹配程序,大致思路就是两个文档,一个是试题,一个是材料,我将试题按每题分割出来,再将每题的内容与材料中进行文本相似度匹配。

所以先首先要做的是将试题把每道题作为一个字符串切割开来,存放到字典中。

程序入下:

# -*- coding:utf-8 -*-
import re #正则模块
f = open('test.txt','r')
s = f.read()
s1 = s.split('工作人员考试')#一级切割,把每套题分割开来
print len(s1)
r1 = re.split('(\d{1,3}\.)',s1[0])#用正则按比如"1.","11.","170."把每套题中的题亩切割开来
for i in r1:print i
f.close() #关闭文件

文本内容:

一、判断題(正确的选A,错误的选B,涂在答题卡的相应位置:每题1分,共20分)
1.    沟通仅仅是两个或两个以上的人之间的意思传送。()
2.    扁平型组织的控制跨度要小些。    ()
3.    企业人员素质普遍偏高,对领导的意图能很好地意会,则适合采取集权管理。()
4.    决策的关键是目标,没有目标就没有决策。    ()
5.    头脑风暴法是为了保证群体决策的创造性,提高决策质量,改善群体决策而发展起来。()
6.    优秀领导者不仅依靠合法的地位所赋予他的职权,而且能以个人的才能、魄力和威望来促使他人努力工作。    ()

输出结果:

Python 2.7.10 (default, May 23 2015, 09:40:32) [MSC v.1500 32 bit (Intel)] on win32
Type "copyright", "credits" or "license()" for more information.
>>> ================================ RESTART ================================
>>>
13
2016年4月16日重庆市綦江区事业单位公开招聘
一、判断題(正确的选A,错误的选B,涂在答题卡的相应位置:每题1分,共20分)1.沟通仅仅是两个或两个以上的人之间的意思传送。()2.扁平型组织的控制跨度要小些。    ()3.企业人员素质普遍偏高,对领导的意图能很好地意会,则适合采取集权管理。()4.决策的关键是目标,没有目标就没有决策。    ()5.头脑风暴法是为了保证群体决策的创造性,提高决策质量,改善群体决策而发展起来。()6.优秀领导者不仅依靠合法的地位所赋予他的职权,而且能以个人的才能、魄力和威望来促使他人努力工作。    ()

最后说明一下:
re.split('(\d{1,3}\.)',s1[0])#这里若去掉括号,则分割符号不会被保留

输出结果如下:

>>> ================================ RESTART ================================
>>>
13
2016年4月16日重庆市綦江区事业单位公开招聘
一、判断題(正确的选A,错误的选B,涂在答题卡的相应位置:每题1分,共20分)沟通仅仅是两个或两个以上的人之间的意思传送。()扁平型组织的控制跨度要小些。    ()企业人员素质普遍偏高,对领导的意图能很好地意会,则适合采取集权管理。()决策的关键是目标,没有目标就没有决策。    ()头脑风暴法是为了保证群体决策的创造性,提高决策质量,改善群体决策而发展起来。()优秀领导者不仅依靠合法的地位所赋予他的职权,而且能以个人的才能、魄力和威望来促使他人努力工作。    ()

转载于:https://www.cnblogs.com/CQ-LQJ/p/6275220.html

前两篇转载别人的精彩文章,自己也总结一下python split的用法吧!相关推荐

  1. Qt工作笔记-对qmake的认识【两篇转载结合】

    关于qmake其实可以使用qmake生成各种类型编译器的文件. 比如下面的这一条命令:qmake -tp vc XXXXXXXX.pro -spec win32-msvcXXXX 如msvc2010 ...

  2. 如何转载别人的CSDN文章

    本文转自:https://blog.csdn.net/qq_31001889/article/details/80322564 起意 看到一篇不错的博客,想转载但是不会(没有转载键),网搜发现没有Ch ...

  3. 基于词频求两篇从文件读入的英文文章的相似度

    相似度 = 公共词汇数 / 总词数 eg: 第一篇:you are a handsome guy.         第二篇:i am a guy.         公共词汇: guy, a      ...

  4. 《暗时间》前两篇的笔记和总结

    第一部分:省时.高效地学习和进步 总论:学习后要进行笔记.反思.总结.讨论,否则你永远只是在他人的思考中洋洋得意着. 1, 暗时间:习惯将问题放入大脑的潜意识思考 2, 习惯于专注所带来的成就感 3, ...

  5. 调息之法-整理的两篇有关养生的小文章

    吕洞宾养生百字铭: 养气忘言守,降心为不为,动静知宗祖,无事更寻谁 真常须应物,应物要不迷,不迷性自住,性住气自回 气回丹自结,壶中配坎离,阴阳生反复,普化一声雷 白云朝顶上,甘露洒须弥,自饮长生酒, ...

  6. 微信订阅号中可以转载别人的文章吗

    分析如下: 微信订阅号中可以转载别人的文章. 但是需要注意的是微信公众订阅号转载别人的原创文章需要注意:一定要需要取得微信公众号原作者授权许可方可转载,不然可能惹上不小的麻烦而且也是对原创的不尊重.具 ...

  7. 两篇励志的文章[转]

    这里两篇文章可能大多数人已经看过了,个人觉得写得确实不错,再收集在一起分享一下: HP大中华区总裁孙振耀退休感言 一.关于工作与生活 我有个有趣的观察,外企公司多的是25-35岁的白领,40岁以上的员 ...

  8. 一篇关于职业选择的好文章(转载)

    此文章来自网络 在担任公司高管的几年间,我面试过数以百计的各个层面的员工,其中最让我感到遗憾的一个现象就是很多人有着非常好的素质,甚至有的还是名校的毕业生,因为不懂得去规划自己的职业,在工作多年后,依 ...

  9. 两篇文章带你走入.NET Core 世界:CentOS+Kestrel+Ngnix 虚拟机先走一遍(一)

    背景: 上一篇:ASP.Net Core on Linux (CentOS7) 共享第三方依赖库部署 已经交待了背景,这篇就省下背景了. 折腾的过程分两步: 第一步是:本机跑虚拟机部署试一下: 第二步 ...

  10. 考上好大学,然后进入IT行业是穷人孩子晋级中产的唯一出路?(好多年不转载别人的文章了,本文的话题是我非常关注的,一直没有写)

    好多年不转载别人的文章了,本文的话题是我非常关注的,一直没有自己去写. 今天看到这篇文章,真是非常地幸运啊. 特别推荐大家学习. 鄙人已经奋斗很多年了,走在"晋级中产"的路上. 没 ...

最新文章

  1. java坐标点对称点的输出,编程java来确定一个对称的单词
  2. python内置的读取文件函数_Python函数篇(3)-内置函数、文件处理(已更新)
  3. java 加载中_Java 6类加载中更快的是什么?
  4. 华为宣布:免费培养2万名Python开发者!
  5. a标签去除下划线css_数据分析师所需的编程技能 : CSS篇
  6. cstring判断包含字符串_Python字符串方法之-解决判断问题
  7. libreoffice_利用Excel或LibreOffice的业务输入进行单元测试约束
  8. 智慧交通day03-车道线检测实现02-1:相机校正
  9. 大话数据结构读书笔记系列(七)图
  10. 无人机在高楼区做倾斜摄影的地籍建模项目报告
  11. 配置两个Hadoop集群Kerberos认证跨域互信(两个集群互通)
  12. IOS Apple Pay
  13. python中rawinput用法_Python 中 input()用法 以及与raw_input() 的区别
  14. 我的世界服务器皮肤怎么用文件夹,我的世界怎么用皮肤文件,怎么通过文件夹更改皮肤...
  15. AX 2012 键盘快捷键
  16. BGP路由聚合原理和实验(华为设备)
  17. Linux Base VIII 压缩和解压缩命令
  18. 微信朋友圈怎么发文字?纯文字动态发布教程
  19. 牛X,网易开源了这个项目后,结果被山寨出了无数个网易云音乐APP,网友炸锅了!...
  20. Windows 7的应用程序兼容性和絮叨的应用程序兼容性助手

热门文章

  1. 如何在html创建js对象,在js中使用createElement创建HTML对象和元素
  2. php7数组写法,数组运算符 - PHP 7 中文文档
  3. java创建hbase多个列族_Spark:DataFrame写HFile (Hbase)一个列族、一个列扩展一个列族、多个列...
  4. 内存表与 InnoDB表对比
  5. 为什么表数据删掉一半,表文件大小不变?
  6. Kafka日志清除策略
  7. 老兵不死:Radionomy正式宣布收购Winamp
  8. mysql练习----SUM and COUNT/zh图(二)
  9. Unity3D 热更新方案(集合各位专家的汇总)
  10. Hbase单机安装及使用hbase shell进行简单操作