由于朋友需要做文本分析,前提是要将文本中的名词和动词剔除掉,但没有现成的名词和动词的txt格式的词典。于是找来了一个英汉词典,根据每一行出现的adj、adv、n、prep等,使用正则表达式匹配需要的词性,并将其追加写入到txt文件中。

建议大家使用python3.5,3的优点是避免了很多编码问题。3代表着python的未来,大家还是应该多多的对未来投资。

比如,我要生成形容词的词典。步骤:

1、应先使用正则表达式,匹配含有‘adj’的行字符串,返回的是list。

2、获得adj结尾处的索引值

3、对行字符串进行切片处理,获得索引值后的全部字符

4、如果获得的字符串有 ‘,’ 那再用正则表达式,匹配中文字符,获得的是中文的list

代码实现如下:

import re

strs = open(r'C:/Users/myl/Desktop/SegChineseToWords/英汉词典TXT格式.txt','r',encoding='utf-8').readlines()

for str in strs:

# 形容词典

adj_re = re.search('adj', str)

if adj_re != None:

adj_num = adj_re.end()+1

adj_str = str[adj_num:]

adj_list = re.findall("[\u4e00-\u9fa5]+", adj_str)

for ele_adj in adj_list:

ele_adj = ele_adj + '\n'

with open(r'C:/Users/myl/Desktop/SegChineseToWords/Dict/adj_dict.txt', 'a+',encoding='utf-8') as f:

f.write(ele_adj)

实现的效果如下图:

本代码中用到 re模块 的 research方法 ,具体大家去百度下,这个方法的相关知识。

现在附上 练习材料和最终代码,大家可以比照着练习下正则。

欢迎关注公众号:大邓带你玩转python

----------------------------------作者:邓旭东

欢迎关注 简书账号 邓旭东HIT

知乎: 邓旭东HIT

微信公众号: 大邓带你玩转python

大家也可以加小编微信:tszhihu (备注:Python),拉大家到 Python爱好者社区 微信群,可以跟邓旭东、崔庆才等老师互相交流。谢谢

大家记得关注我,明天晚上 崔庆才老师教你玩 Python爬虫知乎用户信息,记得关注。内容:

1. 分析知乎Ajax请求及爬取逻辑

2. 用Scrapy实现递归爬取

3. 爬取结果存储到MongoDB 报名地址:爬取知乎所有用户详细信息 。后面到 Live也弄几场,感谢关注。

python制作词典_我的词典我做主!python3.5生成自己的词性词典相关推荐

  1. 利用python制作拼图_利用python制作拼图小游戏的全过程

    开发工具 Python版本:3.6.4 相关模块: pygame模块: 以及一些Python自带的模块 关注公众号:Python学习指南,回复"拼图"即可获取源码 环境搭建 安装P ...

  2. python制作鬼畜_用Python分析本山大叔鬼畜视频为啥这么火

    原标题:用Python分析本山大叔鬼畜视频为啥这么火 ♚ cxa,有着丰富的爬虫工作经验,公众号Python学习开发,擅长各种爬虫技术,熟悉大规模爬虫开发.热爱并喜欢钻研python. 改革春风吹满地 ...

  3. python制作统计图_刻意练习11:Python描述统计、简单统计图形

    学习计划 MyPlan11 主题:Python描述统计.简单统计图形 时间:8.5-8.11周内完成 参考资料:新书<谁说菜鸟不会数据分析python篇> 各位星友们,在这个星球里每个人都 ...

  4. python制作计算机程序_用 Python 开发实用程序 – 计算器

    一段时间前,自己制作了一个库 "sui-math".这其实是 math 的翻版.做完后,我又想到,python 既然可以轻易的完成任何的数学计算,何不用 python 开发一个小程 ...

  5. 如何用python制作动画_如何基于Python Matplotlib实现网格动画

    -1- 如果你对本文的代码感兴趣,可以去 Github (文末提供)里查看.第一次运行的时候会报一个错误(还没找到解决办法),不过只要再运行一次就正常了. 这篇文章虽然不是篇典型的数据科学类文章,不过 ...

  6. python制作界面_详解python做UI界面的方法

    详解python做UI界面的方法 更新时间:2019年02月27日 14:44:34 投稿:laozhang 在本文里我们给大家整理了关于python做UI界面的方法和具体步骤,对此有需要的朋友们可以 ...

  7. python制作相册_《自拍教程73》Python 自动生成相册文件夹

    这里将告诉您<自拍教程73>Python 自动生成相册文件夹,具体操作过程:案例故事: 接Python mediainfo批量重命名图片文件,测试图片是批量重命名好了, 但是将测试图片放于 ...

  8. python 制作动画片_分享7个好用的动画制作软件,学会它,人人可以成为动画大师...

    发布时间:2020年06月08日 分享7个好用的动画制作软件,学会它,人人可以成为动画大师: 如果需要创建动画视频,Windows会提供大量动画制作软件.动画制作软件主要分为2D和3D二种类型.3D应 ...

  9. 用python制作贺卡_使用Python创作自己的圣诞节动图贺卡,制作简单即刻生成

    引言 圣诞节就在眼前,怎样诚挚表达自己的心意呢,自己动手做一个定制动图贺卡,写上定制的祈福语,收到贺卡的人一定很开心. 干货 废话不多说,直接上源代码.Python 3环境直接运行,无任何依赖. 修改 ...

最新文章

  1. Java多线程面试准备:聊聊Executor框架
  2. CENTOS elasticsearch plugin install:Failed: SSLException[java.security.ProviderException,解决
  3. C# 9.0 正式发布了(C# 9.0 on the record)
  4. [Java基础]ListIterator
  5. 帖子回复——无限级分类
  6. 文件fluent_Win10 中解决FLUENT中UDF 的方法
  7. Ext学习笔记02 - 构造方法,类继承,类实例方法重写
  8. Bootstrap采样方法的python实现
  9. tab+easyui datagrid无法正常显示
  10. 微信支付小程序开发php,关于微信小程序进行微信支付的步骤
  11. c语言流程图各个框的作用,C语言流程图的三种基本结构
  12. Spring boot如何集成Redis(四)
  13. 鲲鹏devkit开发套件——编译调试工具介绍
  14. Linux实训项目二 用户和组的管理
  15. uniapp组件-Card卡片
  16. 月半弯,亦真亦幻亦婉约
  17. StudyFlutter——我的第一个APP
  18. VT-x/AMD-V 硬件加速在您的系统中不可用。您的 64-位虚拟机将无法检测到 64-位处理器,从而无法启动。
  19. 【机器学习】聚类算法 kmeans
  20. laravel用户详情及封禁和启用用户api

热门文章

  1. 获取当前鼠标的位置以及组件的位置
  2. js基本包装类型和引用类型
  3. JS中apply和call的应用和区别
  4. JS里面的懒加载(lazyload)
  5. 你敢在post和get上刁难我,就别怪我装逼了
  6. CSS3与页面布局学习笔记(三)——BFC、定位、浮动、7种垂直居中方法
  7. 巧用CSS实现分隔线
  8. 借百度爸爸下蛋的好看搜索框
  9. margin赋值为负值的几种效果(负值像素,负值百分数)
  10. mpvue tabBar设定 app.json