弄这个是我在考研期间,找某老师的单词,然后把它弄的pdf版本弄成word版本,再放到墨墨的自定义词典里面,方便自己背。

这里不是有水印之类的吗,转换成word版本,也是有一些水印的,就按 CTRL+A 剪切,再右键,

这样就可以去除水印,不过也导致单词有些会上来。还是要自己手动把word的复制到txt文档上,因为word用python好像有点不理想。

这种繁琐的操作,直接用python解决。

简单分析一下,就可以发现,

因为词典只要英文,我们可以用正则直接把 [ 到中文哪里去掉,或中文就 然后换行。

下面代码


import string
import refile = open("D:/pyHomework/venv/test.txt","r",encoding="utf-8")
lines=[]
for i in file:lines.append(i);
file.close();
print(1)
new=[]cop = re.compile("[\u4e00-\u9fa5]") # 匹配不是中文myRe = re.compile(r'(\[.+?\])(.+?)')# 匹配音标
myRe1=re.compile(r'\^[a-z]+.') #匹配^xx.
myRe2=re.compile(r'[^a-zA-Z0-9 ]') #匹配^xx.
for line in lines:"""例子impressionist [ɪm’preʃənɪst] n. 印象派画家fluctuant [’flʌktjʊənt] adj. 变动的;波动的slump [slʌmp] n.  下降,衰落deliver [dɪ’lɪvə] vt. 递送;传送confidence [’kɒnfɪd(ə)ns] n. 自信victory [’vɪkt(ə)ri] n. 胜利;成功"""line = cop.sub('',line)# 去掉中文"""例子impressionist [ɪm’preʃənɪst] n. fluctuant [’flʌktjʊənt] adj. slump [slʌmp] n.  deliver [dɪ’lɪvə] vt. ;confidence [’kɒnfɪd(ə)ns] n. victory [’vɪkt(ə)ri] n. ;"""line = myRe.sub('^',line)# 去掉英标,替换成^x."""例子impressionist ^ n. fluctuant ^ adj. slump ^ n.  deliver ^ vt. ;confidence ^ n. victory ^ n. ;"""#这里是方便等一下直接查找^xx.替换成某个单一字符。 不能直接把^后面都去掉,因为还有字母,所以需要^x.替换成…^line = myRe1.sub('^',line)"""例子impressionist ^ fluctuant ^ slump ^  deliver ^ ;confidence ^ victory ^ ;"""#可以就可以把非字母非数字的都去掉line = myRe2.sub('\r',line)"""例子impressionist fluctuant slump deliver confidence victory """new.append(line)file_write=open("D:/pyHomework/venv/test2.txt","w",encoding="utf-8")
for var in new:if var!='\r' and var != '\n':file_write.writelines(var)
file_write.close()
print(2)

后面还是有点小问题,太多空行了,我解决不掉,应该是写进去的\r,去除不了多于行

希望各位准研究生多多支持考研英语颉斌斌老师,为颉斌斌老师打广告。

我也不知道给不给复制,我放个github的地址,你们要就下就行了

du-lian/Vocabulary: 弄这个是我在考研期间,找某老师的单词,然后把它弄的pdf版本弄成word版本,再放到墨墨的自定义词典里面,方便自己背。 (github.com)

用python 创建英语自定义词典相关推荐

  1. python制作英语小词典_如何用python(django)创建英语词典应用程序?

    我不知道你在说什么功能.如果您的意思是"从数据库中记录的词汇中搜索关键字",那么python dictionnary不是一个可能的解决方案,因为您必须反序列化整个数据库才能进行搜索 ...

  2. python制作英语小词典_Python 爬虫:自制简易词典

    作为一个程序员,会经常查阅一些技术文档和技术网站,很多都是英文的,遇到不认识的词就要查,词典的使用频率也颇高,既然是程序员,高逼格的方式当然是做一个词典,此为动机. 运行平台: Windows Pyt ...

  3. python制作英语小词典_Python爬虫之自制英汉字典

    最近在微信公众号中看到有人用Python做了一个爬虫,可以将输入的英语单词翻译成中文,或者把中文词语翻译成英语单词.笔者看到了,觉得还蛮有意思的,因此,决定自己也写一个玩玩~~ 首先我们的爬虫要能将英 ...

  4. 如何使用Python创建一个自定义视频播放器

    目录 1.安装vlc的64位版本. 2.安装python的vlc模块. 3.编写如下代码,包含了播放,暂停,停止.音量控制功能. 4.来看一看运行结果. 5.如果遇到播放不了的问题,解决方式如下: 这 ...

  5. python 英语词典_使用Python的英语词典应用程序

    python 英语词典 Module used: 使用的模块: In this script, we will use the JSON module because we will use a JS ...

  6. python使用结巴分词(jieba)创建自己的词典/词库

    原文地址:https://ptorch.com/news/204.html 为什么需要在python使用结巴分词(jieba)创建自己的词典/词库,因为很多时候分词给我们的结果了能刚好相反,如:不回家 ...

  7. reddit_如何使用Python创建自定义Reddit通知系统

    reddit by Kelsey Wang 王凯西 如何使用Python创建自定义Reddit通知系统 (How to make a custom Reddit notification system ...

  8. python英语查询词典-随堂作业

    python学习日记 学python时的作业,磕磕碰碰中,歪歪扭扭地写出来了,中间遇到很多问题,思路混乱 题目如下 制作英文学习词典.编写程序制作英文学习词典,词典有3个基本功能:添加.查询和退出.程 ...

  9. dataflow_Apache Beam,Google Cloud Dataflow和使用Python创建自定义模板

    dataflow 阿帕奇光束 (Apache Beam) Apache Beam(Batch + Stream) is a unified programming model that defines ...

  10. python制作英语字典_Pyqt5实现英文学习词典

    运用Python语言编写程序制作英文学习词典,词典有4个基本功能:添加.查询.删除和退出.程序读取源文件路径下的txt格式词典文件,若没有就创建一个.词典文件存储方式为"英文单词 中文单词& ...

最新文章

  1. 实现对学生表的删除操作
  2. selenium之简单使用
  3. Spark的RDD持久化
  4. 成功解决Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX AVX2
  5. 删除表空间联带数据文件
  6. 算法训练 字符串编辑 java
  7. Ospf在广播网络中建立邻居关系的详细过程
  8. SaaS,PaaS,IaaS都是什么鬼
  9. 串口光猫应用领域及技术参数详解
  10. SQL-6查找所有员工入职时候的薪水情况,给出emp_no以及salary, 并按照emp_no进行逆序...
  11. Android native进程间通信实例-binder篇之——解决实际问题inputreader内建类清楚缓存...
  12. IT运维人员该学习哪些技术
  13. Keyboard Control
  14. Atitit json序列化工具 JsonParserAtiver 参考 Atitit json序列化原理 序列化是将一个对象变成json格式的字符串,而反序列化是将json格式的字符串变
  15. java 数据周期预测_预测算法 | Holt Winter季节性指数平滑法 附JAVA代码
  16. PaddleNLP实战——LIC2021事件抽取任务基线(附代码)
  17. 服务器网卡支持25G,如何使用网卡连接10G/25G/40G服务器与交换机?
  18. js实现正则表达式匹配
  19. 高效 PyCharm 使用技巧
  20. C3P0的三种使用方法

热门文章

  1. Android对接蓝牙打印机
  2. Windows 使用 Detours 进行 HOOK
  3. 【计算机网络】Linux系统连接吉林大学校园网
  4. Linux网络编程--recv函数返回值详解
  5. 移动互联网之路——Axure RP 8.0网站与APP原型设计从入门到精通
  6. 计算几何(一) by 邓俊辉老师
  7. java毕业设计德云社票务系统Mybatis+系统+数据库+调试部署
  8. matlab中uigetfile读取图片,MATLAB如何读取图片? 如何用Matlab读入并
  9. 新手练字又快又好的方法
  10. 反转链表的Java实现