如何为英语单词批量添加音标?一个个的上网查?早OUT了吧!

利用PYTHON中的beautiful soup模块那就小菜一碟了。

# -*-coding:utf-8 -*-
import requests
from bs4 import BeautifulSoup
f = open('words.txt', encoding='utf-8')  # 打开当前文件位置下的文本文档,每行一个英文单词
fw = open('./result.txt', 'a', encoding='utf-8')
index = 0
for word in f.readlines():index = index+1url = "https://www.oxfordlearnersdictionaries.com/definition/english/" + word.strip()  # 待查单词的牛津词典网页print("当前正在查第{}个单词:".format(index), word)wbdata = requests.get(url, headers={'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.75 Safari/537.36'}).text  # 获取相应网页代码soup = BeautifulSoup(wbdata, 'html.parser')  # BS解析代码news_titles = soup.select('span[class="phon"]')  # 选取其中的发音代码段,结果为英美两种发音,所以类型为列表print(word.strip(), news_titles[0].text, sep='\t', file=fw)  # 每行的英文单词后带有换行标志,所以strip清除掉,选取一个发音的文本,并写到result文本中
fw.close()
f.close()

利用BS爬取单词音标相关推荐

  1. 利用BS爬取逐浪网多本小说

    (更新一下软件,手贱的没有保存原来的文件...) 学习BS之后,发现确实比正则有点强...但是在一些时候,他们两个同时运用效果更好.在爬取小说时候就体现出来了,对于BS来说直接调用文字标签就好,别的不 ...

  2. bs4主要知识点介绍及实例解析---利用bs4爬取伯乐在线(分别存储在数据库和xls表中)

    bs4主要知识点介绍及实例讲解 bs4 是第三方解析html数据的包 from bs4 import BeautifulSoup lxml 解析读取html的第三方解释器,解析速度快,底层通过c实现 ...

  3. 技术图文:如何利用C#爬取CSDN的博客文章?

    背景 大家有没有这样的体验,在 CSDN 上发现某个博主有很多干货文章,我们就想拿到这个博主以往文章的列表,在需要的时候进行查询和浏览. 如果从 CSDN 网站上用复制粘贴的方式来建立这个列表,一个是 ...

  4. 技术图文:如何利用 C# 爬取 ONE 的交易数据?

    投资一个金融产品,最基本的就是拿到这个金融产品的交易数据,对这些数据进行可视化来判断趋势.去年,我在听 李笑来 讲区块链的课程上知道了 BigOne 这个由 INB 投资的交易所,而 ONE 是 Bi ...

  5. 如何利用 C# 爬取BigOne交易所的公告!

    在当今这个时代,投资可以说是每个人都应该学会的一项技能.拥有一些数字货币是程序员的信仰!交易所是进入数字货币世界最方便的一扇门,今天我就带着大家爬取 Bigone 交易所的公告数据. 首先,我们来看一 ...

  6. 如何利用 C# 爬取 One 持有者返利数据!

    去年,10月份写过一篇图文 「One」的投资价值分析,多半年过去了,回头看看当时的判断还是合理的. 投资这种事情需要有自己的策略,更需要理性.任何决策都需要以数据作为判断的基础,哪么是否还继续持有 O ...

  7. 如何利用 C# 爬取Gate.io交易所的公告!

    对于大部分程序员来说,都希望自己或多或少拥有一些比特币(BTC).获取 BTC 的途径除了挖矿计算 Hash 值之外,就是去交易所购买了. 由于 BTC 的价格波动非常剧烈,入手 BTC 的时机就显得 ...

  8. 如何利用 C# 爬取带 Token 验证的网站数据?

    在对文本数据的情感分析中,基于情感词典的方法是最简单也是最常用的一种了. 它的大体思路如下: 对文档分词,找出文档中的情感词.否定词以及程度副词,然后判断每个情感词之前是否有否定词及程度副词,将它之前 ...

  9. 如何利用 C# 爬取「当当 - 计算机与互联网图书销量榜」!

    前段时间我们介绍了如何利用 C# 语言来爬取"京东 - 计算机与互联网图书销量榜" 网页的方法,通过该方法,我们能够获得"京东"的图书销售排行榜数据. 可是,读 ...

  10. 如何利用 C# 爬取「猫眼电影专业版:票房」数据!

    在现代生活中,看电影已经成为大家的一种休闲方式. 前几天,我们介绍了 如何利用 C# 爬取「猫眼电影:热映口碑榜」及对应影片信息!,通过这份"热映口碑"榜单,我们可以看到大家对当前 ...

最新文章

  1. MySQL 到PostgreSQL 的数据迁移工具
  2. [zz]Linux操作系统下三种配置环境变量的方法
  3. 第一百三十二期:MySQL系列:一句SQL,MySQL是怎么工作的?
  4. ImageJ Nikon_科研论文作图之ImageJ
  5. django 模板mysql_59 Django基础三件套 , 模板{{}}语言 , 程序连mysql Django项目app Django中ORM的使用...
  6. 【转载】浅谈嵌入式MCU开发中的三个常见误区
  7. 从零开始学Android自定义View之动画系列——属性动画(2)
  8. win7虚拟机镜像制作
  9. 保险公司智能运营系统文档
  10. 学会提问-批判性思维指南运用
  11. 10负3次方计算机语言,10的负3次方等于多少?
  12. 学了计算机很迷茫怎么办?计算机大三学生怎么找实习工作?
  13. 5G网络切片安全隔离机制与应用
  14. Android Startup实现分析
  15. 纯真IP/ZXinc_IPv6数据库镜像及MySQL脚本更新同步更新 for Python 3.x
  16. 有感于男人们的友谊和女人们的友谊
  17. 好用的制造业erp系统软件有哪些?
  18. php存在文件夹_PHP创建文件夹 PHP判断文件夹文件是否存在
  19. pqmagic 8.0中文版—硬盘分区魔术师
  20. 如何更改JupyterLab Jupyter Notebook的工作路径

热门文章

  1. 能学习计算机考证的手机软件有那些?推荐
  2. js实现的单机双人象棋演示及其分析
  3. 数值计算值第四期:解线性方程组的扰动分析
  4. 简单的木马编写之服务端篇
  5. HTML姓名转为拼音,EXCEL如何自动将姓名转换为拼音?
  6. 无法从服务器获取视频文件,视频从云服务器获取视频文件
  7. win10安装secureCRT8.1.4破解
  8. 运放专题:电压电流转换
  9. Windows平台实现真实时毫秒级4K H264/H265直播技术(硬编码技术方案)
  10. java oracle sqlldr,oracle sqlldr