利用BS爬取单词音标
如何为英语单词批量添加音标?一个个的上网查?早OUT了吧!
利用PYTHON中的beautiful soup模块那就小菜一碟了。
# -*-coding:utf-8 -*-
import requests
from bs4 import BeautifulSoup
f = open('words.txt', encoding='utf-8') # 打开当前文件位置下的文本文档,每行一个英文单词
fw = open('./result.txt', 'a', encoding='utf-8')
index = 0
for word in f.readlines():index = index+1url = "https://www.oxfordlearnersdictionaries.com/definition/english/" + word.strip() # 待查单词的牛津词典网页print("当前正在查第{}个单词:".format(index), word)wbdata = requests.get(url, headers={'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.75 Safari/537.36'}).text # 获取相应网页代码soup = BeautifulSoup(wbdata, 'html.parser') # BS解析代码news_titles = soup.select('span[class="phon"]') # 选取其中的发音代码段,结果为英美两种发音,所以类型为列表print(word.strip(), news_titles[0].text, sep='\t', file=fw) # 每行的英文单词后带有换行标志,所以strip清除掉,选取一个发音的文本,并写到result文本中
fw.close()
f.close()
利用BS爬取单词音标相关推荐
- 利用BS爬取逐浪网多本小说
(更新一下软件,手贱的没有保存原来的文件...) 学习BS之后,发现确实比正则有点强...但是在一些时候,他们两个同时运用效果更好.在爬取小说时候就体现出来了,对于BS来说直接调用文字标签就好,别的不 ...
- bs4主要知识点介绍及实例解析---利用bs4爬取伯乐在线(分别存储在数据库和xls表中)
bs4主要知识点介绍及实例讲解 bs4 是第三方解析html数据的包 from bs4 import BeautifulSoup lxml 解析读取html的第三方解释器,解析速度快,底层通过c实现 ...
- 技术图文:如何利用C#爬取CSDN的博客文章?
背景 大家有没有这样的体验,在 CSDN 上发现某个博主有很多干货文章,我们就想拿到这个博主以往文章的列表,在需要的时候进行查询和浏览. 如果从 CSDN 网站上用复制粘贴的方式来建立这个列表,一个是 ...
- 技术图文:如何利用 C# 爬取 ONE 的交易数据?
投资一个金融产品,最基本的就是拿到这个金融产品的交易数据,对这些数据进行可视化来判断趋势.去年,我在听 李笑来 讲区块链的课程上知道了 BigOne 这个由 INB 投资的交易所,而 ONE 是 Bi ...
- 如何利用 C# 爬取BigOne交易所的公告!
在当今这个时代,投资可以说是每个人都应该学会的一项技能.拥有一些数字货币是程序员的信仰!交易所是进入数字货币世界最方便的一扇门,今天我就带着大家爬取 Bigone 交易所的公告数据. 首先,我们来看一 ...
- 如何利用 C# 爬取 One 持有者返利数据!
去年,10月份写过一篇图文 「One」的投资价值分析,多半年过去了,回头看看当时的判断还是合理的. 投资这种事情需要有自己的策略,更需要理性.任何决策都需要以数据作为判断的基础,哪么是否还继续持有 O ...
- 如何利用 C# 爬取Gate.io交易所的公告!
对于大部分程序员来说,都希望自己或多或少拥有一些比特币(BTC).获取 BTC 的途径除了挖矿计算 Hash 值之外,就是去交易所购买了. 由于 BTC 的价格波动非常剧烈,入手 BTC 的时机就显得 ...
- 如何利用 C# 爬取带 Token 验证的网站数据?
在对文本数据的情感分析中,基于情感词典的方法是最简单也是最常用的一种了. 它的大体思路如下: 对文档分词,找出文档中的情感词.否定词以及程度副词,然后判断每个情感词之前是否有否定词及程度副词,将它之前 ...
- 如何利用 C# 爬取「当当 - 计算机与互联网图书销量榜」!
前段时间我们介绍了如何利用 C# 语言来爬取"京东 - 计算机与互联网图书销量榜" 网页的方法,通过该方法,我们能够获得"京东"的图书销售排行榜数据. 可是,读 ...
- 如何利用 C# 爬取「猫眼电影专业版:票房」数据!
在现代生活中,看电影已经成为大家的一种休闲方式. 前几天,我们介绍了 如何利用 C# 爬取「猫眼电影:热映口碑榜」及对应影片信息!,通过这份"热映口碑"榜单,我们可以看到大家对当前 ...
最新文章
- MySQL 到PostgreSQL 的数据迁移工具
- [zz]Linux操作系统下三种配置环境变量的方法
- 第一百三十二期:MySQL系列:一句SQL,MySQL是怎么工作的?
- ImageJ Nikon_科研论文作图之ImageJ
- django 模板mysql_59 Django基础三件套 , 模板{{}}语言 , 程序连mysql Django项目app Django中ORM的使用...
- 【转载】浅谈嵌入式MCU开发中的三个常见误区
- 从零开始学Android自定义View之动画系列——属性动画(2)
- win7虚拟机镜像制作
- 保险公司智能运营系统文档
- 学会提问-批判性思维指南运用
- 10负3次方计算机语言,10的负3次方等于多少?
- 学了计算机很迷茫怎么办?计算机大三学生怎么找实习工作?
- 5G网络切片安全隔离机制与应用
- Android Startup实现分析
- 纯真IP/ZXinc_IPv6数据库镜像及MySQL脚本更新同步更新 for Python 3.x
- 有感于男人们的友谊和女人们的友谊
- 好用的制造业erp系统软件有哪些?
- php存在文件夹_PHP创建文件夹 PHP判断文件夹文件是否存在
- pqmagic 8.0中文版—硬盘分区魔术师
- 如何更改JupyterLab Jupyter Notebook的工作路径