要考英语了, 单词一大堆, 索性就用Python自动到网上找单词的中文意思了~.
目前只是盲目的摘下来而已.

写的过程中,终于知道编码问题是多么的严重了. 下次一定要用chardet这个库了,方便快捷...
# http://dict.youdao.com/search?q=hello&tab=chn&keyfrom=dict.result can' use it , be-
# cause it is python's bug
import urllib
from BeautifulSoup import BeautifulSoup
import sys
global    file

def getWebContent(url, word):
        html = urllib.urlopen(url).read()
        #html = html.decode("gb2312","ignore").encode("utf-8","ignore")
        html = unicode(html,"gb2312","ignore").encode("utf-8","ignore")
        soup = BeautifulSoup(html)
    
        #filter 1
        data = str(soup.find("div", {"class":"explain"}))
        #strContent = data.renderContents()+"\n" # default the string s is coded with ASCII
                                                                                                     # but the original is UTF-8, because the
                                                                                                     # beautifulSoup use it...
        #fileter 2
        soup = BeautifulSoup(data)
        # beautifulsoup generator http://www.crummy.com/software/BeautifulSoup/documentation.zh.html#Generators
        outtext=''.join([element    for element in soup.recursiveChildGenerator() if isinstance(element,unicode)])
        #make some rendering
        for item in range(1,10):
                outtext=outtext.replace(str(item),"\n%s" % str(item))
        outtext=outtext.replace("    ","\n")
        outtext =word +":\n" +outtext +"\n"
        file.write(outtext)
        print outtext.decode("utf-8").encode("gbk")

def word_FromFile():
        file = open("F:/Whu/EnghlishWords.txt","r")
        for word in file.readlines():
                print isinstance(word, unicode)
                print word.decode("utf-8")

                #must be carefully!!!
                #because we use the utf-8 to store the Chinese words in notepad
                #it will add another 3 words to mark
                #     if file[:3] == codes.BOM_UTF8;
                #            data = data[3:]
                #            print data.decode("utf-8")
                
                url = "http://dict.baidu.com/s?wd=%s" % word
                getWebContent(url, word)
if __name__ == '__main__':
        reload(sys)
        sys.setdefaultencoding('utf-8')
        file = open("F:/Whu/EnghlishWords_translate.txt",'w')
        word_FromFile()
        file.flush()
        file.close()

转载于:https://blog.51cto.com/tuoxie174/476486

Python英语单词查询相关推荐

  1. python英语单词-干货|3天教你掌握Python必备常用英语词汇

    对于一个英语不太好的童鞋来说,学习Python的过程中常常会遇到各种问题,虽然现在各种翻译器很厉害,但是也不如把单词记在脑海里省时省事,今天小编针对学习Python英语基础不太好的童鞋,整理了一套必备 ...

  2. 计算机毕业设计(附源码)python英语单词记忆系统

    项目运行 环境配置: Pychram社区版+ python3.7.7 + Mysql5.7 + HBuilderX+list pip+Navicat11+Django+nodejs. 项目技术: dj ...

  3. python英语单词 扇贝英语安卓下载_扇贝单词app下载-扇贝单词英语版 安卓版v3.6.503-pc6手机下载...

    扇贝单词app是一款可以和小伙伴一起学英语背单词的app,扇贝单词英语版属于千万用户的背单词神器,让你的英语水平突飞猛进,你确定不要来试一试吗? 软件介绍 扇贝单词英语版是一款很实用的英语单词学习软件 ...

  4. python英语单词 扇贝英语安卓下载_扇贝单词英语版

    扇贝单词英语版是一款很实用的英语单词学习软件,扇贝单词英语版的主要功能是为用户提供效率更高的方法去记单词.学习英语.如果你不想一个人枯燥地学习,那么扇贝单词的英语社区欢迎你,每天都有几十万用户共同学习 ...

  5. python英语单词大全-使用Python进行英文单词分割

    由于在一些场景中,所有的字母都连在了一起,所以我们需要将字母分割成单词的形式. 1. 安装pip install -U symspellpy 2. 下载词典 curl -LJO https://raw ...

  6. python英语单词库-python-data-英语单词

    In this video we'll be talking about data analysis and the scenario in which we'll be playing the da ...

  7. python快递分拣小程序_python英语单词测试小程序代码实例

    这篇文章主要简介了python英语单词测试小程序代码实例,文中通过示例代码简介的非常具体,对大家的学习或者工作具有一定的参考学习网上卖,需要的朋友可以学习下 爬取了扇贝英语网,并制作了一个英语单词测试 ...

  8. 还在用背单词App?使用Python开发英语单词自测工具,助你逆袭单词王!

    学英语广告 最近也许是刚开学的原因,不管是公众号,还是刷抖音,导出都能看到关于学英语.背单词的广告. 不知道现在学生们背单词买的什么辅导材料.反正我们上学那会,<星火阅读>特别的火.记得当 ...

  9. python单词软件哪个好_还在用背单词App?使用Python开发英语单词自测工具,助你逆袭单词王!...

    学英语广告 最近也许是刚开学的原因,不管是公众号,还是刷抖音,导出都能看到关于学英语.背单词的广告. 不知道现在学生们背单词买的什么辅导材料.反正我们上学那会,<星火阅读>特别的火.记得当 ...

  10. python测试代码_python英语单词测试小程序代码实例

    这篇文章主要介绍了python英语单词测试小程序代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 爬取了扇贝英语网,并制作了一个英语单词测试的 ...

最新文章

  1. python环境下,执行系统命令方法
  2. Linux源码安装步骤
  3. C语言 防止头文件被多次引用
  4. 安装php no permision,php安装过程中的No package ‘xxx’ found问题
  5. c标签判断true false jsp_Java学习知识点:小白如何掌握JSP技术?
  6. api 二次 开发 禅道_VBA SolidWorks 二次开发 API ---从宏开始
  7. 华为p7刷android go,华为首款Android GO手机发布 1G内存也流畅
  8. Linux-系统性能指标
  9. linux tcp 缓冲区 参数,Linux TCP 缓冲区参数调优
  10. 使用Tika进行文本抽取
  11. java.lang.NoSuchMethodError: org.jaxen.dom4j.DocumentNavigator.getInstance()【可能的解决办法】
  12. fanuc换刀宏程序详解_FANUC宏程序大全+实例讲解
  13. android 自动调节音量,Android 音量调节
  14. 代码实现判断主机字节序(大端 or小端 )-- 面试题
  15. Python学习笔记:使用PIL批量合成jpg+png图片,用于水印、合并图片,生成YOLO数据集+标注数据等等
  16. 常见的纸张及相片尺寸
  17. 华为 HarmonyOS 的野心比你想象中更大,android小游戏源代码
  18. 题目描述 假设在周末舞会上,男士们和女士们进入舞厅时,各自排成一队。跳舞开始时,依次从男队和女队的队头上各出一人配成舞伴。规定每个舞曲能有一对跳舞者。若两队初始人数不相同,则较长的那一队中未配对者等待
  19. 用VB6亲身开发一个Windows软件(一)小引
  20. 微信小程序——消息推送参数

热门文章

  1. 【交易技术前沿】低时延基础设施杂谈
  2. Rust : ? 操作符(待续)
  3. (转)智能投顾面临的法律合规问题及国际监管经验
  4. Rust: HashMap的用法及其它
  5. Julia: 关于下载库时WinRPM的Bug
  6. 凌云一周看点 | 什么是云原生数据库;因云而生的云原生网络;大型团队如何从0到1自建SRE体系;空间数据模型之从CAD到BIM...
  7. 【路径规划】基于matlab RRT算法求解机器人避障路径规划问题【含Matlab源码 319期】
  8. 毕设题目:Matlab车辆计数
  9. 【优化预测】基于matlab遗传算法优化GRNN数据回归拟合【含Matlab源码 1401期】
  10. 【边缘检测】基于matlab蚁群算法图像边缘检测【含Matlab源码 1189期】