这里,我们用requests_html库从360图书馆抓取一个文档,并从中提取出全球国家的中文名与英文名。

  • 数据源:360图书馆 世界国家英语大全
  • 工具:python自带的字符串函数,requests_html第三方库
  • 目标:将中文名与对应英文名存储为字典格式

步骤一:抓取数据

# 导入第三方库
from requests_html import HTMLSession
# 创建对话
session = HTMLSession();
# 世界国家英语大全 网址
url = 'http://www.360doc.com/content/16/1017/09/36810636_599034128.shtml';
# 解析网址
r = session.get(url);
# 打印网页的文本内容
print(r.html.text);

输出的内容有很多,这是由于网页里面其实除了主要内容,还有更多的其他链接和引导内容。大佬们随意看下~

if (window.location.toString().indexOf("shtml?") > 0) { self.location = window.location.toString().replace(window.location.search.toString(), ""); } function doccheckart(json) { if (json[0].result == "1") { self.location = "http://www.360doc.com/noarticle.aspx"; } } function doccheckarts(json) { if (json[0].result == "1") { var artidlist = json[0].artid; if (artidlist != "") { if (artidlist.indexOf(',') > -1) { artidlist = artidlist.split(','); } else { artidlist = [artidlist]; } $.each(artidlist, function (index, value) { $('#artid_' + value).remove(); }); } } //console.log(json[0]); } function getCookie(name) //获取cookie值 { var arr = document.cookie.match(new RegExp("(^| )" + name + "=([^;]*)(;|$)")); if(arr != null) return unescape(arr[2]); return null; } var patt1 = new RegExp("[0-9]*_[0-9]*"); var url = patt1.exec(location.href); if (navigator.userAgent.toLowerCase().indexOf("micromessenger") > -1) { window.location.href = "http://www.360doc31.net/wxarticlenew/" + url.toString().split("_")[1] + ".html"; } else if (navigator.userAgent.indexOf("iPhone") > 0 || navigator.userAgent.indexOf("Android") > 0 || navigator.userAgent.indexOf("iPod") > 0) { //手机端跳转 if (url != "") { self.location = "http://www.360doc.cn/article/" + url + ".html"; } } if ( 599034128 != 599034128) { if(getCookie("360doc1")!=null) { $.ajax({ url: "http://www.360doc.com/ajax/getuserid.ashx", async:false, cache: false, dataType: "json", success: function (result) { if (36810636 != result.userid) { self.location = "http://www.360doc.com/content/16/1017/09/36810636_599034128.shtml"; } } }); } else { self.location = "http://www.360doc.com/content/16/1017/09/36810636_599034128.shtml"; } } if ( 0 != 599034128&&"0"!=""&&"0"!="0"&&"0"!=1) { $.ajax({ url: "http://www.360doc.com/ajax/getuserid.ashx", cache: false, dataType: "json", success: function (result) { if (36810636 != result.userid) { self.location = ""; } } });}
世界国家英文名字大全
var _hmt = _hmt || []; (function () { var hm = document.createElement("script"); hm.src = "//hm.baidu.com/hm.js?d86954201130d615136257dde062a503"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); })();
window.onerror = ignoreError; function ignoreError() { return true; }
#artContent img{max-width:656px;} #artContent h1{font-size:16px;font-weight: 400;}
我的图书馆
首页
馆藏
好文
好书
动态
写文章
原创中心
退出帐号
查看信箱
系统消息
官方通知
设置
开始对话
有11人和你对话,查看 忽略
历史对话记录
通知设置
留言交流
请选择搜索范围
含  的文章 含  的书籍 含  的随笔 昵称/兴趣为  的馆友
燕燕燕燕燕姐啊 / 文件夹1 / 世界国家英文名字大全
0+1
微信 QQ空间 QQ好友 新浪微博 推荐给朋友
0 0+1 0+1 0
(adsbygoogle = window.adsbygoogle || []).push({ });
分享
更多
大   中   小
世界国家英文名字大全
2016-10-17  燕燕燕燕...
展开全文
亚洲Asia(48个国家)东亚:
中国China、蒙古Mongolia、朝鲜Korea、韩国South Korea、日本 Japan(5)东南亚:
菲律宾Philippines、越南Vietnam、老挝Laos、柬埔寨Cambodia、缅甸Myanmar、泰国Thailand、马来西亚Malaysia、文莱BruneiDarussalam、新加坡Singapore、印度尼西亚Indonesia、
东帝汶 east Timor(11)南亚:
尼泊尔Nepal、不丹Bhutan、孟加拉国Bengal、印度India、巴基斯坦Pakistan、斯里兰卡SriLanka、马尔代夫Maldives(7)中亚:
哈萨克斯坦Kazakhstan、吉尔吉斯斯坦Kyrgyzstan、塔吉克斯坦Tajikistan、乌兹别克斯坦Uzbekistan、土库曼斯坦Turkmenistan(5)西亚:
阿富汗Afghanistan、伊拉克Iraq、伊朗Iran、叙利亚Syria、约旦Jordan、黎巴嫩Lebanon、以色列Israel、巴勒斯坦Palestine、沙特阿拉伯SaudiArabia、巴林Bahrain、卡塔尔Qatar、科威特Kuwait、阿拉伯联合酋长国(阿联酋)United ArabEmirates、阿曼Oman、也门Yemen、格鲁吉亚Georgia、亚美尼亚Armenia、阿塞拜疆Azerbaijan、土耳其Turkey、塞浦路斯Cyprus(20)注:锡金Sikkim现已并入印度成为其一个邦,所以这里不出现,详细请看:欧洲Europe(43个国家/1个地区)北欧:
芬兰Finland、瑞典Sweden、挪威Norway、冰岛Iceland、丹麦Danmark 法罗群岛FaroeIslands(丹)(6)东欧:
爱沙尼亚Estonia、拉脱维亚Latvia、立陶宛Lithuania、白俄罗斯Belarus、俄罗斯Russia、乌克兰Ukraine、摩尔多瓦Moldova(7)中欧:
波兰Poland、捷克Czech、斯洛伐克Slovakia、匈牙利Hungary、德国Germany、奥地利Austria、瑞士Switzerland、列支敦士登Liechtenstein(LIE)(8)西欧:
英国Britain、爱尔兰Ireland、荷兰Holand、比利时Belgium、卢森堡Luxemburg、法国France、摩纳哥Monaco(7)南欧:
罗马尼亚Romania、保加利亚Bulgaria、塞尔维亚Serbia、马其顿Macedonia、阿尔巴尼亚Albania、希腊Greece、斯洛文尼亚Slovenia、克罗地亚Croatia、波斯尼亚Bosnia和墨塞哥维那Herzegovina(波黑)。意大利Italy、梵蒂冈Vatican、圣马力诺SanMarino、马耳他Malta、西班牙Spain、葡萄牙Portugal、安道尔Andorra(16)非洲Africa(53个国家/6个地区)北非:
埃及Egypt、利比亚Libya、苏丹Sudan、突尼斯Tunis、阿尔及利亚Algeria、摩洛哥Morocco、亚速尔群岛Azores(Portugal)(葡)、马德拉群岛(葡)MADEIRAISLANDS(8)东非:
埃塞俄比亚Ethiopia、厄立特里亚Eritrea、索马里Somalia、吉布提Djibouti、肯尼亚Kenya、坦桑尼亚Tanzania、乌干达Uganda、卢旺达Rwanda、布隆迪Burundi、塞舌尔Seychelles(10)中非:
乍得Chad、中非Central Africa、喀麦隆Cameroon、赤道几内亚EquatorialGuinea、加蓬Gabon、刚果共和国Republic of Congo(即:刚果(布))、刚果民主共和国DemocraticRepublic of Congo(即:刚果(金))、圣多美及普林西比Sao Tome and Principe(8)西非:
毛里塔尼亚Mauritania、西撒哈拉WesternSahara(注:未独立,详细请看:)、塞内加尔Senegal、冈比亚Gambian、马里Mali、布基纳法索BurkinaFaso、几内亚Guinea、几内亚比绍Guinea-Bissau、佛得角Cape-Verde、塞拉利昂SierraLeone、利比里亚Liberia、科特迪瓦Coted'Ivoire、加纳Ghana、多哥Togo、贝宁Benin、尼日尔Niger、加那利群岛CanaryIslands(西)(18)南非:
赞比亚Zambia、安哥拉Angola、津巴布韦Zimbabwe、马拉维Malawi、莫桑比克Mozambique、博茨瓦纳Botswana、纳米比亚Namibia、南非SouthAfrica、斯威士兰Swaziland、莱索托Lesotho、马达加斯加Madagascan、科摩罗Comorin、毛里求斯Mauritius、留尼旺Reunion(法)、圣赫勒拿SaintHelena(英)(15)大洋洲Oceania(14个国家/10个地区)澳大利亚Australia、新西兰NewZealand、巴布亚新几内亚Guinea、所罗门群岛Archipelago、瓦努阿图Vanuatu、密克罗尼西亚Micronesia、马绍尔群岛MarshallIslands、帕劳Palau、瑙鲁Nauru、基里巴斯Kiribati、图瓦卢Tuvalu TV、萨摩亚Samoa、斐济群岛FijiIslands、汤加Tonga、库克群岛Cook Islands(新)、关岛Guam(美)、新喀里多尼亚NewCaledonia(法)、法属波利尼西亚French Polynesia、皮特凯恩岛PitcairnIsland(英)、瓦利斯与富图纳Wallis/Futuna(法)、纽埃Niue(新)、托克劳Tokelau(新)、美属萨摩亚AmericanSamoa、北马里亚纳Mariana(美)北美洲North America(23个国家/13个地区)北美:
加拿大Canada、美国America、墨西哥Mexico、格陵兰Greenland(丹)(4)中美洲:
危地马拉Guatemala、伯利兹Belize、萨尔瓦多Salvador、洪都拉斯Honduras、尼加拉瓜Nicaragua、哥斯达黎加Costarica(另CostaRica)、巴拿马Panama(7)加勒比海地区:
巴哈马Bahamas、古巴Cuba、牙买加Jamaica、海地Haiti、多米尼加共和国DominicanRepublic、安提瓜和巴布达Antigua and Barbuda、圣基茨和尼维斯Saint Kitts andNevis、多米尼克Dominica、圣卢西亚Saint Lucia、圣文森特和格林纳丁斯Saint Vincent and theGrenadines、格林纳达Grenada、巴巴多斯Barbados、特立尼达和多巴哥Trinidad andTobago、波多黎各Porto Rico(美)、英属维尔京群岛British VirginIslands、美属维尔京群岛Virgin Islands of the UnitedStates、安圭拉Anguilla(英)、蒙特塞拉特Montserrat(英)、瓜德罗普Guadeloupe(法)、马提尼克Martinique(法)、荷属安的列斯NetherlandsAntilles、阿鲁巴Aruba(荷)、特克斯和凯科斯群岛Turks And CaicosIslands(英)、开曼群岛Cayman Islands(英)、百慕大Bermuda(英)(25)南美洲Latin America(12个国家/1个地区)北部:
哥伦比亚Colombia、委内瑞拉Venezuela、圭亚那Guyana、法属圭亚那FrenchGuiana、苏里南Suriname(5)中西部:
厄瓜多尔Ecuador、秘鲁Peru、玻利维亚Bolivia(3)东部:
巴西Brazil(1)南部:
智利Chile、阿根廷Argentina、乌拉圭Uruguay、巴拉圭Paraguay(4)
赞赏
共11人赞赏
本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。如发现有害或侵权内容,请点击这里 或 拨打24小时举报电话:4000070609 与我们联系。
转藏到我的图书馆 献花(0) +1 分享: 微信
QQ空间 QQ好友 新浪微博 推荐给朋友
来自: 燕燕燕燕燕姐啊 > 《文件夹1》
举报
推一荐:发原创得奖金,“原创奖励计划”来了!  |  欢乐中国年,有奖征文邀你分享!
NEWS_FEED({ w: 500, showid: '6aUB2C', inject: 'textual', useCapture: true, usePolling: true, displayType: 'singleImage', noCSS:false, userConf: { titleFontSize: 14, titleFontColor: "#707070", titleHover: "#0f659c", titleFontFamily: "Microsoft Yahei" } });
猜你喜欢
0条评论
写评论...
发表
请遵守用户 评论公约
查看更多评论
类似文章 更多
世界各国机场数量排行榜
Solomon Islands 所罗门群岛 35 2007 112.Marshall Islands马绍尔群岛 15 2007 150.Cook Islands 库克群岛 9 2007 161.Turks and Caicos Islands特克斯和凯科斯群岛 8 2007 167.Falkland Islands (Isla...
世界各国和地区寿命比较,看中国到底怎样呢
世界各国和地区寿命比较,看中国到底怎样呢世界各国和地区寿命比较,看中国到底怎样呢。2012-08-02 本文转载自俊哥儿《世界各国和地区寿命比较,看中国到底怎样呢》Cayman Islands.Faroe Islands.Virgi...
世界各国家名称,面积,人口数量,首都城市,首都英文名称
世界各国家名称,面积,人口数量,首都城市,首都英文名称。国家名称 (country)面积(平方千米)人口数量。首都名称 (Capital Name)美 洲 国 家。圣约瑟 San Jose..巴巴多斯岛 Barbados.圣乔治 Saint G...
《艺妓回忆录》章子怡:你这么努力,活该被别人羡慕!
她说:“我学英语不仅仅是为了拍电影,而是为了能够真正在国际上立足并继续发展。现代年轻人应该要具备掌握英语的能力,懂得讲英语就多...
(function() { var s = "_" + Math.random().toString(36).slice(2); document.write('<div style="" id="' + s + '"></div>'); (window.slotbydup = window.slotbydup || []).push({ id: "u3687933", container: s }); })();
世界各国面积、人口、首都-速查手册
世界各国面积、人口、首都-速查手册 世界各国面积、人口、首都 亚洲国家。国家country.面积(平方千米)人口(万人)首都/城市。国家(Country)首都名称。留尼旺岛 Reunion.圣马利诺 San Marino.巴巴多...
国别(地区)统计分类
国别(地区)统计分类。2007国别(地区)统计代码表。199 亚洲其他国家(地区) Oth.Asia.nes.299 非洲其他国家(地区) Oth.Afr.nes.499 拉丁美洲其他国家...
全球国家/地区顶级地理域名后缀(资料)
全球国家/地区顶级地理域名后缀(资料) 全球国家/地区顶级地理域名后缀(资料)
(function() { var s = "_" + Math.random().toString(36).slice(2); document.write('<div style="" id="' + s + '"></div>'); (window.slotbydup = window.slotbydup || []).push({ id: "u3687933", container: s }); })();
世界各国和地区名称及首都(首府)一览表
世界各国和地区名称及首都(首府)一览表世界各国和地区名称及首都(首府)一览表编辑本表所收资料一般截止1996年底,少数资料收至1997年初,均依据1997/98《世界知识年鉴》整理。国家或地区。首都或首府。...
世界各国及地区国旗图片
Estonia 爱沙尼亚(原苏联共和国之一,1991年8月宣布独立)Ghana 加纳(西非国家)Latvia拉脱维亚(原苏联共和国之一,1991年8月宣布独立)Lithuania立陶宛(原苏联共和国之一,1991年8月宣布独立)Sao Tome and P...
燕燕燕燕燕姐啊
关注 对话
TA的最新馆藏  (共25篇)
世界国家英文名字大全
英语专业的学生考研考什么方向好一些
金融学包括哪些专业
喜欢该文的人也喜欢 更多BANNER_SLIDER({"w":300,"showid":"FJC107","rshowid":"FJC107","inject":"inlay","layout":"multiColumnScene","h":180});
关闭
关闭
GerLookingUserInfo(1,36810636,1,0,'','',10,0);OutputSource('http://i.niubb.net/a/2015/11-07/917098.html',''); var baiduImagePlus = { noLogo: true, unionId: 'u2617463', maxMiniAdCount: 0, formList: [{ formId: 10 }] }; { "@context": "https://ziyuan.baidu.com/contexts/cambrian.jsonld", "@id": "http://www.360doc.com/content/16/1017/09/36810636_599034128.shtml", "title": "世界国家英文名字大全", "pubDate": "2016-10-17T09:53:51" }

从上面内容中找到我们需要的内容,并复制粘贴为countries.txt(如果大佬们不愿意做,直接看资源,免费下载)。

步骤二:提取中文及英文

# 设置忽略词
countries_data = {};
skip_words =  ['(', ')', ' '];
skip_words.extend(list('0123456789'));
print(skip_words);
# 忽略词
['(', ')', ' ', '0', '1', '2', '3', '4', '5', '6', '7', '8', '9']
with open(r'C:\Users\dell\Desktop\countries.txt') as f:for line in f.readlines():if '、' in line:temp = line.split('、');for item in temp:item = item.strip();item.replace(' ', '');if item == '':continue;else:ChineseWord = [];EnglishWord = [];print(item);for word in item:if word in skip_words:continue;if ord(word) in range(65, 123):if word.isupper():word = ' ' + word;EnglishWord.append(word);else:ChineseWord.append(word);EnglishWord = ''.join(EnglishWord).strip();ChineseWord = ''.join(ChineseWord);countries_data.setdefault(ChineseWord, EnglishWord);print(countries_data);

输出结果为

{'中国': 'China', '蒙古': 'Mongolia', '朝鲜': 'Korea', '韩国': 'South Korea', '日本': 'Japan', '菲律宾': 'Philippines', '越南': 'Vietnam', '老挝': 'Laos', '柬埔寨': 'Cambodia', '缅甸': 'Myanmar', '泰国': 'Thailand', '马来西亚': 'Malaysia', '文莱': 'Brunei Darussalam', '新加坡': 'Singapore', '印度尼西亚': 'Indonesia', '尼泊尔': 'Nepal', '不丹': 'Bhutan', '孟加拉国': 'Bengal', '印度': 'India', '巴基斯坦': 'Pakistan', '斯里兰卡': 'Sri Lanka', '马尔代夫': 'Maldives', '哈萨克斯坦': 'Kazakhstan', '吉尔吉斯斯坦': 'Kyrgyzstan', '塔吉克斯坦': 'Tajikistan', '乌兹别克斯坦': 'Uzbekistan', '土库曼斯坦': 'Turkmenistan', '阿富汗': 'Afghanistan', '伊拉克': 'Iraq', '伊朗': 'Iran', '叙利亚': 'Syria', '约旦': 'Jordan', '黎巴嫩': 'Lebanon', '以色列': 'Israel', '巴勒斯坦': 'Palestine', '沙特阿拉伯': 'Saudi Arabia', '巴林': 'Bahrain', '卡塔尔': 'Qatar', '科威特': 'Kuwait', '阿拉伯联合酋长国阿联酋': 'United Arab Emirates', '阿曼': 'Oman', '也门': 'Yemen', '格鲁吉亚': 'Georgia', '亚美尼亚': 'Armenia', '阿塞拜疆': 'Azerbaijan', '土耳其': 'Turkey', '塞浦路斯': 'Cyprus', '芬兰': 'Finland', '瑞典': 'Sweden', '挪威': 'Norway', '冰岛': 'Iceland', '丹麦法罗群岛丹': 'Danmark Faroe Islands', '爱沙尼亚': 'Estonia', '拉脱维亚': 'Latvia', '立陶宛': 'Lithuania', '白俄罗斯': 'Belarus', '俄罗斯': 'Russia', '乌克兰': 'Ukraine', '摩尔多瓦': 'Moldova', '波兰': 'Poland', '捷克': 'Czech', '斯洛伐克': 'Slovakia', '匈牙利': 'Hungary', '德国': 'Germany', '奥地利': 'Austria', '瑞士': 'Switzerland', '列支敦士登()': 'Liechtenstein L I E', '英国': 'Britain', '爱尔兰': 'Ireland', '荷兰': 'Holand', '比利时': 'Belgium', '卢森堡': 'Luxemburg', '法国': 'France', '摩纳哥': 'Monaco', '罗马尼亚': 'Romania', '保加利亚': 'Bulgaria', '塞尔维亚': 'Serbia', '马其顿': 'Macedonia', '阿尔巴尼亚': 'Albania', '希腊': 'Greece', '斯洛文尼亚': 'Slovenia', '克罗地亚': 'Croatia', '波斯尼亚和墨塞哥维那(波黑)。': 'Bosnia Herzegovina', '意大利': 'Italy', '梵蒂冈': 'Vatican', '圣马力诺': 'San Marino', '马耳他': 'Malta', '西班牙': 'Spain', '葡萄牙': 'Portugal', '安道尔': 'Andorra', '埃及': 'Egypt', '利比亚': 'Libya', '苏丹': 'Sudan', '突尼斯': 'Tunis', '阿尔及利亚': 'Algeria', '摩洛哥': 'Morocco', '亚速尔群岛()葡': 'Azores Portugal', '马德拉群岛葡': 'M A D E I R A I S L A N D S', '埃塞俄比亚': 'Ethiopia', '厄立特里亚': 'Eritrea', '索马里': 'Somalia', '吉布提': 'Djibouti', '肯尼亚': 'Kenya', '坦桑尼亚': 'Tanzania', '乌干达': 'Uganda', '卢旺达': 'Rwanda', '布隆迪': 'Burundi', '塞舌尔': 'Seychelles', '乍得': 'Chad', '中非': 'Central Africa', '喀麦隆': 'Cameroon', '赤道几内亚': 'Equatorial Guinea', '加蓬': 'Gabon', '刚果共和国即:刚果布': 'Republicof Congo', '刚果民主共和国即:刚果金': 'Democratic Republicof Congo', '圣多美及普林西比': 'Sao Tomeand Principe', '毛里塔尼亚': 'Mauritania', '西撒哈拉注:未独立,详细请看:': 'Western Sahara', '塞内加尔': 'Senegal', '冈比亚': 'Gambian', '马里': 'Mali', '布基纳法索': 'Burkina Faso', '几内亚': 'Guinea', '几内亚比绍-': 'Guinea Bissau', '佛得角-': 'Cape Verde', '塞拉利昂': 'Sierra Leone', '利比里亚': 'Liberia', "科特迪瓦'": 'Coted Ivoire', '加纳': 'Ghana', '多哥': 'Togo', '贝宁': 'Benin', '尼日尔': 'Niger', '加那利群岛西': 'Canary Islands', '赞比亚': 'Zambia', '安哥拉': 'Angola', '津巴布韦': 'Zimbabwe', '马拉维': 'Malawi', '莫桑比克': 'Mozambique', '博茨瓦纳': 'Botswana', '纳米比亚': 'Namibia', '南非': 'South Africa', '斯威士兰': 'Swaziland', '莱索托': 'Lesotho', '马达加斯加': 'Madagascan', '科摩罗': 'Comorin', '毛里求斯': 'Mauritius', '留尼旺法': 'Reunion', '圣赫勒拿英': 'Saint Helena', '澳大利亚': 'Australia', '新西兰': 'New Zealand', '巴布亚新几内亚': 'Guinea', '所罗门群岛': 'Archipelago', '瓦努阿图': 'Vanuatu', '密克罗尼西亚': 'Micronesia', '马绍尔群岛': 'Marshall Islands', '帕劳': 'Palau', '瑙鲁': 'Nauru', '基里巴斯': 'Kiribati', '图瓦卢': 'Tuvalu T V', '萨摩亚': 'Samoa', '斐济群岛': 'Fiji Islands', '汤加': 'Tonga', '库克群岛新': 'Cook Islands', '关岛美': 'Guam', '新喀里多尼亚法': 'New Caledonia', '法属波利尼西亚': 'French Polynesia', '皮特凯恩岛英': 'Pitcairn Island', '瓦利斯与富图纳/法': 'Wallis Futuna', '纽埃新': 'Niue', '托克劳新': 'Tokelau', '美属萨摩亚': 'American Samoa', '北马里亚纳美': 'Mariana', '加拿大': 'Canada', '美国': 'America', '墨西哥': 'Mexico', '格陵兰丹': 'Greenland', '危地马拉': 'Guatemala', '伯利兹': 'Belize', '萨尔瓦多': 'Salvador', '洪都拉斯': 'Honduras', '尼加拉瓜': 'Nicaragua', '哥斯达黎加(另)': 'Costarica Costa Rica', '巴拿马': 'Panama', '巴哈马': 'Bahamas', '古巴': 'Cuba', '牙买加': 'Jamaica', '海地': 'Haiti', '多米尼加共和国': 'Dominican Republic', '安提瓜和巴布达': 'Antiguaand Barbuda', '圣基茨和尼维斯': 'Saint Kittsand Nevis', '多米尼克': 'Dominica', '圣卢西亚': 'Saint Lucia', '圣文森特和格林纳丁斯': 'Saint Vincentandthe Grenadines', '格林纳达': 'Grenada', '巴巴多斯': 'Barbados', '特立尼达和多巴哥': 'Trinidadand Tobago', '波多黎各美': 'Porto Rico', '英属维尔京群岛': 'British Virgin Islands', '美属维尔京群岛': 'Virgin Islandsofthe United States', '安圭拉英': 'Anguilla', '蒙特塞拉特英': 'Montserrat', '瓜德罗普法': 'Guadeloupe', '马提尼克法': 'Martinique', '荷属安的列斯': 'Netherlands Antilles', '阿鲁巴荷': 'Aruba', '特克斯和凯科斯群岛英': 'Turks And Caicos Islands', '开曼群岛英': 'Cayman Islands', '百慕大英': 'Bermuda', '哥伦比亚': 'Colombia', '委内瑞拉': 'Venezuela', '圭亚那': 'Guyana', '法属圭亚那': 'French Guiana', '苏里南': 'Suriname', '厄瓜多尔': 'Ecuador', '秘鲁': 'Peru', '玻利维亚': 'Bolivia', '智利': 'Chile', '阿根廷': 'Argentina', '乌拉圭': 'Uruguay', '巴拉圭': 'Paraguay'}

从360图书馆抓取全球国家的中文名与英文名(requests_html)相关推荐

  1. 360搜索结果页html代码,360搜索抓取完全封闭网页揭秘

    第一步,百度工程师制作一个保存在服务器个人文件夹下的简单网页,没有任何外链,由于搜索引擎爬虫只能通过链接爬行网页,因此这个网页是完全封闭的,不可能被搜索引擎抓取到. 第二步,百度工程师用360浏览器打 ...

  2. 360秒抓取收录批量提交程序

    一.360URL收录提交 批量推送程序截图 二.360URL收录自动提交程序更新记录 2021.6.7更新[V5.4]更新 1.泛目录.泛域名.泛域名目录混合批量推送自动生成推送 2.精简程序配置,移 ...

  3. python 爬虫思想,抓取网站上尽可能多的英文内容文章,去除停用词后,统计频次出现排名前 300~600 的高频词

    抓取链接 http://www.chinadaily.com.cn/a/201804/14/WS5ad15641a3105cdcf6518417.html 中英文文章及a标签中URL链接中的英文文章, ...

  4. java抓取世界国家国旗

    本文章是借鉴博客:https://blog.csdn.net/jclian91/article/details/80950334  ,好了,直接看源码: package com.getcount; i ...

  5. 360站长平台提交站点地图sitemap.xml抓取的url数量为0的解决方法

    解决方法一:不要提交https的sitemap,提交http的即可成功 解决方法二:如果提交http的还没有成功,请检查自己的sitemap.xml格式是否是UTF-8的,不是换成UTF-8即可成功 ...

  6. Python-马蜂窝全站抓取。。。今天先写抓取国家和城市,下次有时间在写景点、自由行攻略和游记。。。

    1.抓取全部国家 1)开始的url start_url = 'http://www.mafengwo.cn/mdd/' 2)请求部分代码 proxies = get_proxies_requests( ...

  7. python爬虫怎么爬同一个网站的多页数据-如何用Python爬数据?(一)网页抓取

    如何用Python爬数据?(一)网页抓取 你期待已久的Python网络数据爬虫教程来了.本文为你演示如何从网页里找到感兴趣的链接和说明文字,抓取并存储到Excel. 需求 我在公众号后台,经常可以收到 ...

  8. python爬网站数据实例-如何用Python爬数据?(一)网页抓取

    如何用Python爬数据?(一)网页抓取 你期待已久的Python网络数据爬虫教程来了.本文为你演示如何从网页里找到感兴趣的链接和说明文字,抓取并存储到Excel. 需求 我在公众号后台,经常可以收到 ...

  9. vs用Python爬数据?(一)网页抓取

    你期待已久的Python网络数据爬虫教程来了.本文为你演示如何从网页里找到感兴趣的链接和说明文字,抓取并存储到Excel. (由于微信公众号外部链接的限制,文中的部分链接可能无法正确打开.如有需要,请 ...

  10. 用Scrapy抓取Yahoo! WOEID

    Yahoo! WOEID (Where On Earth Identifier) 是Yahoo的一套用于识别地球上不同地址的编号系统.许多网站,包括Twitter都用woeid来识别位置信息.本文主题 ...

最新文章

  1. LeetCode简单题之找到所有数组中消失的数字
  2. 串口服务器支持多台上位机,RS485多机通信一台上位机两台下位机问题,
  3. 使用Spring进行不同开发所需要用到的包
  4. 锐捷服务器虚拟化技术_数据中心边缘虚拟交换(IEEE 802.1Qbg)技术白皮书
  5. EF Core 2.1路线图:视图、GROUP BY和惰性加载
  6. java extends 继承的一些小结。
  7. 如何高效地使用51单片机串口输入输出
  8. 国内首家生鲜电商平台要凉了:阿里曾参投,7月底已申请破产重组
  9. python pytest
  10. BasicExcel CSpreadSheet 使用感受
  11. [转]-Sublime Text 3最好的功能、插件和设置
  12. python怎么提高_Python心得--如何提高代码质量
  13. matlab——矩阵运算
  14. 职称计算机考试有哪些题,职称计算机考试题库(-套有答案).doc
  15. 鸿蒙系统怎么在桌面添加小程序,从微信小程序到鸿蒙JS开发-menutoastdialog
  16. Defending Against Model Stealing Attacks with Adaptive Misinformation
  17. linux下看pcie的设备id,linux lspci查看pci总线设备信息
  18. Designing Machine Learning Systems with Python
  19. eip协议通信_工业通讯 | EtherNET/IP协议基础知识(Part 3)||附视频讲解
  20. The Java™ Tutorials下载地址

热门文章

  1. 2022年最好的游戏引擎是什么?
  2. mysql怎么改gm_MySQL修改密码的几种方式
  3. 429. N 叉树的层序遍历(中等 树 广度优先搜索)
  4. java调用百度Ocr识别以及报错SDK108的解决办法
  5. Flash制作卷轴水墨画展开动画效果
  6. python模拟手机app签到_利用 Python + Selenium 实现自动登陆签到
  7. Pyhton爬虫实战 - 抓取BOSS直聘职位描述 和 数据清洗
  8. 违反GPL协议赔偿50万,国内首例!
  9. Depsolving loop limit reached
  10. 英语六级考前急救100词 10个List