country-converter官方文档----机翻人工确认
项目描述
国家转换器 (coco) 是一个 Python 包,可在不同的分类和不同的命名版本之间转换和匹配国家名称。在内部,它使用常规的表达方式来匹配国家名称。可可还可用于在不同的分类方案之间构建聚合和谐矩阵。
内容表
- 动机
- 安装
- 用法
- 基本使用
- 在 Python 内使用
- 在命令行中使用
- 在Matlab中使用
- 为国家聚合构建和谐
- 基本使用
- 分类方案
- 数据源和进一步阅读
- 沟通、问题、错误和增强功能
- 贡献
- 相关软件
- 引用国家转换器
- 确认
作用
安装
Country_converter在 Pypi 注册。从命令行:
pip install country_converter --upgrade
国家转换器也可以从conda,可以安装使用conda(如果你没有conda_forge通道添加到您的康达配置添加"-cconda",请参阅此处的安装说明):
conda install country_converter
包裹取决于pandas库:测试测试是必需的。有关运行测试的更多信息,请参阅贡献.rst。
用法
基本使用
在 Python 内使用
import country_converter as coco
some_names = ['United Rep. of Tanzania', 'DE', 'Cape Verde', '788', 'Burma', 'COG','Iran (Islamic Republic of)', 'Korea, Republic of',"Dem. People's Rep. of Korea"]
standard_names = coco.convert(names=some_names, to='name_short')
print(standard_names)
在多次转换的情况下,可以通过为所有转换对单个国家转换对象进行实例化来实现更好的性能:
import country_converter as coco
cc = coco.CountryConverter()some_names = ['United Rep. of Tanzania', 'Cape Verde', 'Burma','Iran (Islamic Republic of)', 'Korea, Republic of',"Dem. People's Rep. of Korea"]standard_names = cc.convert(names = some_names, to = 'name_short')
UNmembership = cc.convert(names = some_names, to = 'UNmember')
print(standard_names)
print(UNmembership)
iso3_codes = ['USA', 'VUT', 'TKL', 'AUT', 'XXX' ]
iso2_codes = coco.convert(names=iso3_codes, to='ISO2')
print(iso2_codes)
这导致 [美国’, ‘Vu’, ‘Tk’, ‘AT’, ‘找不到’
未找到的指示可以指定(例如,not_found = “不存在”),如果"not_found"未通过,则原始条目将通过:
iso2_codes = coco.convert(names=iso3_codes, to='ISO2', not_found=None)
print(iso2_codes)
结果在 [‘美国’, ‘VU’, ‘Tk’, ‘AT’, ‘XX’
内部数据存储在pandas数据帧中,可直接访问。例如,这可用于筛选成员国组织的国家(每年)。注意:为此,需要一个"国家转换器"实例。
import country_converter as coco
cc = coco.CountryConverter()some_countries = ['Australia', 'Belgium', 'Brazil', 'Bulgaria', 'Cyprus', 'Czech Republic','Denmark', 'Estonia', 'Finland', 'France', 'Germany', 'Greece', 'Hungary','India', 'Indonesia', 'Ireland', 'Italy', 'Japan', 'Latvia', 'Lithuania','Luxembourg', 'Malta', 'Romania', 'Russia', 'Turkey', 'United Kingdom','United States']oecd_since_1995 = cc.data[(cc.data.OECD >= 1995) & cc.data.name_short.isin(some_countries)].name_short
eu_until_1980 = cc.data[(cc.data.EU <= 1980) & cc.data.name_short.isin(some_countries)].name_short
print(oecd_since_1995)
print(eu_until_1980)
cc.EU28
cc.OECDcc.EU27as('ISO3')
cc.valid_class
cc.valid_country_classifications
import country_converter as coco
cc = coco.CountryConverter()
cc.get_correspondence_dict('EXIO3', 'ISO3')
cc.get_correspondence_dict('EU27', 'ISO2', replace_nan='NonEU')
常规表达式还可用于将任何国家列表与任何其他国家列表匹配。例如:
match_these = ['norway', 'united_states', 'china', 'taiwan']
master_list = ['USA', 'The Swedish Kingdom', 'Norway is a Kingdom too','Peoples Republic of China', 'Republic of China' ]matching_dict = coco.match(match_these, master_list)
默认情况下,如果找不到匹配项,则国家转换器会向巨蛇记录记录器发出警告。以下示例演示了如何配置可可伐木行为。
import logging
import country_converter as coco
logging.basicConfig(level=logging.INFO)
coco.convert("asdf")
# WARNING:country_converter.country_converter:asdf not found in regex
# Out: 'not found'coco_logger = coco.logging.getLogger()
coco_logger.setLevel(logging.CRITICAL)
coco.convert("asdf")
# Out: 'not found'
有关更多信息,请参阅 IPython 笔记本(country_converter_examples.ipynb)。
命令线使用
coco Cyprus DE Denmark Estonia 4 'United Kingdom' AUT
根据将输入与 ISO2、ISO3、ISonumeric 或常规表达匹配匹配的输入,将给定名称转换为 ISO3 代码。名称列表必须按空格划分,由多个单词组成的国名必须放在引号中(’)。
输入分类可以用"src"或"-s"(或将自动确定)、目标分类(“到"或”-t")来指定。
默认输出是一个空间分离列表,可以通过"+output_sep"或"-o"(例如 -o"|")通过分离器来更改。
因此,要从 ISO3 转换为 UN 编号代码,并接收输出作为逗号分离列表使用:
coco AUT DEU VAT AUS -s ISO3 -t UNcode -o ', '
命令线工具还允许指定未找到条目的输出,包括通过"无"将其传递到输出:
coco CAN Peru US Mexico Venezuela UK Arendelle --not_found=None
coco Congo --additional_data path/to/datafile.csv
旗帜UNmember_only(-u)和include_obsolete(-i)仅将搜索限制在联合国会员国,或将其扩展到还包括目前过时的国家。例如,荷属安的列斯群岛于2010年解散。
coco "Netherlands Antilles"
coco "Netherlands Antilles" -i
coco G20
coco EXIO3
coco EXIO3 --to ISO3
coco -h
在Matlab中使用
较新的(在 2016 年测试)版本的 Matlab 允许直接调用 Python 功能和库。这需要安装在系统路径(例如通过 Anaconda)中的 Python 版本>= 3.4)。
py.print(py.sys.version)
如果这有效,您也可以在通过点(在窗口命令线)安装后使用 coco - 请参阅上面的安装说明):
pip install country_converter --upgrade
coco = py.country_converter.CountryConverter()
countries = {'The Swedish Kingdom', 'Norway is a Kingdom too', 'Peoples Republic of China', 'Republic of China'};
ISO2_pythontype = coco.convert(countries, pyargs('to', 'ISO2'));
ISO2_cellarray = cellfun(@char,cell(ISO2_pythontype),'UniformOutput',false);
short_names = cellfun(@char, cell(py.country_converter.convert({56, 276}, pyargs('src', 'UNcode', 'to', 'name_short'))), 'UniformOutput',false);
coco = py.country_converter.CountryConverter();
coco.EU27
EU27ISO3 = coco.EU27as('ISO3');
这些功能返回pandas数据帧。基础值可以访问与 。值 (例如.
EU27ISO3.values
为国家聚合构建和谐
Coco 提供在不同分类之间构建和谐载体、矩阵和字典的功能。这可以用于巨蛇以及垫板。有关更多信息,请参阅(country_converter_aggregation_helper.ipynb)
分类方案
- ISO2 (ISO 3166-1 阿尔法-2)
- ISO3 (ISO 3166-1 阿尔法-3)
- ISO - 数字(ISO 3166-1 数字)
- 联合国数字代码(M.49 - 跟随大扩展ISO数字)
- 标准名称或短名称
- "官方"名称
- 大陆
- 联合国地区
- EXIOBASE 1 分类
- EXIOBASE 2 分类
- EXIOBASE 3 分类
- WIOD分类
- 欧拉
- 经合组织成员(每年)
- 消息11 区域分类
- 图像
- 提醒
- 联合国会员国(每年)
- 欧盟成员(包括欧盟12国、欧盟15国、欧盟25国、欧盟27国、EU27_2007国、欧盟28国)
- 欧洲经济区成员
- 申根区
- [塞西莉亚](https://cecilia2050.eu/system/files/De Koning et al. (2014)_Scenarios for 2050_0.pdf)2050 分类
- 亚太经合组织
- 金砖四国
- 基本
- 独联体(截至2019年,土库曼斯坦除外)
- G7
- G20(将所有欧盟成员国列为个别成员国)
- 粮农组织代码(数字)
- GBD 代码(数字 - 全球疾病负担国家代码)
Coco 包含官方认可的代码以及争议或解散国家的非标准代码。将设置限制为只有官方承认的联合国会员国或包括过时的国家,请通过
import country_converter as coco
cc = coco.CountryConverter()
cc_UN = coco.CountryConverter(only_UNmember=True)
cc_all = coco.CountryConverter(include_obsolete=True)cc.convert(['PSE', 'XKX', 'EAZ', 'FRA'], to='name_short')
cc_UN.convert(['PSE', 'XKX', 'EAZ', 'FRA'], to='name_short')
cc_all.convert(['PSE', 'XKX', 'EAZ', 'FRA'], to='name_short')
数据源和进一步阅读
经合组织和联合国的成员可以在成员组织的网页上找到,关于过时的国家代码的信息在Statoids网页上。
全球疾病负担国家代码是从此处可用的 GBD 代码簿中提取的。
沟通、问题、错误和增强功能
请使用问题跟踪器记录错误,建议增强功能以及与 coco 相关的所有其他通信。
你可以在推特上关注我, 了解我所有的开源和研究项目的最新消息 (偶尔还有一些随机转推) 。
相关软件
country-converter官方文档----机翻人工确认相关推荐
- 《深入理解计算机系统》实验二Bomb Lab下载和官方文档机翻
前言 <深入理解计算机系统>官网:http://csapp.cs.cmu.edu/3e/labs.html 该篇文章是实验二Bomb Lab的Writeup机翻. 原文:http://cs ...
- 《深入理解计算机系统》实验四Architecture Lab下载和官方文档机翻
前言 <深入理解计算机系统>官网:http://csapp.cs.cmu.edu/3e/labs.html 该篇文章是是实验四Architecture Lab中的Writeup(archl ...
- keepalived配置参数官方文档中文翻译版
keepalived-1.2.3 配置文件关键字官方文档详解翻译中文版 版本V1.0 时间2012-07-17 版权GPL 作者itnihao 邮箱 itnihao@qq.com 本文档来自keepa ...
- 微软 theme 主题文件官方文档中文翻译版
这份文档将主要讨论Windows 7,Windows Vista和Windows XP中使用的主题文件(.theme)的语言格式.一个.theme文件实质上是一个分段记录特定桌面可视化效果设定的.in ...
- HTTPie 官方文档中文翻译版
博客原文» HTTPie 是一个命令行 HTTP 客户端.目标是让 CLI 与 Web services 的交互尽可能的更友好.它提供了一个简单的 http 命令,可以让我们用简单自然的表述发送任意 ...
- Hyperledger-indy 官方文档人工翻译
博客内容为Hyperledger-indy官方部署文档的中文翻译,翻译内容系原创,转载注明来源 [说明] (1)[撰写目的] Hyperledger-indy的中文资料较少,希望能为初次接触Hyper ...
- pytest官方文档 6.2 中文翻译版(第十章):警告捕捉
从3.1版本开始,pytest会在整个测试执行的过程中自动的捕捉警告: # content of test_show_warnings.py import warningsdef api_v1():w ...
- mysql5.5配置向导官方文档【中文翻译版】
这是mysql的官方文档的翻译版本,浏览器翻译的,基本上能看懂.图片看着更加方便.就是看着发虚,可以直接点击图片看大图. MySQL5.5配置向导中文说明
- MySQL8.0.28安装教程全程参考MySQL官方文档
MySQL8.0.28详细安装教程.提供了Windows10下安装MariaDB与MySQL8.0同时共存的方法,以及Linux发行版Redhat7系列安装MySQL8.0详细教程.Windows10 ...
- mysql 标识符规则_MySQL 标识符到底区分大小写么——官方文档告诉你
最近在阿里云服务器上部署一个自己写的小 demo 时遇到一点问题,查看 Tomcat 日志后定位到问题出现在与数据库服务器交互的地方,执行 SQL 语句时会返回 指定列.指定名 不存在的错误.多方查证 ...
最新文章
- 今天下午2:00,RT-Thread与智能车竞赛概况
- 理解Java中的hashCode 和 equals 方法
- 网络编程学习笔记(服务器端进程终止)
- 您能看出这个Double Check里的问题吗?(解答)
- 启明云端分享|AIOT+智慧屏解决方案,用色彩渲染智慧生活
- cas 注销不关闭浏览器异常_如何关闭华为手机这些“流氓”推送?
- python变量名可以包含的字符有问号吗,带问号文字的Python正则表达式
- aix vnc oracle,请问如何配置AIX上的vnc
- Cuda:invalid device pointer
- 基于JAVA+SpringMVC+Mybatis+MYSQL的旅游景点门票售票管理系统
- maya为什么不能导出fbx_Maya在操作中最容易出现的几个问题,现在注意还来得及...
- JS如何关闭当前浏览器窗口?
- 717. 1比特与2比特字符
- Luogu1005 矩阵取数游戏
- python图书馆管理系统源代码_python代码实现图书管理系统
- 计算机视觉 | 面试题:26、LBP算法原理
- B1299 [LLH邀请赛]巧克力棒 博弈论
- eplan如何导入access_EPLAN导入edz文件太慢如何解决
- 王家林人工智能AI 第七节课:四种性能优化Matrix编写AI框架实战(Gradient Descent的陷阱、及几种常见的性能优化方式实战)老师微信13928463918
- 软件测试面试两分钟自我介绍