python检测输入文本的语言
可以参考:https://stackoverflow.com/questions/39142778/python-how-to-determine-the-language,介绍了非常多的库
这里以博主使用的库langid
为例:
github主页:https://github.com/saffsd/langid.py
def check_language(string: str) -> str:"""检查语言:return zh:中文,en:英文,"""import langidimport renew_string = re.sub(r'[0-9]+', '', string) # 这一步剔除掉文本中包含的数字return langid.classify(new_string)[0]if __name__ == '__main__':check_language("haha, python is good") # encheck_language("可以") # zh
符号与对应的语言如下表,更多请参考:https://baike.baidu.com/item/ISO%20639-1
aa | 阿法尔语 | fr | 法语 | li | 林堡语 | se | 北萨米语 |
ab | 阿布哈兹语 | fy | 弗里西亚语 | ln | 林加拉语 | sg | 桑戈语 |
ae | 阿维斯陀语 | ga | 爱尔兰语 | lo | 老挝语 | sh | 塞尔维亚-克罗地亚语 |
af | 南非语 | gd | 苏格兰盖尔语 | lt | 立陶宛语 | si | 僧加罗语 |
ak | 阿坎语 | gl | 加利西亚语 | lu | 卢巴语 | sk | 斯洛伐克语 |
am | 阿姆哈拉语 | gn | 瓜拉尼语 | lv | 拉脱维亚语 | sl | 斯洛文尼亚语 |
an | 阿拉贡语 | gu | 古吉拉特语 | mg | 马达加斯加语 | sm | 萨摩亚语 |
ar | 阿拉伯语 | gv | 马恩岛语 | mh | 马绍尔语 | sn | 绍纳语 |
as | 阿萨姆语 | ha | 豪萨语 | mi | 毛利语 | so | 索马里语 |
av | 阿瓦尔语 | he | 希伯来语 | mk | 马其顿语 | sq | 阿尔巴尼亚语 |
ay | 艾马拉语 | hi | 印地语 | ml | 马拉亚拉姆语 | sr | 塞尔维亚语 |
az | 阿塞拜疆语 | ho | 希里莫图语 | mn | 蒙古语 | ss | 斯瓦特语 |
ba | 巴什基尔语 | hr | 克罗地亚语 | mo | 摩尔达维亚语 | st | 南索托语 |
be | 白俄罗斯语 | ht | 海地克里奥尔语 | mr | 马拉提语 | su | 巽他语 |
bg | 保加利亚语 | hu | 匈牙利语 | ms | 马来语 | sv | 瑞典语 |
bh | 比哈尔语 | hy | 亚美尼亚语 | mt | 马耳他语 | sw | 斯瓦希里语 |
bi | 比斯拉马语 | hz | 赫雷罗语 | my | 缅甸语 | ta | 泰米尔语 |
bm | 班巴拉语 | ia | 国际语A | na | 瑙鲁语 | te | 泰卢固语 |
bn | 孟加拉语 | id | 印尼语 | nb | 书面挪威语 | tg | 塔吉克斯坦语 |
bo | 藏语 | ie | 国际语E | nd | 北恩德贝勒语 | th | 泰语 |
br | 布列塔尼语 | ig | 伊博语 | ne | 尼泊尔语 | ti | 提格里尼亚语 |
bs | 波斯尼亚语 | ii | 四川彝语(诺苏语) | ng | 恩敦加语 | tk | 土库曼语 |
ca | 加泰隆语 | ik | 依努庇克语 | nl | 荷兰语 | tl | 他加禄语 |
ce | 车臣语 | io | 伊多语 | nn | 新挪威语 | tn | 塞茨瓦纳语 |
ch | 查莫罗语 | is | 冰岛语 | no | 挪威语 | to | 汤加语 |
co | 科西嘉语 | it | 意大利语 | nr | 南恩德贝勒语 | tr | 土耳其语 |
cr | 克里语 | iu | 因纽特语 | nv | 纳瓦霍语 | ts | 宗加语 |
cs | 捷克语 | ja | 日语 | ny | 尼扬贾语 | tt | 塔塔尔语 |
cu | 古教会斯拉夫语 | jv | 爪哇语 | oc | 奥克语 | tw | 特威语 |
cv | 楚瓦什语 | ka | 格鲁吉亚语 | oj | 奥吉布瓦语 | ty | 塔希提语 |
cy | 威尔士语 | kg | 刚果语 | om | 奥洛莫语 | ug | 维吾尔语 |
da | 丹麦语 | ki | 基库尤语 | or | 奥利亚语 | uk | 乌克兰语 |
de | 德语 | kj | 宽亚玛语 | os | 奥塞梯语 | ur | 乌尔都语 |
dv | 迪维希语 | kk | 哈萨克语 | pa | 旁遮普语 | uz | 乌兹别克语 |
dz | 不丹语 | kl | 格陵兰语 | pi | 巴利语 | ve | 文达语 |
ee | 埃维语 | km | 高棉语 | pl | 波兰语 | vi | 越南语 |
el | 现代希腊语 | kn | 卡纳达语 | ps | 普什图语 | vo | 沃拉普克语 |
en | 英语 | ko | 朝鲜语、韩语 | pt | 葡萄牙语 | wa | 沃伦语 |
eo | 世界语 | kr | 卡努里语 | qu | 凯楚亚语 | wo | 沃洛夫语 |
es | 西班牙语 | ks | 克什米尔语 | rm | 罗曼什语 | xh | 科萨语 |
et | 爱沙尼亚语 | ku | 库尔德语 | rn | 基隆迪语 | yi | 依地语 |
eu | 巴斯克语 | kv | 科米语 | ro | 罗马尼亚语 | yo | 约鲁巴语 |
fa | 波斯语 | kw | 康沃尔语 | ru | 俄语 | za | 壮语 |
ff | 富拉语 | ky | 吉尔吉斯语 | rw | 卢旺达语 | zh | 中文、汉语 |
fi | 芬兰语 | la | 拉丁语 | sa | 梵语 | zu | 祖鲁语 |
fj | 斐济语 | lb | 卢森堡语 | sc | 萨丁尼亚语 | ||
fo | 法罗语 | lg | 卢干达语 | sd | 信德语 |
python检测输入文本的语言相关推荐
- html 输入框并行,Python:输入文本框并行捕获userinput到OpenCV Live网络摄像头图像...
我有一个简单的脚本运行流式传输我的网络摄像头的图像,我想做一些像canny-filter和hough转换一样的操作来检测liveimage中的行:Python:输入文本框并行捕获userinput到O ...
- python自动化输入文本_python输入文本
广告关闭 腾讯云11.11云上盛惠 ,精选热门产品助力上云,云服务器首年88元起,买的越多返的越多,最高返5000元! python具有基本的文本文件读写功能. python的标准库提供有更丰富的读写 ...
- 【跨语言剽窃检测】文本相似度分析之一
对比文件1: 2010年的跨语言剽窃检测新方法 作者RaFael Corezola Pereira instituion : UFRGS 摘要: 作者提出一个跨语言剽窃检测新方法,分为5个主要阶段: ...
- 文本输入框内实时检测输入的字数
动态检测输入 如下图所示,我们该怎么动态监听输入框内输入的数据呢?,这里就用到了几个事件 1.focusin表示获得焦点触发事件 2.focusout表示失去焦点触发事件 3.oninput事件来监听 ...
- python文本分析的开源工具_重磅开源:TN文本分析语言
tn是desert(沙漠之鹰)和tan共同开发的一种用于匹配,转写和抽取文本的语言(DSL).并为其开发和优化了专用的编译器.基于递归下降方法和正则表达式,能解析自然文本并转换为树和字典,识别时间,地 ...
- python检测键盘输入termios、等待按键超时检测
试了很多方案都不行或者不好用.win10+linux可以用的方法有pygame和termios pygame方法参考:https://blog.csdn.net/qxqxqzzz/article/de ...
- Python实现全自动输入文本
文章目录 1. 效果图 2. 示例代码 3. 代码解释 1. 效果图 该Python脚本可以实现自动用Notepad++打开文本文件,然后自动输入文本,最后保存并关闭文件,从而实现全面自动化处理文本. ...
- 使用Python + Adb 实现对QQ实时点击名片赞,输入文本信息
使用Python + Adb 实现对手机QQ实时点击,名片赞,输入文本信息 首要我们要输入中文,必须借助安卓软件-adbkeyboard.apk,切记不要忘记去设置里默认它作为首要输入法,找不到安卓软 ...
- 【Python】Python中的文本处理
作者 | KahEm Chu 编译 | VK 来源 | Towards Data Science 互联网连接了世界,而Facebook.Twitter和Reddit等社交媒体为人们提供了表达自己对某个 ...
最新文章
- 我室友拿到了字节50万年薪,太牛逼了
- java自定义监听器例子_Spring 实现自定义监听器案例
- 研发项目进度管理软件正式上线
- linux下yum安装最新稳定版nginx
- c语言蓝桥十进制转十六进制,蓝桥杯 基础练习 十进制转十六进制
- 反向算法_10分钟带你了解神经网络基础:反向传播算法详解
- Resource is out of sync with the file system
- css 伪类大全,CSS 伪类
- Golang环境windows 设置 GOROOT 和 GOPATH
- python实现网页截图功能——学习篇(01)
- android 分辨率转换器,Nevercenter Pixelmash(图片像素转换器) v202010 官方版
- FileStatus类介绍
- 【BZOJ1061】【NOI2008】志愿者招募 费用流神题、单纯形裸题(代码费用流)
- 【点云系列】综述: Deep Learning for 3D Point Clouds: A Survey
- matlab求解不等式方程组解集,matlab求不等式方程组的可行解
- 【安卓】电脑执行脚本控制安卓手机
- Python笔记 · Python语言的“动态性”
- 华为云服务器使用教程
- echarts柱形图+折线图混合案例
- H5互动游戏平台推荐:盘点那些超火的多人小游戏互动对战平台
热门文章
- video4linux(v4l)使用摄像头的实例基础教程与体会
- SPH(光滑粒子流体动力学)流体模拟实现四:各向异性(Anisotropic)表面光滑(2)
- 高阶系统怎么用matlab降阶,高阶系统模型一种降阶方法.pdf
- php程序里的configini_PHP: 配置文件 - Manual
- 打开wmware没反应_白酒打开后能存放多久?
- OS X上搭建distcc使用XCode进行分布式编译
- 用python写网络爬虫 -从零开始 4 用正则表达式 编写链接爬虫
- Android手机截屏
- jsoup解析HTML及简单实例
- Office 365系列之八:配置和体验Exchange和Lync