郭一璞 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

在电影《大侦探福尔摩斯》中,福尔摩斯能够根据两个英文字母的笔迹,判断书写者的才能与性格特点,识破对手的伪装。



如此神奇的笔迹理论听起来像是玄学,恐怕只能在小说电影中出现。现实社会中,利用笔迹来破案倒不是一件稀罕事。

但是,你听说过AI也能判断笔迹了么?



一个跨国研究团队通过机器学习的算法,让机器从英文手写的字迹中判断书写者来自中国、印度、马来西亚、孟加拉国和伊朗中的哪个国家。

这个团队包含中国、印度和马来西亚研究人员,其中两名中国研究者分别来自河海大学和南京大学。

亚洲五国英文书法

这项研究的基础是来自中国、印度、马来西亚、孟加拉国、伊朗五个国家的数据集。

研究者们找了每个国家100份英文书写文本,总共500份数据。



正如上图的例子所示,每个国家的人写英文风格都有所不同。

比如,中国人写英文就像写汉字,横平竖直,尤其是在“f”、“l”、“d”这些字幕上,竖着的笔画顶天立地一般。

而印度人和孟加拉人写的英文则完全不同,就像绣花一样,笔画圆润、上下起伏明显。

于是,他们根据笔画的特征,设计了下面这样一套方法:



降噪后提取笔画线条,识别字体数据的四种特征:距离因素、主成分分析(PCA Direction)、通过Cloud of Line Distribution软件进行的线分布特征、描边特征,通过分类器判断属于五个国家的哪一种。

Cloud of Line Distribution(COLD)是一个分析笔画的软件,可以分解单个字母,测量笔画的垂直度和弯曲度,进而判断写字者的国别。



五国人书写的英文描边特征有巨大的区别。



而通过COLD分析笔迹关键点,可以变为极坐标系的展示形式,而五国笔迹的极坐标系图有巨大差别:



综合所有特征,五国笔迹就有了他们特有的矢量特征:



准确率比前人算法翻倍

在最后的测试中,这套方法的确识别出了不少各种各样的字体:



研究者们统计了一下这个方法的准确率:



上图中,下面的表格是前人研究的方法测试结果,可以看出,针对数据集中的每个国家,笔迹识别准确率都在40%左右,没有过半;

上方的表格则是这次研究者们的测试结果,每个国家的笔迹识别准确率都在60%以上,平均达到了75%。

识别笔迹的国家到底有什么用?

75%的准确率并不是一个多么好看的数字,何况这是仅仅建立在5个国家的基础上的。

毕竟,人们对这项技术的应用还有疑虑。或许它可以用在刑侦领域,以字迹结合人脸识别、生物识别等技术来判断犯罪,但字迹的识别只能作为参考,有误判的可能性。

不过,字迹作为个人的数据也可以被用来做营销。想想去银行填单子的时候留下了多少字迹,或许他们就会用字迹判断国家,进而给你推送理财产品呢。

论文传送门

A New COLD Feature based Handwriting Analysis for Ethnicity/Nationality Identification
作者:Sauradip Nag, Palaiahnakote Shivakumara, Wu Yirui, Umapada Pal, Tong Lu
Comments: Accepted in ICFHR18
arXiv: https://arxiv.org/abs/1806.07072

加入社群

量子位AI社群18群开始招募啦,欢迎对AI感兴趣的同学,加小助手微信qbitbot8入群;

此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。

进群请加小助手微信号qbitbot8,并务必备注相应群的关键词~通过审核后我们将邀请进群。(专业群审核较严,敬请谅解)

实习生招聘

量子位正在招募活动运营实习生,策划执行AI明星公司CEO、高管等参与的线上/线下活动,有机会与AI行业大牛直接交流。工作地点在北京中关村。简历欢迎投递到quxin@qbitai.com

具体细节,请在量子位公众号(QbitAI)对话界面,回复“实习生”三个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

AI说:你的书法有咖喱味丨看字识国别相关推荐

  1. 浓浓的咖喱味,你闻着了吗?

    我用360极速版访问你的德妃时, 出现的是纯纯的文本页.感受到了良好的咖喱味,你们闻着了吗? 看,360极速版,你不是小内存吗? 好,我就把你所有其他页一会儿不看的,就全丢掉,你看过来看过去,他就加载 ...

  2. 欧洲AI规范先行,值得肯定与借鉴 --- 我看欧盟发布AI道德规范

    欧洲AI规范先行,值得肯定与借鉴 --- 我看欧盟发布AI道德规范 [事件回放] 近日,据外媒报道,欧盟委员会(EC)任命的人工智能高级专家小组发布了AI开发和使用的道德草案,内容长达37页,提出可信 ...

  3. 樊登读书搞定读后感_《读懂一本书:樊登读书法》_精选读后感_500字

    <读懂一本书:樊登读书法>_精选读后感500字 樊登老师大名鼎鼎,但我之前没读过他的书.这本书读完,乘着记忆力还没完全遗忘整理一下笔记. 我以前读完一本书,至少会整理一段笔记.但从今年五月 ...

  4. 各位集美兄得看过来! 利用AI给青春有你2的选手们做数据分析挖掘(三):看图像识选手

    各位集美兄得看过来! 利用AI给青春有你2的选手们做数据分析挖掘(一):爬虫选手信息 各位集美兄得看过来! 利用AI给青春有你2的选手们做数据分析挖掘(二):统计并展示数据 各位集美兄得看过来! 利用 ...

  5. 深度丨中科院田捷博士:基于医疗大数据和AI技术的影像组学及其应用丨CCF-GAIR 2017...

    7月9日,在由中国计算机学会(CCF)主办,雷锋网.香港中文大学(深圳)联合承办的CCF-GAIR 全球人工智能与机器人峰会的第三天,在未来医疗专场上,田捷博士做了"基于医疗大数据和人工智能 ...

  6. 万恶的咖喱味英文口音

    有没有JAVA技术了得,core java基本功扎实,且英文好能听印度口音的大哥? 天津顶级外资银行

  7. 2023年中国AI论文影响力超越美国?网友:长期看,数量不等于质量

    转载自:机器之心 有研究统计,中国在人工智能研究方面的影响力正在逼近美国. 2017 年,中国宣布计划到 2030 年成为 AI 领域的世界领导者.2019 年 3 月,艾伦人工智能研究所(AI2)S ...

  8. 看下巴识心情,这个AI项链挂胸前也能识别面部表情

    兴坤 发自 凹非寺 量子位 报道 | 公众号 QbitAI 瞄一瞄你的下巴,就知道你有没有在难过. 这个温馨的场景对应的不是窝在怀里的小猫咪,而是-- Neck Face,一款用于监控情绪的智能工具. ...

  9. MIT:这双AI袜子,暴露了你的行动丨Nature子刊

    萧箫 发自 凹非寺 量子位 报道 | 公众号 QbitAI 你的行动,全都在这双袜子的掌控之中: 无论是单脚站立.还是扭腰.走路,这双袜子都能通过脚上压力的变化,来预测你的行动: 最关键的是,材料制造 ...

最新文章

  1. Anaconda安装包报错——UnavailableInvalidChannel: The channel is not accessible or is invalid
  2. spring各种邮件发送
  3. 【设计模式之单例模式InJava】
  4. Spring MVC 验证码
  5. 100条常用写作谚语(1)(2)(3)(4)
  6. c/c++笔试面试题(1)
  7. SharePoint 2013 Step by Step——使用自定义的List Template
  8. 【5分钟paper】基于强化学习的策略搜索算法的自主直升机控制
  9. 洛谷 P1129 BZOJ 1059 cogs 660 [ZJOI2007]矩阵游戏
  10. 林锐的《高质量编程》学习笔记——内存分配方式
  11. C# 控制台应用程序
  12. 两台计算机怎么ping通,怎么ping网络(2个网段电脑怎么ping通)
  13. Acwing第741题(斐波那契数列)
  14. 获取邮箱验证码倒计时+PHP发送QQ邮件(未全)
  15. ftp服务器文件保存位置,ftp服务器和文件保存路径
  16. 帝国CMS安全设置大全
  17. 一个基于igv.js实现的python脚本,实现简单的网页版IGV
  18. 微店小程序、微店系统怎么开发,流程步骤_OctShop
  19. 北京linux学习 哪好呢?
  20. 《算法竞赛入门经典》 习题 4-1 (Xiangqi, ACM/ICPC Fuzhou 2011, UVa1589,hdoj_4121)

热门文章

  1. 摩托罗拉再裁员!仍坚守模块化手机业务
  2. 人事管理系统整站php,卡盟整站程序源码 php版
  3. sp烘焙流程_烘焙工作流程图
  4. 试述计算机控制系统的大致组成,试述工业计算机控制系统的组成及应用
  5. 字节跳动算法工程师总结:java资料文件
  6. python r语言接口_R语言,python接口rpy2安装的问题
  7. php csv文件内容加粗,PHP强化之10 - CSV文件处理
  8. 1725.可以形成最大正方形的矩阵数目
  9. php页面重定向到html,javascript-页面重定向(PHP,HTML)
  10. linux重启网卡提示tent,linux