简历解析步骤(第二步)技术与实现(3)识文字,做分类:性别

继上篇文章理论:

简历解析,常见接收到的简历是图片或文档的方式,我们需要先将简历中的文字提取出来,然后再对文字进行算法分析以及AI训练,从而实现解析简历与提高解析度的效果。

先介绍我们整个解析过程和训练过程需要用到的技术:

  1. 文字识别:OCR服务(百度 AI 开放平台:通用文字识别)
  2. 算法(伪代码:不限语言)
  3. AI 机器学习 (ML.NET 或者 Python 一些算法库)

步骤: 第一步:通过文字识别的方式,提取出里面所有有价值的内容(可以转换的所有信息:因为本次讲解都是中文,所以接下来都以解析中文简历来作为例子)第二步:通过算法进行识别,找到符合要求的信息如:姓名、性别、年龄、学历、工作经历等。第三步:将识别出来的信息进行本地存储,然后通过人工去纠正错误,将该版本作为样板,交由机器学习算法进行学习运算,计算出模型。第四步:将得出来的模型再识别简历达到一定的量,再纠错,再交由机器学习算法进行学习运算,反复学习,直至通过率接近 100%。

步骤实现:

第一步:识文字,取信息

细节可以参考上一篇文章

我们写一个简历

获得结果:

第二步:识文字,做分类

我们通过百度云读取出来的文字信息,是一个区域一个区域的字符串。这个时候,我们要将这些字符串做一些分类:基本信息(38项)

#1. 姓名 2. 姓氏 3. 性别 4. 年龄 5. 身高 6. 体重 7. 婚姻状态 8. 出生日期 9. 户口地址 10. 籍贯地址 11. 身份证号 12. 民族 13. 国籍 14. 政治面貌 15. 语言能力 16. 英语水平 17. 计算机水平 18. 博客/主页地址 19. 工作年限 20. 参加工作时间 21. 当前职位(如果没离职:当前公司的职位,如果离职:上一家公司的职位) 22. 当前职能类型 23. 当前单位 24. 所处行业 25. 在职状态 26. 当前薪资 27. 工作地点 28. 工作性质(全职、兼职、实习) 29. 有否海外留学经历 30. 有否海外工作经历 31. 毕业时间 32. 毕业学校 33. 毕业学校类型 34. 所学专业 35. 学历 36. 是否统招

性别分类:(核心代码如下)配合识别出来的文字使用

/// <summary>
///     验证性别
/// </summary>
/// <param name="words">内容</param>
/// <returns></returns>
static List<string> VerificationGender(string words)
{List<string> resultInfo = new List<string>(); ;//情况:性别:X,这种半格式文本情况下,基本可以百分百确定“:”后面是性别if (words.Contains("性别:"))resultInfo.Add(words);if (words.Contains("性别:"))resultInfo.Add(words);if (words.ToLower().Contains("gender:"))resultInfo.Add(words);//情况:XXX,不是半格式文本的情况,我们要通过单字符来确定if (words.ToLower().Contains("male"))resultInfo.Add(words);if (words.Contains("男"))resultInfo.Add(words);if (words.Contains("女"))resultInfo.Add(words);return resultInfo;
}

将识别出来的信息放到上面的函数分类后,得到如下结果

要源码的,评论区留下邮箱,或者加qq群:546496965

简历解析步骤(第二步)技术与实现(3)识文字,做分类:性别相关推荐

  1. 简历解析步骤(第二步)技术与实现(6)识文字,做分类:婚姻状态 、出生日期 、 户口地址 、 籍贯地址

    简历解析步骤(第二步)技术与实现(6)识文字,做分类:婚姻状态 .出生日期 . 户口地址 . 籍贯地址 继上篇文章理论: 简历解析,常见接收到的简历是图片或文档的方式,我们需要先将简历中的文字提取出来 ...

  2. 简历解析步骤(第二步)技术与实现(5)识文字,做分类:身高、体重

    简历解析步骤(第二步)技术与实现(5)识文字,做分类:身高.体重 继上篇文章理论: 简历解析,常见接收到的简历是图片或文档的方式,我们需要先将简历中的文字提取出来,然后再对文字进行算法分析以及AI训练 ...

  3. 简历解析步骤(第二步)技术与实现(8)政治面貌、语言能力、 英语水平、 计算机水平

    简历解析步骤(第二步)技术与实现(8)政治面貌.语言能力. 英语水平. 计算机水平 继上篇文章理论: 简历解析,常见接收到的简历是图片或文档的方式,我们需要先将简历中的文字提取出来,然后再对文字进行算 ...

  4. 简历解析步骤(第二步)技术与实现(9)博客/主页地址

    简历解析步骤(第二步)技术与实现(9)博客/主页地址 继上篇文章理论: 简历解析,常见接收到的简历是图片或文档的方式,我们需要先将简历中的文字提取出来,然后再对文字进行算法分析以及AI训练,从而实现解 ...

  5. 简历解析步骤(第二步)技术与实现(7)识文字,做分类: 身份证号 、 民族 、 国籍

    简历解析步骤(第二步)技术与实现(7)识文字,做分类: 身份证号 . 民族 . 国籍 继上篇文章理论: 简历解析,常见接收到的简历是图片或文档的方式,我们需要先将简历中的文字提取出来,然后再对文字进行 ...

  6. 简历解析步骤(第一步)技术与实现(1)识文字,取信息

    简历解析步骤(第一步)技术与实现(1)识文字,取信息 在上篇文章中,我们讲解了简历解析的理论.一般情况下,我们会以图片或文档的形式收到简历,为了实现解析,首先需要将其中的文本提取出来,然后对文本进行算 ...

  7. 论简历解析及其步骤(一)步骤及理论

    论简历解析及其步骤 简历解析,常见接收到的简历是图片或文档的方式,我们需要先将简历中的文字提取出来,然后再对文字进行算法分析以及AI训练,从而实现解析简历与提高解析度的效果. 先介绍我们整个解析过程和 ...

  8. 简历 解析 技术总结

    最近会将2年前做过的项目中自己负责设计和研发的核心技术--关于简历解析的思路和代码实现发表至此,源码会发布到github上,敬请关注!

  9. java语言开发的万能简历解析,任何简历都可以 规范格式化数据保存入库! - CSDN博客

    Java 无规则简历解析  无规则简历解析demo,写了很多规则,目的就是为了从简历中抓取数据.并不只是姓名,电话,邮箱等数据,而是尽量能做到抓取所有的数据. 说是无规则,其实大多数简历模板也都是有一 ...

最新文章

  1. java中运算符_JAVA中的运算符
  2. 普中开发仪 HC6800EM3-v22光盘资料
  3. UVA 10917 Walk Through the Forest
  4. android datepicker使用方法,android中DatePicker和TimePicker的使用方法详解
  5. 例说C#深拷贝与浅拷贝
  6. LeetCode 04检查平衡性-简单
  7. 关于计算机哪些学校好,计算机哪些学校好
  8. linux usb不识别,求助:USB无法识别
  9. 小学计算机余数在线,余数计算器-余数计算器
  10. 十二种不常见密码及部分实现脚本
  11. 天易成网络管理系统服务器,怎样使用天易成网管软件解决远程开关机的问题
  12. 怎样制作透明底艺术字水印?教你在线制作艺术字的方法
  13. java程序设计--孙鑫java无难事Lesson3《包、类和方法说明符、垃圾回收、接口》
  14. Balsamiq Mockups 入门教程
  15. 森锐读卡器连接不上_蓝牙接收器配对不成功的常见问题和解决方案
  16. mysql数据库基操所遇问题及相关知识及命令记录
  17. 如何正确的对安卓手机进行数据恢复?
  18. Transformer主干网络——DeiT保姆级解析
  19. mysql against包含英文_MySQL-MySQL 全文查找 MATCH AGAINST 模式怎样实现中文多词模糊查找?...
  20. 知识科普系列:关于水下/海底光缆您需要了解的一切

热门文章

  1. Spring 源码解析 - Bean创建过程 以及 解决循环依赖
  2. QGraphicsView QGraphicsScene 增加任意点
  3. STM32学习笔记——GPIO,点灯之路第一步
  4. javaweb:request请求对象(5)
  5. ChatGPT 目前到底能帮助我们程序员做什么?
  6. SQL语句结合后台处理大量数据下的数据导出
  7. c语言程序设计李东明 答案,电磁运动控制系统 李东明.doc
  8. python爬虫需要对象编程吗_Python爬虫基础知识及前期准备
  9. 字体“XX”不支持样式“Regular”。
  10. 数据分析 | Pandas 200道练习题,每日10道题,学完必成大神(2)