简历解析步骤(第二步)技术与实现(9)博客/主页地址

继上篇文章理论:

简历解析,常见接收到的简历是图片或文档的方式,我们需要先将简历中的文字提取出来,然后再对文字进行算法分析以及AI训练,从而实现解析简历与提高解析度的效果。

先介绍我们整个解析过程和训练过程需要用到的技术:

  1. 文字识别:OCR服务(百度 AI 开放平台:通用文字识别)
  2. 算法(伪代码:不限语言)
  3. AI 机器学习 (ML.NET 或者 Python 一些算法库)

步骤: 第一步:通过文字识别的方式,提取出里面所有有价值的内容(可以转换的所有信息:因为本次讲解都是中文,所以接下来都以解析中文简历来作为例子)第二步:通过算法进行识别,找到符合要求的信息如:姓名、性别、年龄、学历、工作经历等。第三步:将识别出来的信息进行本地存储,然后通过人工去纠正错误,将该版本作为样板,交由机器学习算法进行学习运算,计算出模型。第四步:将得出来的模型再识别简历达到一定的量,再纠错,再交由机器学习算法进行学习运算,反复学习,直至通过率接近 100%。

步骤实现:

第一步:识文字,取信息

细节可以参考上一篇文章

第二步:识文字,做分类

我们通过百度云读取出来的文字信息,是一个区域一个区域的字符串。这个时候,我们要将这些字符串做一些分类:基本信息(26项)

#1. 姓名 2. 姓氏 3. 性别 4. 年龄 5. 身高 6. 体重 7. 婚姻状态 8. 出生日期 9. 户口地址 10. 籍贯地址 11. 身份证号 12. 民族 13. 国籍 14. 政治面貌 15. 语言能力 16. 英语水平 17. 计算机水平 18. 博客/主页地址 19. 身体状况 20. 专业 21. 毕业院校 22. 爱好特长 23. 薪资要求 24. qq 25. 邮箱 26. 联系电话

博客/主页地址

博客地址,主页地址,这些都是网址,有以下两种情况:

  1. 域名:xxx.xxx.com,这种规律就是有 . 三个点
  2. IP:xxx.xxx.xxx.xxx,这种规律就是有 . 四个点

两种情况都有可能加 http 或 https,

/// <summary>
///     验证博客/主页地址
/// </summary>
/// <param name="words">内容</param>
/// <returns></returns>
static List<string> VerificationBlog(string words)
{List<string> resultInfo = new List<string>();// 情况:计算机水平:X,这种半格式文本情况下,基本可以百分百确定“:”后面是计算机水平if (words.Contains("http"))resultInfo.Add(words);if (words.Split('.').Count() >= 3)resultInfo.Add(words);return resultInfo;
}

要源码的,评论区留下邮箱

简历解析步骤(第二步)技术与实现(9)博客/主页地址相关推荐

  1. 简历解析步骤(第二步)技术与实现(6)识文字,做分类:婚姻状态 、出生日期 、 户口地址 、 籍贯地址

    简历解析步骤(第二步)技术与实现(6)识文字,做分类:婚姻状态 .出生日期 . 户口地址 . 籍贯地址 继上篇文章理论: 简历解析,常见接收到的简历是图片或文档的方式,我们需要先将简历中的文字提取出来 ...

  2. 简历解析步骤(第二步)技术与实现(5)识文字,做分类:身高、体重

    简历解析步骤(第二步)技术与实现(5)识文字,做分类:身高.体重 继上篇文章理论: 简历解析,常见接收到的简历是图片或文档的方式,我们需要先将简历中的文字提取出来,然后再对文字进行算法分析以及AI训练 ...

  3. 简历解析步骤(第二步)技术与实现(3)识文字,做分类:性别

    简历解析步骤(第二步)技术与实现(3)识文字,做分类:性别 继上篇文章理论: 简历解析,常见接收到的简历是图片或文档的方式,我们需要先将简历中的文字提取出来,然后再对文字进行算法分析以及AI训练,从而 ...

  4. 简历解析步骤(第二步)技术与实现(8)政治面貌、语言能力、 英语水平、 计算机水平

    简历解析步骤(第二步)技术与实现(8)政治面貌.语言能力. 英语水平. 计算机水平 继上篇文章理论: 简历解析,常见接收到的简历是图片或文档的方式,我们需要先将简历中的文字提取出来,然后再对文字进行算 ...

  5. 简历解析步骤(第二步)技术与实现(7)识文字,做分类: 身份证号 、 民族 、 国籍

    简历解析步骤(第二步)技术与实现(7)识文字,做分类: 身份证号 . 民族 . 国籍 继上篇文章理论: 简历解析,常见接收到的简历是图片或文档的方式,我们需要先将简历中的文字提取出来,然后再对文字进行 ...

  6. 简历解析步骤(第一步)技术与实现(1)识文字,取信息

    简历解析步骤(第一步)技术与实现(1)识文字,取信息 在上篇文章中,我们讲解了简历解析的理论.一般情况下,我们会以图片或文档的形式收到简历,为了实现解析,首先需要将其中的文本提取出来,然后对文本进行算 ...

  7. 如何解析自己的域名到博客主页

    在写简历的时候想写上自己的博客,但是发现博客主页的域名太长太不容易记住了 CSDN有自定义域名的功能,是一个三级域名的形式 感觉还不错,但是输入后发现需要会员才可以!!!Org- 然后发现博客6级也可 ...

  8. SpringBoot技术栈搭建个人博客【项目准备】

    前言:很早之前就想要写一个自己的博客了,趁着现在学校安排的实习有很多的空档,决定把它给做出来,也顺便完成实习的任务(搞一个项目出来...) 需求分析 总体目标:设计一套自适应/简洁/美观/易于文章管理 ...

  9. 作为技术人员,写博客对我们到底有什么好处?为什么要写博客?

    看到一篇好文,是关于技术人员写博客的分析,觉得不错,给大家分享一下: 作为程序员,坚持写博客对我们有什么好处?

最新文章

  1. strchr strstr函数php,PHP字符串函数之 strstr stristr strchr strrchr
  2. 福布斯发布2019全球品牌价值100强:华为上榜苹果夺冠
  3. 人脸识别安全吗?调查称六成受访者认为技术有被滥用趋势
  4. 阿里巴巴成立云原生技术委员会,云原生升级为阿里技术新战略
  5. JavaScript教程——JavaScript 的基本语法(标识符)
  6. CodeForces 7D Palindrome Degree 字符串hash
  7. 千方科技的中场战事:选择、进化与野望
  8. 风阻能发电装置叶片的动力学仿真
  9. sas入门之(三)条件语句,循环语句,input语句
  10. node.js 安装详细步骤教程
  11. 植被净初级生产力(NPP)的计算
  12. ie不能加载flash html,IE浏览器无法显示Flash怎么解决?解决的方法介绍
  13. celery英语,celery英语_celery什么意思_celery用法翻译_celery英语读音_解释 - 英语宝典...
  14. 超实用的Mac风扇控制系统:Macs Fan Control Pro mac中文版
  15. 黄金比例编程python_python实现黄金分割法
  16. 光滑曲线_计算机图形学十:贝塞尔曲线与贝塞尔曲面
  17. 【网络编程实践】2.4.2 muduo库安装与 procmon 编译
  18. c# ListView增加条目
  19. ArcGIS官方帮助文档和教程整理
  20. PHP人民币小写数字转大写中文

热门文章

  1. fun在matlab里面啥意思_下面是个MATLAB程序,请问fun,和feval,是什么,如何写fun,如何代表这个函数...
  2. gitlab 挖矿病毒处理
  3. python aes new_填充不正确。AES Python加密
  4. 保证金,杠杆和风险限额委托种类
  5. SpringBoot 系列教程(六十):SpringBoot整合Swagger-Bootstrap-Ui
  6. 【JS】设计并实现“恺撒密码”
  7. 三相三线STATCOM仿真模型。无功电流采用ipiq检测,pwm采用滞环控制。
  8. LTE自学指南-孙宇彤-专题视频课程
  9. 论 SPI 架构(hw+sw) --- Linux kernel 实现欣赏
  10. RSS2.0简单介绍.