作者:https://ai.baidu.com/forum/topic/show/945112
一、需求描述:

信息智能化时代,大部分中小企业都用上了ERP等办公软件,数字化纸质内容,软件化管理数据,做到无纸化办公。但仔细观察,中小企业还是有一些工作流程可以进行改进的。

例如,公司进行人员应聘时,都是先打印应聘表格,然后让应聘人员填写内容,最后由文员将应聘表格的内容输入到ERP系统内。其中,文员将应聘内容输入到ERP系统内,这个步骤是相当耗时费力的,如果当天应聘人员比较多,那将花费文员大量的时间去输入应聘信息。

如果能够利用百度的手写文字识别功能,结合【IOCR自定义模板文字识别】,智能识别应聘表格内容,并将识别结果填入对应的软件、或是生成相应的EXCEL等电子文档,那么文员只需要校对一下识别的内容是否正确,就能一键保存/导入,很快的做好应聘信息录入工作,大量减轻文员的录入工作。

以此类推,像请假条、办公采购单,员工日工资明细等一些表格都可以通过百度手写文字识别的方法来进行智能识别,极大降低文员的工作量,提高文员的工作效率。

此外,在个人应用方面,可以将个人的会议纪要,演讲稿等使用【手写文字识别】功能,数字化内容存储起来,可以结合【百度网盘】实现永久保存。像文字工作者,有些习惯用笔记录的、不习惯用电脑打字的,到时候都可以采用【手写文字识别】功能,将文字数据化,稍微整理再上传到相应的平台上去。

另外,在学校应用方面,教师批改学生作文,是一件耗时耗力的事情,学生的笔迹各不相同,有时候单单识别学生文字内容就很耗心力,这样的话,教师往往花费了很大的精力在识别学生文字上去。如果采用【手写文字识别】功能,将作文数字化,统一成标准文字,再用采取一些【护眼模式】等方法显示,就大大方便教师阅读修改,减轻教师的阅读作文所消耗精力,更加专注于作文思想内容、发现好文章,如果可行,甚至可以尝试将这个方法运用到全国的高考作文改卷中去。

二、应用价值:

1、利用百度【手写文字识别】功能,结合【IOCR自定义模板文字识别】,AI前后文判断智能纠错等功能,可大大降低文员文字录入工作量,提高文员工作效率,适合大部分中小企业。

2、如果能将【手写文字识别】功能离线化,或者可以单独部署到企业自己的服务器上去,那将具有更大的应用前景。

3、利于百度【手写文字识别】功能,数字化个人/专业文字工作者的演讲稿、笔记等,并结合【百度网盘】等实现永久保存。

4、可以尝试将【手写文字识别】运用到学生的作文批改中去,让教师更加专注于作文的思想内容、发现好文章,甚至推广到全国的高考作文改卷中去,这样不仅减轻了教师的作文批改工作压力,同时也能发现更多有思想、有内涵的好文章。

三、使用攻略

说明:本文采用C# 语言,开发环境为.Net Core 2.1。

1、平台接入

具体接入方式比较简单,可以参考度友爱小妞宝的帖子,可参考到【创建应用程序】这一步骤(主要获取APPID等信息,调用时会用的),后面的使用由于我是采用.Net Core 平台的C#、SDK方案,故有些不同,有时间的话,我会另写一个教程出来:https://ai.baidu.com/forum/topic/show/867951 (感谢度友爱小妞宝)

2、接口调用说明

文字识别接入官方说明文档(C#,SDK方案):https://ai.baidu.com/docs#/OCR-Csharp-SDK/top

(1)接口描述

对手写中文汉字、数字进行识别。

(2)安装文字识别 C# SDK

方法一:使用Nuget管理依赖 (推荐)

在NuGet中搜索 Baidu.AI,安装最新版即可。

packet地址 https://www.nuget.org/packages/Baidu.AI/

方法二:下载安装

文字识别 C# SDK目录结构

Baidu.Aip
├── net35
│ ├── AipSdk.dll // 百度AI服务 windows 动态库
│ ├── AipSdk.xml // 注释文件
│ └── Newtonsoft.Json.dll // 第三方依赖
├── net40
├── net45
└── netstandard2.0
├── AipSdk.deps.json
└── AipSdk.dll
1.在官方网站下载C# SDK压缩工具包:http://ai.baidu.com/sdk#ocr

2.解压后,将 AipSdk.dll 和 Newtonsoft.Json.dll 中添加为引用。

(3)新建交互类

// 设置APPID/AK/SK
var APP_ID = “你的 App ID”;
var API_KEY = “你的 Api Key”;
var SECRET_KEY = “你的 Secret Key”;

var client = new Baidu.Aip.Ocr.Ocr(API_KEY, SECRET_KEY);
client.Timeout = 60000; // 修改超时时间

(4)调用代码

public void HandwritingDemo() {
var image = File.ReadAllBytes(“图片文件路径”);
// 调用手写文字识别,可能会抛出网络等异常,请使用try/catch捕获
var result = client.Handwriting(image);
Console.WriteLine(result);
// 如果有可选参数
var options = new Dictionary{
{“recognize_granularity”, “big”}
};
// 带参数调用手写文字识别
result = client.Handwriting(image, options);
Console.WriteLine(result);
}

(5)返回示例

{
“log_id”: 620759800,
“words_result”: [
{
“location”: {
“left”: 56,
“top”: 0,
“width”: 21,
“height”: 210
},
“words”: “3”
}
],
“words_result_num”: 1
}

四、示例关键代码

1、前台.cshtml 页面布局关键代码

由于html代码无法原生显示,只能简单说明一下:

主要是一个form表单,需要设置属性enctype=“multipart/form-data”,否则无法上传图片;

form表单里面有两个控件:

一个Input,type=“file”,上传图片用;

一个Input,type=“submit”,提交并返回识别结果。

2、后台.cshtml.cs调用关键代码
[BindProperty]
[Required]
public IFormFile FileUpload { get; set; }
private readonly IHostingEnvironment HostingEnvironment;
public List msg = new List();
public string curPath { get; set; }

    public async Task OnPostHandwritingAsync(){msg = new List();// Perform an initial check to catch FileUpload class attribute violations.if (!ModelState.IsValid){return Page();}string webRootPath = HostingEnvironment.WebRootPath;//wwwroot目录var fileDir = Path.Combine(webRootPath, "服务器图片保存相对位置,如://BaiduPicture//");if (!Directory.Exists(fileDir)){Directory.CreateDirectory(fileDir);}string extension = Path.GetExtension(FileUpload.FileName);string imgName = Guid.NewGuid().ToString("N") + extension;var filePath = Path.Combine(webRootPath, "服务器图片保存相对位置,如://BaiduPicture//", imgName);curPath = Path.Combine("服务器图片相对位置(需要在 Startup.cs 文件中的 Configure()中先进行设置,开启虚拟目录映射功能),如:/BaiduPicture/", imgName);using (var fileStream = new FileStream(filePath, FileMode.Create, FileAccess.Write)){await FileUpload.CopyToAsync(fileStream);}// 设置APPID/AK/SKvar client = new Baidu.Aip.Ocr.Ocr("你的 Api Key", "你的 SECRET Key");var image = System.IO.File.ReadAllBytes(filePath);// 调用手写文字识别, 图片参数为本地图片,可能会抛出网络等异常,请使用try/catch捕获var result = client.Handwriting(image);//手写文字识别List msgList = result["words_result"].ToList();msg.Add("手写文字识别结果:\n");foreach (JToken ms in msgList){msg.Add(ms["words"].ToString());}return Page();}

五、效果测试
1、页面:

2、识别结果:

(2)

说明:因为攻略主要介绍如何使用手写文字识别功能,所以对文字处理这块不进行深入操作。如果想进一步提高识别结果,可以采取将识别结果输出为字符串,然后使用正则表达式提取相应的文字内容,或者进一步导出为EXCEL文件等。

六、改进建议

1、存在的问题:

(1)部分内容,正常情况下,应该将其识别为两条记录的,结果最后变成了一条记录,特别是【文字-数字-文字-数字】这样的行信息组合的时候,如果文字、数字的距离较近,很容易将数字和文字识别在一起了,需要改进。

(2)再如像“娘”这样偏旁部首是单独的字组成的字时,会识识别成“女良”两个字,这点也需要改进。(感谢度友134******14的提醒)

(3)目前对稍微潦草的字迹识别率还不是很高,需要改进。

由于计算机、手机等电子设备的普及,大部分人都习惯了打字,手写情况大大减少,由此导致很大一部分人写的字龙飞凤舞,比较难以识别(我写的字就很潦草,有时候连自己都无法认出来。。。),而且目前来说,中小企业应聘人员的综合教育水平普遍较低(普工招的比较多),有的甚至不会写字,所以导致手写文字各种各样。经过测试,百度手写文字识别能力虽然比较优秀了,但是离真正应用到实际工作中去还是有一定的距离的。

2、改进建议

(1)结合【IOCR自定义模板文字识别】功能,智能识别模板内容,格式化提取内容,方便开发人员调用(目前好像已支持手写数字识别,希望能更快增加支持手写文字识别)。

(2)如果能格式化输出内容,或一键导出EXCEL电子文档等功能,则更加方便跟EPR等软件的对接。

(3)可以运用AI技术,结合前后文智能识别错别字,修正错误或语句问题,提高识别结果。

(4)若能将【手写文字识别】功能离线话,或可以部署到企业自己的服务器上去,会有更多的企业愿意尝试,也能将【手写文字识别】功能运用到【财务报表】等保密性要求较强的方向中去。

(5)将【手写文字识别】和【百度网盘】、【护眼模式】等工具结合起来,实现个人/专业文字工作者的笔记、演讲稿、作文等内容的数字化存储,方便观看阅读。

接入百度大脑手写文字识别为企业降本增效相关推荐

  1. 百度AI攻略:手写文字识别

    1.功能描述: 支持对图片中的手写中文.手写数字进行检测和识别,针对不规则的手写字体进行专项优化,识别准确率可达90%以上 2.平台接入 具体接入方式比较简单,可以参考我的另一个帖子,这里就不重复了: ...

  2. 【python】调用百度智能云API实现手写文字识别

    注:本文系湛江市第十七中学星火创客团队及岭南师范学院物联网俱乐部原创部分参赛项目,转载请保留声明 文章目录 调用百度智能云API实现python识别手写文字 一.准备工具 电脑端准备: 1.pytho ...

  3. java文字手写识别_【手写文字识别】-JavaAPI示例代码

    手写文字识别-JavaAPI示例代码 不知不觉手写文字识别百度已经开始邀测了.需要的小伙伴去申请了哦.申请方式加入文字识别群找PM.或者工单提交申请.都要说明自己的APPID哦. 接口地址:https ...

  4. 手写文字识别软件哪个好?安利这三款

    随着人工智能技术的不断发展,手写文字识别技术也被广泛应用于各个领域.手写文字识别软件可以帮助人们快速输入和编辑手写文字,提高文字处理效率和准确性.例如,在智能阅卷方面,手写文字识别软件可以帮助老师们快 ...

  5. 使用kNN算法实现简单的手写文字识别

    0. 介绍 kNN,即k-Nearest Neighbor(k近邻算法), 简介可参考KNN的一些总结. 本文是<机器学习实战>一书第二章的例子, 主要利用kNN实现简单的手写文字识别. ...

  6. Keras深度学习实战(37)——手写文字识别

    Keras深度学习实战(37)--手写文字识别 0. 前言 1. 手写文字识别相关背景 1.1 Connectionist temporal classification (CTC) 1.2 解码 C ...

  7. 手写文字识别的使用软件

    手写文字怎么进行识别,手写文字识别用什么软件比较简单?想要将大家手中的手写文字识别有一种比较简单的方法,我们可以使用迅捷PDF在线转换器来操作,下面就是小编为大家介绍的转换过程. 步骤一:先将自己的手 ...

  8. 识别连笔字的软件_在线手写文字识别软件快速代抄

    隶书教程隶书教程吴先生经过仔细排比研究,得出那样的科学论据来,作为学术上篆.隶的不同定名的分野,自然是很值得重视的.不过还有两个问题想要问,那就是∶一,篆书也不能够个个是象形字,一开始就有象形以外的许 ...

  9. Tesseract Ocr文字识别实战(新版本,扩展手写文字识别)

    目录 1.Tesseract Ocr文字识别 1.1 运行环境 1.2 python模块 1.3 配置tesseract运行文件 1.4 代码识别 2. 手写汉字识别 2.1 下载库 2.2 代码 1 ...

最新文章

  1. Re: 求助:5道算法题
  2. 5个基本概念,从统计学到机器学习
  3. linux kill信号列表
  4. c# 获取cad文档的路径_C# 打开以对话框,获取文件夹路径 、文件的路径、文件名...
  5. 如何通过 Linq 将集合拆成多个块?
  6. C++和Rust_Kotlin、Rust两个充满了骚操作的编程语言,值得一玩
  7. matlab2c使用c++实现matlab函数系列教程-blkdiag函数
  8. Juggling Life and Learning
  9. 结构体里数组的初始化
  10. 新西兰梅西大学计算机专业研究生,新西兰梅西大学硕士读几年,新西兰专升硕 | 能进八大,还有机会移民,最快1.5年完成!...
  11. JetBrain Clion下载安装及配置环境
  12. openstack 单元测试助手tox
  13. Windows11微软官方网址下载地址(2021年11月更新)
  14. Android 亮度调节
  15. JavaScript中的LHS和RHS查询
  16. Apache Spark 3.0 预览版正式发布,多项重大功能发布
  17. MIMIC-III数据库的介绍
  18. 面试题: -- 11.02.24
  19. centos 安装miniconda
  20. 说说12306.cn铁路订票网站

热门文章

  1. Node.js仓储管理系统的设计与实现 计算机毕设源码24296
  2. Android View体系(4)
  3. 小红书商业笔记与普通笔记区别是什么?小红书笔记有哪几种
  4. 系统学习Python——单元测试unittest:批量执行测试文件
  5. 【Oracle】ORA-00911:无效字符
  6. 益智游戏网开发之路一(网址yzyx.info)
  7. Linux —— 时间(date设置系统时间)
  8. golang全局变量
  9. Android四大基本组件详解-Activity,BroadcastReceiver,Service及ContentProvicer
  10. 网络安全漏洞分析与漏洞复现