博客第一篇文章,稍作修改,增加文字介绍


  开发目的

    最近由于某些需求,需要在Android手机端实现OCR功能,大致为通过手机照相,识别出相片中的中文信息字段。但是由于新手光环+流程不熟悉,遇到了各种各样的问题,准备在本文中叙述一下,最好能派上用场。

  开发环境

    Android studio 2.3.3  Windows下,测试手机Android4.4版本

  环境搭建

    搭建安卓OCR开发环境. 

    使用的google提供的OCR识别引擎,可以选择多种语言。

    参考上述链接可以实现,最开始的搭建。这里需要注意的是:由于GitHub上的工程与当前新建的Gradle版本不匹配,导致android-maven错误,注意添加依赖。

  大文件拷贝

    由于OCR训练好的文件比较大,以中文识别为例,50MB左右大小,需要将文件放置于手机的SD卡中,便于TessBaseApi对象初始化。(init()函数需要文件路径,目前没想到更好的方式)。

  本文提出的解决方式:首先将chi_sim.traineddata文件放入asset文件夹中。在程序首次运行的时候,将文件拷贝到SD卡中,注意获取SD卡读写权限。拷贝函数如下:

  加入相机

  以上步骤顺利的话,可以实现对图片的文字进行识别功能。为了实现对照相机得到的相片进行识别,需要打开摄像机。

Intent getImageByCamera = new Intent(MediaStore.ACTION_IMAGE_CAPTURE);
startActivityForResult(getImageByCamera,REQUST_ORIGINAL);

  REQUST_ORIGINAL是自己定义的常量值,用于接收时,与requestcode值比对,判断是否为需要的数据。

  

 1 @Override
 2     protected void onActivityResult(int requestCode, int resultCode, Intent data) {
 3         super.onActivityResult(requestCode, resultCode, data);
 4          if (resultCode == Activity.RESULT_OK && requestCode == REQUST_ORIGINAL){
 5           Bundle bdl = data.getExtras();
 6             Bitmap bmp = (Bitmap) bdl.get("data");
 7             ImageView im_camera = (ImageView)findViewById(R.id.img_camera);
 8             im_camera.setImageBitmap(bmp);
 9             mTess.clear();
10             mTess.setImage(bmp);
11             String result = mTess.getUTF8Text();
12             TextView txtget = (TextView)findViewById(R.id.txt_get);
13             txtget.setText(result);
14         }
15 }

  在回调函数里,处理返回的图片数据,就可以实现初步的图片文字识别。但是这样返回的图片数据为缩略图,清晰的很低。如果想要对原始图片进行处理的话,需要换一种图片获取的方式。

首先,调用相机的时候,添加图片为文件存储的路径。

 1  Intent getImageByCamera = new Intent(MediaStore.ACTION_IMAGE_CAPTURE);
 2         Uri uri;
 3         if(Build.VERSION.SDK_INT>=24)
 4         {
 5             File g= new File(picPath);//测试错误
 6             try {
 7                 g.createNewFile();
 8             } catch (IOException e) {
 9                 e.printStackTrace();
10             }
11             uri = FileProvider.getUriForFile(this,"xueyu404",g);
12         }else{
13             uri = Uri.fromFile(new File(picPath));
14         }
15
16         getImageByCamera.putExtra(MediaStore.EXTRA_OUTPUT,uri);
17         startActivityForResult(getImageByCamera,REQUST_ORIGINAL);

  PicPath为String变量,意义为相机图片在sd卡上的存储路径。然后在回调函数里对图片进行处理。

由于Android 7.0在跨应用数据调用增加了限制,需要使用FileProvider获取uri,具体FileProvider配置参考一下链接

http://blog.csdn.net/hehe26/article/details/52921056

 1 if (resultCode == Activity.RESULT_OK && requestCode == REQUST_ORIGINAL){
 2             FileInputStream fis = null;
 3             try{
 4                 Log.e("sdpath2",picPath);
 5                 fis = new FileInputStream(picPath);
 6                 Bitmap bm = BitmapFactory.decodeStream(fis);
 7                 ImageView im_camera = (ImageView)findViewById(R.id.img_camera);
 8                 im_camera.setImageBitmap(bm);
 9                 mTess.setImage(bm );
10                 String result = mTess.getUTF8Text();
11                 TextView txtget = (TextView)findViewById(R.id.txt_get);
12                 txtget.setText(result);
13             }catch (FileNotFoundException e){
14                 e.printStackTrace();
15             }finally {
16                 try {
17                     fis.close();
18                 } catch (IOException e) {
19                     e.printStackTrace();
20                 }
21             }
22         }
23         else {
24             Toast.makeText(this,"没有拍到照片",Toast.LENGTH_SHORT).show();
25         }

    运行效率

    通过上述的过程,可以完成,基本的文字识别的功能。但仍然存在着不能忽略的问题。

    一,使用缩略图进行识别的时候,运行速率可以接受,对于特别大的文字识别还可以。但是由于图片被压缩过,如果图片中存在比较小的文字基本不能识别。

    二,使用后面提到的原始图片进行识别的话,由于手机的计算能力有限,识别的计算过程相当耗时。识别过程要放到另外的线程中单独运行,否则会卡死UI线程,假死。但是即使新建线程,需要的时间也远超用户的忍耐限度。

    改进优化

    由于图片原图比较大的原因,对整个图片进行识别的效果也不理想。所以本文建议在拍摄照片之后,用户用手指圈定识别区域文字。圈定区域 的控件,见我的另外一篇博客

    Android 通过触摸动态地在屏幕上画矩形

    此外,识别过程,控件初始化过程比较耗时,放置在UI线程中卡顿不可忍耐。本文采用线程池的方式,处理上述两个过程。

    最终效果图

    

      先点击相机拍照按钮,拍要识别的照片,再点击选取区域按钮,用手指画一个矩形框,圈好识别区域(如果矩形没画好可以再点击选取区域重新画),

最后点击文字识别等待结果显示。

工程代码链接:https://github.com/dutxueyu/Android_ocr_app

  

转载于:https://www.cnblogs.com/xueyudlut/p/7156218.html

Android studio ocr初级app开发问题汇总(含工程代码)相关推荐

  1. Android Studio安装与App开发步骤详解

    环境准备 使用的软硬件具体如下: Windows 7 Android Studio 3.3.2[简称:AS,从官网可以下载,或者使用低版本升级:help->check for update] J ...

  2. android获取其他app布局,Android Studio查看其它APP的布局结构

    概述 日常使用别家的APP过程中,会遇到一些比较好看的布局,这时候我们就想学习一下别人的布局结构,以便参考. (1)手机连接电脑.设置手机为USB调试模式 (2)运行Android Studio,打开 ...

  3. Android Studio 更换/设置App应用图标Icon

    Android Studio 更换/设置App应用图标Icon 刚开始接触Android Studio,用C++.Java编程做一个小的App,心血来潮想要换掉默认的安卓应用图标和应用名称,在经历一番 ...

  4. Android Studio入门(安装--开发调试)

    写在前面的话:本文来源:http://blog.csdn.net/yanbober/article/details/45306483 目标:Android Studio新手–>下载安装配置–&g ...

  5. Android Studio 教程:入门开发第一个程序

    Android Studio 教程:入门开发第一个程序 2018.09.11 14:30 16005浏览 开发第一应用 可以开发属于自己的应用,是否有点小激动?好吧!让我们开始,首先点击Start a ...

  6. 基于Android平台的记事本软件(Android Studio项目+报告+app文件)

    移动应用开发技术 期末考核报告 题   目:        基于Android平台的记事本软件             学生姓名     学生学号                           ...

  7. Android Studio与夜神模拟器开发调试

    什么是夜神模拟器? 夜神模拟器是北京多点在线科技有限公司开发的一款Android手机游戏模拟器, 运行速度快,使用方便,是一款PC平台玩手游,助攻Android开发的利器 使用Android Stud ...

  8. 基于Android studio的备忘录app设计

    系统使用Android studio开发平台开发,使用sqlite数据库进行数据存储. 功能如下: 注册登录 管理备忘信息(增删查改) 根据备忘录创建时间快速查询 基于Android studio的备 ...

  9. 利用Android Studio快速搭建App

    大家好,我是烤鸭: 给大家分享一个简单的用Android Studio快速搭建app 工具: Android Studio 64位 专业版 插件: Datepicker Timepicker okht ...

最新文章

  1. 触摸矫正+android,android触摸矫正解方程
  2. 详解|清华大学100页PPT:工业机器人技术详解
  3. 如果禁用了cookie 怎么传session
  4. Redis 到底是怎么实现“附近的人”这个功能的?
  5. 信号回勾产生的原因_电力电缆故障原因及常用检测方法
  6. 广度优先搜索生成树怎么画_图的深度优先遍历与广度优先遍历以及最小生成树...
  7. dpkg ihr状态_考勤机数据无法同步
  8. 基于JAVA+Servlet+JSP+MYSQL的旅游酒店机票预订管理系统
  9. nginx 使用自定义 log_format 以及输出自定义http头
  10. stm32矩阵键盘学习笔记
  11. pilz pnoz s4说明书_如何使用Pilz的安全继电器PNOZ S4?
  12. 阿克曼运动模型(ackermann)的一些资料-室外光电组参考资料
  13. 错误的太极观念造成膝盖损伤
  14. 关于感染型病毒ramnit和runner的查杀记事
  15. 泛泰A880S再次救砖成功,记录一下
  16. idea中xml打开方式变成file,如何将file格式文件变回.xml文件
  17. Git rebase(变基)操作详解
  18. 【元胞自动机】基于元胞自动机实现高速公路收费站交通流问题附matlab代码
  19. Java语言的基本介绍
  20. 微信小程序之自定义组件的使用、介绍、案例分享

热门文章

  1. php根据IP获取所有地,腾讯IP API
  2. 图片镂空算法集合[图](转)
  3. 开启计算机开机引导兼容模式,Intel决定2020年封禁UEFI兼容模式 将无法开启CSM来启动操作系统...
  4. MongoDB入门及 c# .netcore客户端MongoDB.Driver2.9.1使用
  5. phpcmsv9修改表单直接在列表中显示字段方法
  6. C/C++获取系统当前时间
  7. Oracle的表空间和数据文件
  8. SVN+post-commit 搭建自动同步版本库
  9. wiki-editor语法
  10. 产品问答 | 领导把锅甩给你,你会怎么做?