简介

首先介绍下在本文出现的几个比较重要的概念:

OCR(光学字符识别): 光学字符识别(Optical Character Recognition, OCR)是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程。亦即将图像中的文字进行识别,并以文本的形式返回。

Tesserocr: Tesserocr 是 python 的一个 OCR 识别库,但其实是对 tesseract 做的一层 python API 封装,所以它的核心是 tesseract。

函数计算(Function Compute): 函数计算是一个事件驱动的服务,通过函数计算,用户无需管理服务器等运行情况,只需编写代码并上传。函数计算准备计算资源,并以弹性伸缩的方式运行用户代码,而用户只需根据实际代码运行所消耗的资源进行付费。函数计算更多信息参考。

Funcrfat: Funcraft 是一个用于支持 Serverless 应用部署的工具,能帮助您便捷地管理函数计算、API 网关、日志服务等资源。它通过一个资源配置文件(template.yml),协助您进行开发、构建、部署操作。Fun 的更多文档参考。

备注: 本文介绍的技巧需要 Funcraft 版本大于等于 3.6.8 。

本文介绍将一个预制的 tesserocr 示例快速部署到函数计算平台。该示例借助于 Funcraft 安装了最新的 4.1.1 版本的 tesseract,相比于包管理器的 3.0.2 版本识别率大幅度提升。

该示例提供了一个 vue.js 实现的交互界面,有三种提供输入图片的方式:使用示例图片、上传图片或者提供图片 URL。然后用户点击识别按钮就能迅速体验识别效果。

将 tesserocr 部署于函数计算,借助于函数计算的自动伸缩和按量计费的特性,提供了免运维和成本优势。

下面是部署以后的使用效果动图:


[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-wmkgVbQK-1589181894499)(https://data-analysis.cn-shanghai.log.aliyuncs.com/logstores/article-logs/track_ua.gif?APIVersion=0.6.0&title=%E5%BC%80%E5%8F%91%E5%87%BD%E6%95%B0%E8%AE%A1%E7%AE%97%E7%9A%84%E6%AD%A3%E7%A1%AE%E5%A7%BF%E5%8A%BF%E2%80%94%E2%80%94OCR%20%E6%9C%8D%E5%8A%A1&author=%E5%80%9A%E8%B4%A4&src=article)]

初始化

git clone https://github.com/vangie/fc-ocr-example.git

安装依赖

$ fun install

本地测试

$ fun local start domain_for_ocr
using template: template.yml
CustomDomain domain_for_ocr of tesserocr/tesserocr was registeredurl: http://localhost:8000/methods: [ 'GET', 'POST' ]authType: ANONYMOUSfunction compute app listening on port 8000!

使用浏览器打开 http://localhost:8000/

同步文件到 NAS

同步模型目录 tessdata_fast 和 依赖目录 .fun/root .fun/python 到 NAS 盘。

$ fun nas sync

部署

$ fun deploy
using template: template.yml
using region: cn-shanghai
using accountId: ***********3743
using accessKeyId: ***********Ptgk
using timeout: 60...Detect 'DomainName:Auto' of custom domain 'domain_for_ocr'
Fun will reuse the temporary domain 1712300-1986114430573743.test.functioncompute.com, expired at 2020-04-27 19:35:00, limited by 1000 per day.Waiting for custom domain domain_for_ocr to be deployed...
custom domain domain_for_ocr deploy success...

注意上面返回的临时域名地址:1712300-1986114430573743.test.functioncompute.com

使用浏览器打开 http://1712300-1986114430573743.test.functioncompute.com

小结

  1. Tesserocr 库提供了开箱即用的图片识别效果,而且提供了预训练好的模型,如果需要也可以直接训练模型
  2. 函数计算为 Tesserocr 服务化提供了便利。借助函数计算可以轻松部署一个高可用、按量访问量计费的 OCR 服务。
  3. Funcraft 工具解决 Tesserocr 移植到函数计算的一些技术难题,比如原生依赖,打包问题。细节可以查看 Funfile 文件。

“阿里巴巴云原生关注微服务、Serverless、容器、Service Mesh 等技术领域、聚焦云原生流行技术趋势、云原生大规模的落地实践,做最懂云原生开发者的技术圈。”

开发函数计算的正确姿势——OCR 服务相关推荐

  1. 开发函数计算的正确姿势 —— 移植 next.js 服务端渲染框架

    为什么80%的码农都做不了架构师?>>>    首先介绍下在本文出现的几个比较重要的概念: 函数计算(Function Compute): 函数计算是一个事件驱动的服务,通过函数计算 ...

  2. 开发函数计算的正确姿势——支持 ES6 语法和 webpack 压缩

    为什么80%的码农都做不了架构师?>>>    首先介绍下在本文出现的几个比较重要的概念: 函数计算(Function Compute): 函数计算是一个事件驱动的服务,通过函数计算 ...

  3. 开发函数计算的正确姿势 —— 使用 Fun Local 本地运行与调试

    前言 首先介绍下在本文出现的几个比较重要的概念: 函数计算(Function Compute): 函数计算是一个事件驱动的服务,通过函数计算,用户无需管理服务器等运行情况,只需编写代码并上传.函数计算 ...

  4. 开发函数计算的正确姿势——轻松解决大依赖部署

    前言 首先介绍下在本文出现的几个比较重要的概念: 函数计算(Function Compute): 函数计算是一个事件驱动的服务,通过函数计算,用户无需管理服务器等运行情况,只需编写代码并上传.函数计算 ...

  5. aptitude安装出现依赖_开发函数计算的正确姿势——依赖安装方法一览

    1. 前言 首先介绍下在本文出现的几个比较重要的概念: 函数计算(Function Compute): 函数计算是一个事件驱动的服务,通过函数计算,用户无需管理服务器等运行情况,只需编写代码并上传.函 ...

  6. 开发函数计算的正确姿势——网页截图服务

    前言 首先介绍下在本文出现的几个比较重要的概念: 函数计算(Function Compute): 函数计算是一个事件驱动的服务,通过函数计算,用户无需管理服务器等运行情况,只需编写代码并上传.函数计算 ...

  7. 开发函数计算的正确姿势 —— 爬虫

    2019独角兽企业重金招聘Python工程师标准>>> 在 <函数计算本地运行与调试 - Fun Local 基本用法> 中,我们介绍了利用 Fun Local 本地运行 ...

  8. 开发函数计算的正确姿势——运行 Selenium Java

    前言 首先介绍下在本文出现的几个比较重要的概念: 函数计算(Function Compute): 函数计算是一个事件驱动的服务,通过函数计算,用户无需管理服务器等运行情况,只需编写代码并上传.函数计算 ...

  9. 开发函数计算的正确姿势——使用交互模式安装依赖

    前言 首先介绍下在本文出现的几个比较重要的概念: 函数计算(Function Compute): 函数计算是一个事件驱动的服务,通过函数计算,用户无需管理服务器等运行情况,只需编写代码并上传.函数计算 ...

最新文章

  1. 算术表达式求解背景_1.8 C++算术运算符与表达式
  2. poj - 2356 Find a multiple
  3. PDF数据防扩散系统方案
  4. swarm 和 k8s_Wildfly Swarm,朝着成熟和一小部分贡献
  5. 如何查看cplex的help文档_word查看技巧:如何快速找到文档的修改痕迹
  6. spark-submit的使用
  7. 返回的图片 buffer 怎么接收_面试题:Kafka 会不会丢消息?怎么处理的?
  8. perl index和rindex的用法
  9. java webservice
  10. 【LeetCode】【字符串】题号:*13. 罗马数字转整数
  11. 自制VBS自动刷屏器,再也不怕刷屏刷不过别人了
  12. Java数据结构树实验报告总结_20172302 《Java软件结构与数据结构》实验二:树实验报告...
  13. android 9.0 10.0 Launcher3修改workspace字体颜色
  14. 阿里云云盾证书是什么?云盾证书有什么作用?
  15. [CTSC2010]珠宝商(点分治+根号分治+后缀自动机)
  16. 北漂三年多 我选择离开,眼神更加坚定!
  17. 算法---DFS和BFS
  18. 用python制作田字格_2分钟学会在Word中制作田字格 米字格 书法练字再也不用买本子了...
  19. 阿里云小程序云发布小程序跨平台开发框架,助力开发者一次开发,多端运行
  20. 小型、低成本、低功耗的一次性收音机。第1部分:发射机

热门文章

  1. 1.16 静态内部类
  2. 将指定日期字符串转换为Calendar对象
  3. Codeforces Round #777 (Div. 2)【未完结】
  4. Python按键精灵自动化_安装Python
  5. 妈妈再也不担心我面试被 Redis 问得脸都绿了
  6. Sprinig Boot + Redis 实现接口幂等性,写得太好了!
  7. ArrayList深入解析,看这篇就够了
  8. java.lang.IllegalArgumentException: Can not set XXX to com.sun.proxy.$Proxy28
  9. Android取消EditText自动获取焦点默认行为
  10. getaway网关转发去前缀_为什么微服务一定要有网关?