文 / 赵威  胡旭华,金山 WPS 团队

让 AI 的能力下沉到更多移动终端上,才能完全打开智能的想象力。前不久,金山 WPS 与 Google 合作,以 TensorFlow 架构为办公工具赋予了 AI 算力和功能。

金山 WPS 与 TensorFlow 合作:移动端部署 AI 的典范

借助 TensorFlow 和 TensorFlow Lite 在框架层的算法优化能力,移动版 WPS 有多个业务场景开始使用 AI 算法,来进行图片的处理和转换:

  • 物体边缘检测。金山 WPS 设计的 CNN 文档检测网络,可以让安卓版用户快速检测结果,自动判断边缘并调整滤镜;

  • 自动识别图片类型。金山 WPS 利用 TensorFlow Lite 实现了能够自动识别图片类型的 OCR 模型,提供对应的滤镜和 OCR 输出格式;

  • 扫描件 OCR。采用 TensorFlow 部署模型,可以对文档实现旋转矫正、文本行检测等操作,节省大量文档编辑时间;

  • 自然场景 OCR。利用 TensorFlow Lite 将自然场景 OCR 运行在手机上,使它能在短时间内从复杂场景中准确定位文字并获得理想的识别结果;

  • 图片转文档的布局分析。金山 WPS 结合 TensorFlow 与 scikit-learn 框架一起进行图文布局分析算法,大幅度降低了算法的研发成本。

金山 WPS 还对多种机器学习算法进行了加工整合,从不同层次优化和改进了文档转图片、内容检测等功能,解决了图片转文档 “乱码” 这一历史难题。

金山与 TensorFlow 的协同工作,已经带来一些在移动端办公领域的直观效果:

  • 高功耗、高能耗的实时 AI 处理在移动端成为可能;

  • 阅读体验升级,办公 AI 功能解锁,办公效率进一步提升;

  • WPS 正在打开端侧部署 AI 的可能性。

从云到移动:金山 WPS 借助 TensorFlow Lite 实现的惊险一跃

从云端算法到移动端开发的实操阶段,移动芯片端侧运算支撑力不足、云计算数据传输延迟,使得拍照识别这样的实时运算,用户体验极差。但通过结合 TensorFlow Lite,金山 WPS 训练移动端模型快速地推进了开发者的 AI 研发进程。

TensorFlow Lite 在移动端具有以下明显优势:

  • 足够小:训练的 AI 模型可以很容易被压缩和传输到手机端,对用户的手机内存十分友好;

图像学习框架的轻量神经网络

  • 手机机型兼容性好,对安卓天然亲近:在数十台机型上的稳定性测试都表现很好;

高效的 “投影” 模型

  • 移动端的适应性强:TensorFlow Lite 与 TensorFlow 的过渡平滑,不会增加大量的兼容成本;

TensorFlow Lite 的架构设计

  • TensorFlow 社区资源丰富,具体的业务场景很容易找到相关参照系,并学习案例的集成方式。

那么,移动端友好的 TensorFlow Lite 又是如何被金山 WPS 部署到手机端的呢?

以文档边缘检测为例:

  • 首先,利用 tf.keras 可以很快完成深度网络的构建。在拍照扫描算法中,开发者设计了一个 5M 左右的 CNN 文档检测网络;

  • 其次,将 tf.keras.Model 提供的 fit_generator 与 tf.data 灵活结合,对训练数据进行预处理,根据业务场景对训练数据进行分组定义,然后构造适合的代价函数。以此优化训练性能,不断地迭代优化算法效果;

  • 最后,把业务算法集成到 WPS,在多台旗舰机上进行稳定测试。针对一些难点问题进行分析迭代,直至稳定上线。

至此,移动 AI 的开发者完成了从云端到移动端的惊险一跃。

从个案到公式:移动端 AI 开发的通识问题与解决之道

TensorFlow 在金山 WPS 办公软件上的落地,给移动端办公带来了奇妙的变化,也找到了移动端 AI 开发的通识问题与解决之道。

  • AI 落地的成本问题。解决之道:TensorFlow 能够解决技术或算法实现商业化时如何低成本地解锁需求的问题,而金山 WPS 能为技术解决方案提供足够大的商业落地空间;

  • 端侧 AI 的技术沉淀问题。解决之道:合作之后,金山仍在攻克很多难题,除了 TensorFlow Lite,金山 WPS 研发团队还掌握了几款移动推理框架及一些小规模网络设计的技巧;Google 也在发力,比如即将推出 TensorFlow 2.0,TensorFlow Lite 将支持更丰富的模型运算方式。

此外,TensorFlow 与金山 WPS 合作的最大意义是让我们看到:超强算力的 AI 硬件 + 移动端友好的深度学习框架 + 清晰广泛的业务场景,才是帮助更多开发者打开想象的前提。

金山 WPS 在移动办公上的努力实现,使得移动 AI 开发这件事,在葱茏的生态下前所未有地真实起来。

更多 AI 相关阅读:

  • 深度学习,提高前列腺癌诊断正确率

  • 利用切换选项和模式扩展您的智能家居操作

  • 单目视频无监督深度学习的结构化方法

金山 WPS:基于 TensorFlow 的 AI 移动办公相关推荐

  1. 金山WPS:云端协同 AI赋能 WPS树起了Office新四大件|企服三会系列报道

    "金山WPS 抓住了几大风口所提供的发展机遇,如软件正版化的知识产品保护.IT产品国产化替代.移动互联网,之后的云计算,以及现在人工智能等发展机遇,经历了DOS时代.PC时代.移动办公时代和 ...

  2. 左手WPS右手Eversheet,金山系办公软件不惧微软,迎接国内新生态

    众所周知,每一次技术架构的变化,都会引起产业的变局. 过去几年,办公软件.数据库以及操作系统等基础软件,在传统的架构之下,基本上看不到本土企业与外企并跑或领跑的机会,但在移动和云的双重背景下,中国企业 ...

  3. wps android 版 参数控制介绍,最强手机办公软件 Android版金山WPS首评测

    [天极网手机频道]从智能手机在市场流行那一刻开始,注定在我们的生活工作将发生重大改变,对于智能手机来说强大的硬件支持与智能平台的兼容行决定在,手机的各项功能已经逐步趋于PC化,而对于日常上班族来说,随 ...

  4. 继金山WPS,永中Office之后,国产再添全新型办公软件

    PPT.论文.文稿......每一个成年的电脑使用者,都绕不开办公软件,而能否使用办公软件,也成为了区分电脑和游戏主机的关键因素之一. Office 95 从1990年起,微软的Office套件,便逐 ...

  5. 国产办公软件崛起,金山WPS月活用户已超5.7亿;Meta指责苹果夺走部分广告收入;Python 3.11 发布

    一分钟速览新闻点! 国产办公软件崛起 金山WPS月活用户已超5.7亿 美团开始招聘香港工作人员 第一代没人用!台积电第二代3nm工艺首颗芯片流片 华为因专利纠纷起诉亚马逊 目前正着手全球维权行动 抖音 ...

  6. 国产办公软件崛起,金山WPS月活用户已超5.7亿;Meta指责苹果夺走部分广告收入;Python 3.11 发布|极客头条

    「极客头条」-- 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧. 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews ...

  7. AI常用框架和工具丨11. 基于TensorFlow(Keras)+Flask部署MNIST手写数字识别至本地web

    代码实例,基于TensorFlow+Flask部署MNIST手写数字识别至本地web,希望对您有所帮助. 文章目录 环境说明 文件结构 模型训练 本地web创建 实现效果 环境说明 操作系统:Wind ...

  8. 【每日新闻】致远互联与360企业安全集团联合发布国内首份协同安全白皮书 | 金山WPS发布内容生态战略

    每一个企业级的人  都置顶了 中国软件网 中国软件网  为你带来最新鲜的行业干货 小编点评 我们希望邀请更多的生态伙伴 共同探讨 共同行动 2018年4与人25日 北京站,不见不散! 趋势洞察 生态视 ...

  9. 金山WPS发布了Linux WPS Office

    2019独角兽企业重金招聘Python工程师标准>>> 导读 近日,金山WPS发布了Linux WPS Office中文社区版新版本,支持大部分主流Linux系统,功能更加完善,兼容 ...

最新文章

  1. 为什么工厂老板们从不「迷信」人工智能?
  2. 同源策略Same-origin policy
  3. Linux下使用PPTP ×××拔号的实现
  4. ABAP-获取用户的组织结构权限
  5. Spring 集成web环境
  6. 作者:宾军志(1976-),男,御数坊(北京)科技咨询有限公司联合创始人。...
  7. 运筹作业题:一个正三角形平面,在三个角的部分减去一部分,然后沿着剪开部分折叠起来,使折叠后的三棱台体积最大
  8. Xshell 鼠标选中 中断ctrl+c 问题
  9. 安装python多少内存_Python进程使用的全部内存?
  10. php 可用内存大小,关于php:致命错误:允许的内存大小为67108864字节耗尽
  11. PHP完全自学手册01.pdf
  12. 【达内课程】Android自动化测试框架Robotium
  13. 微信输出日志在电脑桌面
  14. Microsoft Office Professional Plus 2013全套
  15. 如何判断横屏还是竖屏?
  16. 用pandas绘制箱体图(boxplot)
  17. 怎么修改PDF文件中的文字
  18. quartz建表语句
  19. 解决 用vue+vant 写顶部tab栏 做排班表的bug
  20. 什么是P2P,O2O,B2B,B2C,C2C模式

热门文章

  1. MG323所有命令使用
  2. python趣味程序_知道了这个,你也能写出 Python 趣味小程序
  3. 7. print的应用(3):格式化输出之format模式
  4. 经典文献阅读之--Cam2BEV
  5. word表格无法调整行高
  6. vue3+howler.js实现音频播放,兼容大多数音频格式
  7. 临床血液学检验仪器与技术
  8. 2021年安全员-B证考试试题及安全员-B证操作证考试
  9. user-cf算法思考-K值的确定
  10. 【PAT甲级】1062 Talent and Virtue (25分)