需求:

识别扫描版pdf中表格数据

实现:

调用百度OCR识别pdf中表格,然后把百度OCR识别好的结果excel下载下来,①就是两个函数,一个函数就是获得调用百度OCR,获得excel结果url,②用c#下载excel文件的接口获得excel文件;(其中新建项目,请看这篇文章:里面有新建项目)

代码:

using System;
using System.IO;
using System.Net;
using System.Text;
using Baidu.Aip.Ocr;namespace ConsoleApp1
{class Save_Excel{//*******************下面函数是通过百度API返回的结果(excel)url下载excel文件public void Down_Url(string url){HttpWebRequest request = (HttpWebRequest)WebRequest.Create(url);HttpWebResponse response = request.GetResponse() as HttpWebResponse;Stream responseStream = response.GetResponseStream();Stream stream = new FileStream(@"d:\Download\2.xls", FileMode.Create);byte[] bArr = new byte[1024];int size = responseStream.Read(bArr, 0, bArr.Length);while (size > 0){stream.Write(bArr, 0, size);size = responseStream.Read(bArr, 0, bArr.Length);}stream.Close();responseStream.Close();}}class get_url{//***************获得百度API识别结果的接口public string get_jiekou(){string apiKey = "***********************";//根据自己申请的keystring secretKey = "************************";//根据自己申请的keyOcr client = new Ocr(apiKey, secretKey){Timeout = 30000//延时时间};var tuPian = "D:\\JBK\\task\\sh\\vsto_test3\\32.png";//d:\Download\2.xls 就是保存路径,要保证d盘中Download文件夹是存在的byte[] image = File.ReadAllBytes(tuPian);//JObject result = client.GeneralBasic(image);//json数据,具体格式可以看官方API说明,这是识别文字var result = client.TableRecognitionToExcel(image, 30000);// 识别为excel文件//result为 {"result": {"result_data": "http://bj.bcebos.com/v1/ai-edgecloud/FB852F5C998A41F9AA9BFE966BD4D663.xls?authorization=bce-auth-v1%2Ff86a2044998643b5abc89b59158bad6d%2F2020-01-13T04%3A45%3A32Z%2F172800%2F%2F5f7ee677f2c66c3a6fe1649e4861e56e0009dd857d18b39b542a107cf9d50d5b","ret_msg": "已完成","request_id": "18159544_1341547","percent": 100,"ret_code": 3},"log_id": 1578890733144804}string url = result["result"]["result_data"].ToString();//获取树形result的json字符串return url;}}class Program{static void Main(string[] args){get_url d = new get_url();string url = d.get_jiekou();Save_Excel r = new Save_Excel();r.Down_Url(url);}}
}

c#写一个识别扫描版pdf表格的程序,并把结果excel下载下来相关推荐

  1. 一个ocr翻译脚本,扫描版pdf伴侣。

    ocr识别翻译脚本 参考了诸多前辈的代码,在源文件里都做了说明,在此对所有无私分享代码的前辈们一并表示感谢! 所有脚本都基于linux下的kde环境,欢迎大家使用.交流. 项目地址:https://g ...

  2. 扫描版PDF文件,如何弄成可复制的文字版?

    最后在网上下载了几个PDF文件,是扫描版的,相当于是图片,无法复制上面的文字,但是某宝找人处理了一下就可以复制了,是使用的什么软件呢?具体操作过程是怎样的呢? 其实将扫描的PDF处理成可复制的文字版, ...

  3. 扫描版pdf重排 linux,强大的桌面用 PDF 重排工具:K2pdfopt 简明教程

    用 Kindle 阅读 PDF 一直以来都遭到小伙伴们的无限吐槽,在那 Kindle 还能越狱的时代,我们有 Koreader 之类优秀的 Kindle 第三方插件实现 PDF 文档的实时重排,但是随 ...

  4. 让Kindle支持扫描版PDF重排

    使用小屏幕Kindle阅读PDF文档时,如果文档不是专门为小屏幕阅读器排版,就会经常出现显示字体太小的情况,造成阅读不便.而Kindle的屏幕刷新率又太低,页面局部放大后再移动阅读区域亦不现实.解决这 ...

  5. 扫描版pdf重排 linux,【Kindle Pdf Viewer中文安装教程】支持扫描版PDF重排及其他主流文件格式...

    上周末从战隼的微博上看到一条消息: @warfalcon:这个东西支持扫描版PDF重排和几乎所有主流文件格式 ,其中主力开发人员还有一个是中国人 安装指南:http://t.cn/zleknp3 微博 ...

  6. 扫描版PDF添加目录

    扫描版PDF如何添加目录- 准备工作 使用的软件:FreePic2Pdf-v11.0.3.1.exe(下载链接:百度网盘 提取码:28xb)单独一个exe的文件 PDF文件 插入目录步骤 双击打开Fr ...

  7. 《计算机视觉 : 计算理论与算法基础》(马颂德 张正友)扫描版[PDF]

    <计算机视觉 : 计算理论与算法基础>(马颂德 & 张正友)扫描版[PDF] http://www.verycd.com/topics/2825837/ 算机视觉是在图像处理的基础 ...

  8. 《Div+CSS 3.0网页布局案例精粹》扫描版[PDF]

    电驴资源 下面是用户共享的文件列表,安装电驴后,您可以点击这些文件名进行下载 [Div.CSS.3.0网页布局案例精粹].王大远.扫描版.rar详情 53.7MB 全选 53.7MB 下载地址(拷贝到 ...

  9. 扫描版PDF自动添加书签 | 电子书目录自动获取

    经常遇到扫描版PDF没有书签的情况,阅读起来很不方便,手动添加书签耗时较多. 自动获取目录,自动添加书签,完美解决.

最新文章

  1. 分享2018年陆陆续续读过的书-附书单
  2. 大学c语言程序设计实训课实验报告,大学一年级下学期C语言程序设计实验报告答案 完整版...
  3. spring-boot中使用druid连接池
  4. VC++开发演算稿式计算语言-可编程绘图的计算器
  5. linux内存管理(十五)-内存池
  6. C++学习笔记(10)运算符重载,友元函数,友元类
  7. 将python程序打包成可执行文件exe
  8. android 自定义绘画,【整理】Android 自定义视图之画图
  9. SQL 基础笔记(二):进阶查询
  10. 十六进制和字符串的转换
  11. html图片爆炸效果,HTML5特效图片爆炸效果点击后文字会炸开
  12. kali PIN码破解
  13. Vue中的时间转换,把毫秒换算成正常时间
  14. PostgreSQL 时区问题
  15. 史上最全!大数据开源框架技术扫盲
  16. 赛效:wps下载手机版怎么操作的?
  17. exchange邮件中继服务器搭建,Exchange简单实现SMTP匿名中继的机制和原理
  18. oracle索引一般叫什么意思,什么是oracle索引?
  19. cdn详解 很全面的
  20. NVIDIA下载问题

热门文章

  1. beanstalkd java使用_消息队列 beanstalkd 介绍
  2. Linux中root@localhost变为root@bogon的解决方法
  3. 方程组的极大线性无关组与线性无关解的个数
  4. 分布式session共享问题
  5. 一个只由字母数字字符和破折号组成的字符串S. 该字符串被N个破折号分成N + 1个组。 给定数字K,使得每个组包含完全K个字符,除了第一个组可能少于K
  6. Android特色开发(3):Google Map
  7. IOS 保存图片、视频到自定义相簿
  8. C1认证学习二(信息单位)
  9. 2021寒假图论复习计划(2)(hduoj3639,hduoj1045,hduoj2444,hduoj1083)
  10. 智能分数计算机在线,在线输入分数推荐大学,2020小编评测推荐:智能输入分数推荐大学...