android提取pdf中文字,使用iTextG從Android上的pdf文件中提取文本
當我試圖從SD卡中讀取pdf文件並從中提取文本時,什麼也沒有發生。 沒有錯誤,沒有警告,通知,也沒有結果文件。 我將源文件和結果都存儲在設備的SD卡的根文件夾中。 你們能幫我解決這個問題嗎? 這裏是我的代碼:使用iTextG從Android上的pdf文件中提取文本
package com.example.androidtest;
import java.io.File;
...
public class MainActivity extends Activity {
private Button button;
public static final String TIMETABLE = "doc.pdf"; // The original PDF that will be parsed.
public static final String RESULT = "timetable.txt"; // The text file received after scan.
@Override
protected void onCreate(Bundle savedInstanceState) {
super.onCreate(savedInstanceState);
setContentView(R.layout.activity_main);
processSource();
}
public void processSource() {
button = (Button) this.findViewById(R.id.button_add);
button.setOnClickListener(new View.OnClickListener() {
@Override
public void onClick(View v) {
try {
new MainActivity().extractText(TIMETABLE, RESULT);
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
});
}
public void extractText(String pdf, String doc) throws IOException {
File sdcard = Environment.getExternalStorageDirectory(); // Load file timetable.txt from device's sdcard
File file = new File(sdcard, pdf);
File text = new File(sdcard, doc); // Save the result file in device's sdcard
InputStream is;
try {
is = new FileInputStream(file);
PdfReader reader = new PdfReader(is); // Call the source file
PrintWriter out = new PrintWriter(new FileOutputStream(text));
Rectangle rect = new Rectangle(0, 0, 600, 900); // Define the rectangle to extract text within it
RenderFilter filter = new RegionTextRenderFilter(rect);
TextExtractionStrategy strategy = new FilteredTextRenderListener(new LocationTextExtractionStrategy(), filter);
out.println(PdfTextExtractor.getTextFromPage(reader, 1, strategy));
out.flush();
out.close();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} // Call the source file
}
}
這裏是它在控制檯選項卡中顯示,當我測試的AVD(我希望它可以幫助):
[2013 -11-23 03:03:29 - AndroidTest] Android啓動! [2013-11-23 03:03:29 - AndroidTest] adb正常運行。 [2013-11-23 03:03:29 - AndroidTest]執行com.example.androidtest.MainActivity>活動啓動 [2013-11-23 03:03:29 - AndroidTest]自動目標模式:啓動新模擬器>兼容AVD'Tab' [2013-11-23 03:03:29 - AndroidTest]使用虛擬設備「選項卡」啓動新仿真器 [2013-11-23 03:03:29 - AndroidTest]發現新仿真器:仿真器-5554 [2013-11-23 03:03:29 - AndroidTest]等待HOME('android.process.acore')被啓動... [2013-11-23 03:03:57 - AndroidTest ]首頁上的設備'模擬器-5554' [2013-11-23 03:03:57 - AndroidTest]上傳AndroidTest.apk到設備'模擬器-5554' [2013-11-23 03:04:06 - AndroidTest]安裝AndroidTest.apk ... [2013-11-23 03:04: 29 - AndroidTest]成功! [2013-11-23 03:04:29 - AndroidTest]開始活動>設備仿真器-5554上的com.example.androidtest.MainActivity [2013-11-23 03:04:30 - AndroidTest] ActivityManager:開始:意圖> {act = android.intent.action.MAIN cat = [android.intent.category.LAUNCHER]> cmp = com.example.androidtest/.MainActivity}
感謝您的時間!
android提取pdf中文字,使用iTextG從Android上的pdf文件中提取文本相关推荐
- java图的建立field_《Java虚拟机原理图解》1.4 class文件中的字段表集合--field字段在class文件中是怎样组织的...
0.前言 了解JVM虚拟机原理是每一个Java程序员修炼的必经之路.但是由于JVM虚拟机中有很多的东西讲述的比较宽泛,在当前接触到的关于JVM虚拟机原理的教程或者博客中,绝大部分都是充斥的文字性的描述 ...
- python文件读取方法read(size)的含义是_在Python中可使用read([size])来读取文件中的数据,如果参数size省略,则读取文件中的()。...
[单选题]李明在他所属的公司工作五年,每天都很认真地处理繁杂的事情,同事们都夸他认真,但是依然没有建树,这是因为: [多选题]品牌标志的作用表现在 [单选题]新产品开发的第一个阶段是_______. ...
- python文件读取方法read(size)的含义是_在Python中可使用read([size])来读取文件中的数据,如果参数size省略,则读取文件中的()。(4.0分)_学小易找答案...
[单选题]文本文件存储的是(),由若干文本行组成,通常每行以换行符 '\n' 结尾.(4.0分) [单选题]()属性是返回被打开文件的访问模式.(4.0分) [单选题]重力坝是由砼或( )修筑而成的大 ...
- IO流的练习5 —— 读取文件中的字符串,排序后写入另一文件中
需求:已知s.txt文件中有这样的一个字符串:"hcexfgijkamdnoqrzstuvwybpl" 请编写程序读取数据内容,把数据排序后写入ss.txt中. 分析: A:读取文 ...
- 将文件中所有数读到一个数组中_「数据结构与算法」将5个文件中的一千万年龄合并到一个新文件中...
现在有5个文件,文件里面分别存储着1千万个用户年龄,并且每个文件中的年龄都是有序的(从小到大),现在需要将这5个文件整合到一个文件中,新文件的内容依然要保持有序(从小到大). 初始化数据 1.数据生成 ...
- 【 如何将.vue文件中的所有css代码放入一个.css文件中】
javascript – 如何将.vue文件中的所有css代码放入一个.css文件中?
- python使用pandas中的to_json函数将dataframe数据写入json文件中
python使用pandas中的to_json函数将dataframe数据写入json文件中 目录 python使用pandas中的to_json函数将dataframe数据写入json文件中 #导入 ...
- C# 截取上传flv文件中其中一帧图片
截取上传flv 文件中 其中一帧 图片 /** * 截取flv 文件的第一帧 图片 */ public void getFlv(String file, String uu ...
- 图像转文本、PDF 转文字(包括html、xml)、关键句提取 软件开发手记
文章目录 准备工作 声明 所需模块: 模块简介 安装方法: 软件开发 图像转文本 API 使用代码 其他 PDF 转文字 代码 Tooltip 关键句提取 截图 古文排版 软件使用 关于界面 国际化效 ...
最新文章
- __bridge 使用注意
- SAP MM 按采购订单查询付款信息的报表?
- python判断文件夹是否存在
- 科大星云诗社动态20210421
- awk小技巧之执行shell命令
- POJ 2083 递归画分形图
- java ip地址相关操作
- 剪板机自动上下料_机器人联轴器,用于机器人自动化上下料
- 推荐Linux内核书籍
- catalog java,Java Connection getCatalog()方法与示例
- Golang面向并发的内存模型
- Angular进阶教程一
- Struts(一)struts2.2概述与MVC模式深度剖析
- 文件——rstrip() 、lstrip()和 strip()、zip() 函数
- wordpress上传文件自动更名为时间形式
- php 抽奖活动_php 积分抽奖活动(大转盘)
- 桥田智能:热烈欢迎中欧总经理班的同学们莅临桥田参观、交流
- elasticsearch实现类似京东的商品搜索效果(elasticsearch动态聚合)
- MATLAB参数估计 置信区间
- 若你喜欢怪人 其实我很美
热门文章
- (刷机经验+1)Nexus5的刷机和root
- mac os 无法登陆app store的问题
- 深度洞察:如何利用Matlab进行户外移动机器人GPS、里程计和IMU数据的后处理,实现全球定位和环境映射
- 前端开发培训北京,JavaScript的常见用途和书写规范
- 烟雨黑帽SEO程序演示:AI智能模板在线制作制作神器-单域名版+多域名版-一键批量制作黑帽程序所使用的单页模板
- SAP HANA 详细介绍
- mysql returning_Postgres用returning实现mysql的last_insert_id
- catch抛出异常finally还会执行吗?会!
- Set接口的源码解析+扩容机制
- 蓝桥杯 算法训练 提货单 Java