展开全部

poi读取前程无忧的简历会打不开的,至少我以前读是这样的,因为他有时候是mht文件32313133353236313431303231363533e59b9ee7ad9431333361313263直接另存为word文档的,所以保险起见建议用jacob来读,如果他是doc或者是docx文档可以转化为html然后用jsoup来读取,效果挺好的

下面是转化的代码:package com.java.doc;

import com.jacob.activeX.ActiveXComponent;

import com.jacob.com.Dispatch;

import com.jacob.com.Variant;

public class JacobRead {

public static void extractDoc(String inputFIle, String outputFile) {

boolean flag = false;

// 打开Word应用程序

ActiveXComponent app = new ActiveXComponent("Word.Application");

try {

// 设置word不可见

app.setProperty("Visible", new Variant(false));

// 打开word文件

Dispatch doc1 = app.getProperty("Documents").toDispatch();

Dispatch doc2 = Dispatch.invoke(

doc1,

"Open",

Dispatch.Method,

new Object[] { inputFIle, new Variant(false),

new Variant(true) }, new int[1]).toDispatch();

// 作为txt格式保存到临时文件

Dispatch.invoke(doc2, "SaveAs", Dispatch.Method, new Object[] {

outputFile, new Variant(7) }, new int[1]);

// 关闭word

Variant f = new Variant(false);

Dispatch.call(doc2, "Close", f);

flag = true;

} catch (Exception e) {

e.printStackTrace();

} finally {

app.invoke("Quit", new Variant[] {});

}

if (flag == true) {

System.out.println("Transformed Successfully");

} else {

System.out.println("Transform Failed");

}

}

public static void main(String[] args) {

JacobRead.extractDoc("D:/xxxx简历.doc","D:/e.txt");

}

}

当然,也可以转化为txt读取,这部分代码没保存,你可以到网上找找,和转化成html的方法大差不差。

然后下面是我以前写的poi读取的方式:package TestHanLp;

import java.io.FileInputStream;

import java.io.FileNotFoundException;

import java.io.IOException;

import org.apache.poi.POIXMLDocument;

import org.apache.poi.POIXMLTextExtractor;

import org.apache.poi.hwpf.extractor.WordExtractor;

import org.apache.poi.openxml4j.opc.OPCPackage;

import org.apache.poi.xwpf.extractor.XWPFWordExtractor;

import org.apache.poi.xwpf.usermodel.XWPFDocument;

public class Test {

private static String text = "";

public static String  Read(String path) throws Exception{

//解析docx格式的简历

if(path.toLowerCase().endsWith("docx")){

try {

OPCPackage oPCPackage = POIXMLDocument.openPackage(path);

XWPFDocument xwpf = new XWPFDocument(oPCPackage);

POIXMLTextExtractor ex = new XWPFWordExtractor(xwpf);

text=ex.getText();

oPCPackage.close();

}

catch (FileNotFoundException e)

{

e.printStackTrace();

}

catch (IOException e)

{

e.printStackTrace();

}

}else {

//解析doc格式的简历

if(path.toLowerCase().endsWith("doc")){

FileInputStream fis = new FileInputStream(path);// 载入文档

WordExtractor wordExtractor = new WordExtractor(fis);

String[] paragraph = wordExtractor.getParagraphText();

StringBuffer stringBuffer = new StringBuffer();

for (int i = 0; i

if (null != paragraph[i] && !"".equals(paragraph[i])) {

paragraph[i] = paragraph[i].substring(0, paragraph[i].length() - 1);// 去掉末尾符号

}

stringBuffer.append(paragraph[i]).append("\n");//将每一小段隔开

}

text = stringBuffer.toString();

}

}

return text ;

}

}

望题主采纳对了,jacob读取word文档的效果比poi号,但运行速度不够,用的时候自己考虑考虑吧

java解析简历_java:解析word文档(前程无忧简历),最好有代码案例?poi或者jacob解析都可以,有jar资源,求急。感谢...相关推荐

  1. java 流转文件_java 实现 word 文档的在线编辑以及流转

    用 pageoffice 实现文档的在线编辑以及文档流转 1: 流程 用修改无痕迹模式起草文件,各个领导批注自己意见的时候使用强制留痕模式打开,文员清稿的时候用核稿模式打开,还有最后只读模式打开发布的 ...

  2. java gui 艺术字_Java 在Word文档中添加艺术字

    与普通文字相比,艺术字更加美观有趣也更具有辨识度,常见于一些设计精美的杂志或宣传海报中.我们在日常工作中编辑Word文档时,也可以通过添加艺术字体来凸显文章的重点,美化页面排版.这篇文章将介绍如何使用 ...

  3. java显示艺术字_Java 在Word文档中添加艺术字的示例

    与普通文字相比,艺术字更加美观有趣也更具有辨识度,常见于一些设计精美的杂志或宣传海报中.我们在日常工作中编辑Word文档时,也可以通过添加艺术字体来凸显文章的重点,美化页面排版.这篇文章将介绍如何使用 ...

  4. java 取商_Java读取word文档,转换为网页

    public classTest3 {/*** *@parampath *@parampaths *@paramsavepaths*/ public static voidchange(String ...

  5. php利用mht导出word,解析掌握PHP导出Word文档原理

    解析掌握PHP导出Word文档原理 PHP言语可能被咱们用来完成很多性能.比如在网站树立中,咱们常常会用到网页导出数据的情况.今天就为大家引见无关PHP导出Word文档的原理. 普通,有2种方法可能导 ...

  6. Word处理控件Aspose.Words功能演示:在 Java 中将 HTML 文件转换为 Word 文档

    在各种情况下,您可能需要将 HTML 内容转换为 Word 文档.例如,用于从所见即所得 HTML 编辑器生成文档或将网页转换为 DOCX 或 DOC 格式.为了以编程方式执行此转换,本文介绍了如何将 ...

  7. Java使用FreeMarker自动生成Word文档(带图片和表单)

    Java使用FreeMarker自动生成Word文档(带图片和表单) 1 背景 2 目标效果 3 创建Word模板 3.1 创建模板文档 3.2 转换模板文档 3.3 处理模板文档中的占位符 3.4 ...

  8. 简单几行代码,教你在Aspose.words中使用 Java 将水印添加到 Word 文档

    Aspose.Words 是一种高级Word文档处理API,用于执行各种文档管理和操作任务.API支持生成,修改,转换,呈现和打印文档,而无需在跨平台应用程序中直接使用Microsoft Word.此 ...

  9. java poi操作word2007_java使用poi解析2007以上的word文档中的表格与图片

    项目中使用到了要解析word文档中的表格与图片,网上的2003的解析方式很多,2007以上的很少,我看了官网找了资料自己写了一个简单的解析方案,大家共同学习吧!有不对的地方希望大神指教! import ...

  10. java重新组合_Java 合并Word文档

    在日常工作中,难免会遇到需要将多个Word文档合并到一个文档中,对其进行重新整理的情况,为了能帮助大家高效快速的完成这个操作,接下来本文就将介绍两种在Java程序中合并Word文档的方法. 方法一:如 ...

最新文章

  1. Windows10下Python3做OpenGL的编程
  2. C的安装编译Error
  3. linux--gdb调试
  4. 需求文档:没有标准,只有沟通
  5. spark学习-30-spark2.2.0的SparkContext初始化
  6. 用VS开发PHP扩展
  7. OpenCV-累计概率霍夫变换cv::HoughLinesP
  8. 【luogu1967】【noip2013】 货车运输 [生成树kruskal LCA ]
  9. python(3)-内置函数2
  10. DF1协议的官网下载
  11. 2018/03/28更新 日记
  12. 74cms 5.0.1 版本命令执行漏洞复现
  13. 使用官方APi获取Youtube视频资源
  14. 纯css动画效果--animate的应用
  15. 使用EXCEL计算并绘制RSI指标
  16. spec文件知识整理
  17. git push报错 无法提交远程 [rejected] main -> main (fetch first)error: failed to push some refs to
  18. 编译、汇编、翻译原理知识概括
  19. 怎么压缩图片文件大小?小白都能学会的方法分享
  20. TCP固定头部结构详解

热门文章

  1. hdp对应hadoop的版本_好程序员大数据学习路线分享hadoop的知识总结
  2. php中api提升响应速度,php – WordPress REST API慢响应时间
  3. python界面gui随机生成器_Python 实现的、带GUI界面的词云生成器
  4. 服务器显示禁止设置多个ip地址,服务器禁止设置多个ip解决办法
  5. Java 蓝桥杯 字母图形
  6. 操作系统文件系统实验_现代电脑操作系统原理课程,案例:Apple 操作系统技术演进...
  7. ckeditor复制html样式丢失,Ckeditor选择html无法正常使用铬浏览器
  8. Vmware fusion强制断电,关闭虚拟机
  9. python判断字符串中[提取、判断只含有、判断不含有]中文
  10. Matplotlib 整合与细节操作(样式、图例、风格、轴线、网格)