//nekohtml结合xpath用法DOMParser parser = new DOMParser();       try {              //设置网页的默认编码              parser.setProperty("http://cyberneko.org/html/properties/default-encoding","gb2312");              /*The Xerces HTML DOM implementation does not support namespaces              and cannot represent XHTML documents with namespace information.              Therefore, in order to use the default HTML DOM implementation with NekoHTML's              DOMParser to parse XHTML documents, you must turn off namespace processing.*/             parser.setFeature("http://xml.org/sax/features/namespaces", false);   

           String strURL = "http://product.dangdang.com/product.aspx?product_id=9317290";              BufferedReader in = new BufferedReader(                      new InputStreamReader(                              new URL(strURL).openStream()));              parser.parse(new InputSource(in));              in.close();             } catch (Exception e) {              e.printStackTrace();             }             Document doc = parser.getDocument();             // tags should be in upper case             String productsXpath = "/HTML/BODY/DIV[2]/DIV[4]/DIV[2]/DIV/DIV[3]/UL[@class]/LI[9]";             NodeList products;             try {                 products = XPathAPI.selectNodeList(doc, productsXpath);                 System.out.println("found: " + products.getLength());                 Node node = null;                 for(int i=0; i< products.getLength();i++)                 {                     node = products.item(i);                     System.out.println( i + ":\n" + node.getTextContent());                 }             }catch (TransformerException e) {                 e.printStackTrace();             }   

nekohtml 用法相关推荐

  1. c语言中external,static关键字用法

    static用法: 在C中,static主要定义全局静态变量.定义局部静态变量.定义静态函数. 1.定义全局静态变量:在全局变量前面加上关键字static,该全局变量变成了全局静态变量.全局静态变量有 ...

  2. Pandas_transform的用法

    先来看一个实例问题. 如下销售数据中展现了三笔订单,每笔订单买了多种商品,求每种商品销售额占该笔订单总金额的比例.例如第一条数据的最终结果为:235.83 / (235.83+232.32+107.9 ...

  3. Python中yield和yield from的用法

    yield 后面接的是 future 对象 调用方 委托生成器 yield from 直接给出循环后的结果 yield from 委托者和子生成器直接通信 yield from 直接处理stopIte ...

  4. pytorch学习 中 torch.squeeze() 和torch.unsqueeze()的用法

    squeeze的用法主要就是对数据的维度进行压缩或者解压. 先看torch.squeeze() 这个函数主要对数据的维度进行压缩,去掉维数为1的的维度,比如是一行或者一列这种,一个一行三列(1,3)的 ...

  5. python yield 和 yield from用法总结

    #例1. 简单输出斐波那契數列前 N 个数 #缺点:该函数可复用性较差,因为 fab 函数返回 None,其他函数无法获得该函数生成的数列 #要提高 fab 函数的可复用性,最好不要直接打印出数列,而 ...

  6. tf.nn.embedding_lookup()的用法

    函数: tf.nn.embedding_lookup( params, ids, partition_strategy='mod', name=None, validate_indices=True, ...

  7. OpenMP用法大全

    OpenMP基本概念 OpenMP是一种用于共享内存并行系统的多线程程序设计方案,支持的编程语言包括C.C++和Fortran.OpenMP提供了对并行算法的高层抽象描述,特别适合在多核CPU机器上的 ...

  8. Dorado用法与示例

    Dorado用法与示例 dorado用后总结 一.dorado概念 dorado的产品全名是"dorado展现中间件".从产品形态上dorado由两部分组成,第一部分是一个具有AJ ...

  9. TensorFlow用法

    TensorFlow用法 什么是TensorFlow TensorFlow是一个开源软件库,用于使用数据流图进行数值计算.图中的节点表示数学运算,而图的边缘表示流动的多维数据数组(张量).这种灵活的体 ...

  10. TensorFlow Keras API用法

    TensorFlow Keras API用法 Keras 是与 TensorFlow 一起使用的更高级别的作为后端的 API.添加层就像添加一行代码一样简单.在模型架构之后,使用一行代码,可以编译和拟 ...

最新文章

  1. Linux之父警告全球程序员:我刚发布的5.12内核有bug,你们千万别用
  2. linux 系统 安装 nginx 服务
  3. 《Effective Java》—— 对于所有对象都通用的方法
  4. 电脑装机完没有efi_电脑装机如何选内存?看完这篇就全懂了
  5. 用MATLAB将矩阵数据写入txt文件中,打开乱码原因
  6. Linux操作系统的权限代码分析【转】
  7. 创业基础(第7章 创业计划) 来自高校:全国大学生创新创业实践联盟 分类:创新创业 学习规则:按序学习
  8. 数据挖掘之航空公司客户价值分析
  9. 三万字长文带你了解电子设计自动化(EDA)
  10. matlab红外遥感温度反演,热红外遥感地表温度反演研究现状与发展趋势
  11. Linux系统中CentOS光盘的挂载
  12. Rhythmbox 乱码问题
  13. 人生苦短_人生苦短的说说、句子及图片
  14. php deel views,视图 - Views
  15. 21个令程序员泪流满面的瞬间 ...
  16. 简单的PHP测试页代码
  17. 新技术预研Android
  18. 如何有效制服一个杠精
  19. ffmpeg的下载及安装JAVA工具类
  20. 飞控开发--气压计MS5611

热门文章

  1. 拉钩网前端项目实战01
  2. iommu intel-iommu实现
  3. 三大代码审计工具对比
  4. Video Matting:AI视频抠图
  5. unity使用BMFont制作位图字体
  6. 如何用VsCode进行Debug
  7. 揭秘硅谷传奇:惠普的创业故事
  8. Unity 基础 之 Camera摄像机属性介绍
  9. 杂七杂八(7): win7无法安装python3
  10. 爱迪德CA系统与NDS CA系统对比分析(一)