XML文件简介

在计算机领域,XML(extensible markup language)指的是可扩展标记语言,类似于HTML,它设计的宗旨是传输数据,而不是显示数据,所以这也是它和HTML的一个明显的差别。另外一个差别是XML的标签没有被预定义,我们可以根据自己的需要自行设计标签名字,所以具有自我描述性。

一个具体的例子<?xml version="1.0" encoding="UTF-8"?>

以上就是一个XML的例子,它拥有发送者和接受者,标题,内容等信息,所以自我描述非常清晰。但是这个文档实际上只是包装了一些数据信息,而并没有做任何传输、接收和显示文档的信息,也就说你可以把他当成一个纯文本。纯文本的特点会让你在不同的操作系统进行数据共享的门槛大大降低。

XML结构XML文档是一种树结构,从根部开始扩展到枝叶。第1行是XML声明,它定义版本和编码。第2行是根元素,和第7行相对应,叫做起始标签,叫做结束标签,结束标签有一个"/"符号。

XML文档必须包含根元素,所有元素都可以拥有子元素。

XML文档均可拥有文本内容和属性。例如content元素下,属性time为noon,属性值要加引号。

XML文档元素必须要有结束标签,标签对大小写敏感,而且必须正确嵌套,也就是说一个标签必须完整地嵌套在另一个标签里。

开始读取文件,首先加载XML和RCurl包。library(XML)## Loading required package: bitopsurl

file_url

rootNode

注意:这里,url是https传输的,xmlTreeParse不支持,会报出不是一个XMl文档的错误,所以我们需要先用getURL处理一下,然后用xmlTreeParse函数读取,如果是http的话,就可以直接把url传入xmlTreeParse函数。现在你可以把doc想象成一棵大树,也就是XML文档的树结构,xmlRoot就是获取文档节点的函数。xmlName(rootNode)## [1] "response"names(rootNode)## row

这里,我们通过xmlName函数获取根节点的名称是response,根节点下面包括叫做row的子节点。下面,我们分析一下如下的操作:rootNode[[1]][[1]][[1]]## 410

我们在选择xml文档的节点时可以采用如上的类似于R语言中列表元素的索引。其中rootNode[[1]]我们选择的进入根节点response下面的第一个子节点,就是"row"节点,rootNode[[1]][[1]]进入的就是row节点下的第一个子节点,也叫做row,rootNode[[1]][[1]][[1]],进入的是这个row节点下的第一个子节点就是name节点。所以我们获得了如上的name元素。

r语言 xml html,R语言读取XML文件-xml文件相关推荐

  1. r语言 xmlto html,R语言XML文件

    XML是万维网上使用标准ASCII文本,内部网和其他地方共享文件格式和数据的文件格式. 它代表可扩展标记语言(XML). 与HTML类似,它包含标记标签.但与标记标签描述页面结构的HTML不同,标记标 ...

  2. r语言导出文件为xlxs_R语言学习——R读取txt、csv、xls和xlsx格式文件

    最近项目中运用到了R读取文件数据,所以把相关好用的.经过验证的方法总结了一下,有效避免下次入坑. 1. R读取txt文件 使用R读取txt文件直接使用read.table()方法进行读取即可,不需要加 ...

  3. R语言使用read.delim函数读取带分隔符的文本文件

    R语言使用read.delim函数读取带分隔符的文本文件 目录 R语言使用read.delim函数读取带分隔符的文本文件 #read.delim函数语法

  4. R语言biom包安装和读取文件格式无法识别问题解决

    文章目录 R语言biom包安装和读取文件格式无法识别问题解决 对于无法正常安装的方法,或者出现无法读取biom文件格式问题(可能不是文件格式原因而是包不能识别)可以尝试下面这种方法. R语言biom包 ...

  5. R语言|1.4 R语言读取数据(csv,txt,xlsx)

    R语言|1.4 R语言读取数据(csv,txt,xlsx) 1.4.1获取R的内置数据集 1.4.2模拟特定分布数据 1.4.3导入数据 1)导入txt与csv 2)导入xls与xlsx 1.4.1获 ...

  6. r语言 发送邮件html,r语言读取数据的方法

    R 对于基于 SQL 语言的关系型数据库有良好的支持,这些数据库既有商业数据库 Oracle.Microsoft SQL Server.IBM DB2 等,也包含在 GNUGeneral Public ...

  7. R语言可以直接从数据库读取数据么?R语言读取数据库数据示例

    R语言可以直接从数据库读取数据么?R语言读取数据库数据示例 目录 R语言可以直接从数据库读取数据么?R语言读取数据库数据示例 R语言是解决什么问题的? R语言可以直接从数据库读取数据么?R语言读取数据 ...

  8. r语言electricity数据集_R语言实战学习

    <R语言实战>中文电子版 提取码:lx35 已经学习打卡R语言22天了,可以说是初窥真容--基本了解R的数据和函数:作为程序语言,就是要多练习,多领悟,在实战中发现问题并解决问题. 所以, ...

  9. 【R 数据科学】R语言进行数据科学整理最有用的包大全

    一.数据科学工作流程 1.1 数据导入 1.2 数据整理 1.3 反复理解数据 1.4 数据可视化 1.5 数据转换 1.6 统计建模 1.7 作出推断(比如预测) 1.8 沟通交流 1.9 自动化分 ...

  10. Java如何跨语言调用Python/R训练的模型

    在 如何使用sklearn进行在线实时预测(构建真实世界中可用的模型) 这篇文章中,我们使用 sklearn + flask 构建了一个实时预测的模型应用.无论是 sklearn 还是 flask,都 ...

最新文章

  1. 原码, 反码, 补码, 移码 详解
  2. dotnet安装包时找不到依赖关系_无法加载文件或程序集'Microsoft.AspNet.TelemetryCorrelation'或其依赖项之一 . 该系统找不到指定的文件...
  3. poj 3580 splay
  4. 2020CCPC(长春) - Combination Lock(二分图博弈)
  5. Elasticsearch学习之快速入门案例
  6. Android 频道管理,可拖动item排列,删除,添加
  7. Python Requests 丨爬虫基础入门
  8. 惠普打印机墨盒更换教程_惠普打印机怎么换墨盒 一不小心就洒了一桌子墨水...
  9. whale 帷幄:数字化营销运营 全渠道数字化精益营销管理平台
  10. 常用MATLAB工具箱下载地址
  11. Linux复制文件到某路径并重命名
  12. 读书无用论?那个卖猪肉的北大毕业生,曾经受尽嘲讽,现在身价过亿了
  13. 计算机中毒后开机变慢,电脑中毒后运行慢的解决方法
  14. java的serialization_Java序列化(Serialization) 机制
  15. 使用python+selenium清空淘宝购物车
  16. 咸鱼Micropython— network
  17. python爬取B站动态的评论总数(不含用户评论内容详情)
  18. OpenCV这么简单为啥不学——1.5、解决putText中文乱码问题
  19. 微信公众号自动回复机器人
  20. 树莓派centos踩坑之旅,解决每次重启都需要route add才能有网络

热门文章

  1. 数字货币区块链服务器交易平台面临着哪些安全威胁?有哪些安全防御方案
  2. 计算广告1之在线广告市场和背景
  3. 龙剑服务器为什么总是维修,龙剑龙血之灾活动面向全部服务器开放
  4. 一文搞定:SpringBoot 集成 Apollo 配置中心
  5. android滴滴位置实现,百度地图实现【仿滴滴打车】
  6. VUE仿知乎网站(一)项目分析与设计
  7. 有一首歌 因为你而爱上
  8. 【热度排行】热度排行算法
  9. IDEA插件市场Plugins无法加载如何解决
  10. 【WebGL实战】threejs开发3D游戏 英雄联盟LOL