erlang xml 解析_用yecc(erlang)写一个json解析器
昨天写了个json的解析器。其实yecc早看过了,只是那时对自己要求太高,想一下子写个小语言。然后大脑就陷入混乱... 后来注意力转移了。就不那么急着去开发些难道大的。今天回来一看,觉得都理解了,实践一下,发现没人写json的,太好了。于是就在纸上写了一下。晚上没事都敲掉计算机里试试。果然很好用。废话就不多说了,不专业的我在readme里面已经写了不少废话了。主要也不知道git有没规范约束readme不能写废话。其实被google骗了一下,有人写过json的erlang解析,每次我搜yrl,它就主动搜url文件。还要点一下坚持搜索才行。看看https://github.com/jchris/erlang-json-eep-parser/downloads这上面就是一个解析器,还好我们写的不是太像,他写的更精细一点。我写的更容易使用上手。我写的就到这下载吧https://github.com/yangyusong/erlang_json_parser。
接着就是讲讲内容了,大学学过编译原理就很容易理解这其中的内容。yrl文件就是erlang中的满足LALR-1规范的解析生成器,相似于yacc。会有很多文章做解释,这里不详述。yrl文件或yacc中的.y这类文件就是给我们写编译规则用的,我们写好一个推理机制,按照规范分解成4部分,放到这一个文件中,那么yecc就可以给我们生成一个符合这个推理规则的解析器,当然这里就是生成.erl的源文件给我们使用,其中会有parse作为默认方法提供给我们解析我们的字符串。
yrl文件中一共有四部分,其实三部分分别用Nonterminals Terminals Rootsymbol关键字来标识,意义很明显,非终结符,终结符,起始符(这个忘了怎么翻译)。要解释一下也行,一个更好的理解方式就是,非终结符可以在推理符号(->)的左边和右边,相当于函数作用,最终分析为终结符的组合。终结符只能在推理符号(->)的右边。意义就是一个符号系统的基本集合。 Rootsymbol是其中一个非终结符,作为推理的起始点。用一棵解析树来表示的话,Rootsymbol就是根节点。Nonterminals就是树枝。Terminals就是树叶。任何一个符合此推理规则的字符串都可以用这样一棵解析树表示出来(我就不画了)。
除了上面说的三部分就剩下最重要的部分了:推理规则。其实这四部分都是列表,只不过Rootsymbol这个表只有一个元素。规则列表有多条,通常每行一条规则,和erlang一样用.结束一条规则。
终结符用单引号引起,冒号后面是我们解析后的erlang表达式。$1,$2,$3这种相似正则表达式规则,也说一下吧,就是对冒号左边的元素作为列表并从1计数。再搞不懂就发邮局问吧,呵呵。
那么这样的一个规则列表就很好建立了,其实这个过程还是有很多规则可以遵循的,其中这里遵循了左递归,终结字符先出现的规则优先表达这两条规则。更多,你还可以画个有限状态机,做一下分析,化解,做成闭包,某些运算还要考虑优先级之类。当然这里这样小的结构基本是最优了,没什么化解的必要。
代码附上
Nonterminals list object kv_list v_list kv k v. % 7
Terminals ',' ':' 'element' '[' ']' '{' '}'. % 7
Rootsymbol object.
object -> '{' '}' : {}.
object -> '{' kv_list '}' : { '$2' }.
kv_list -> kv ',' kv_list : '$1' , '$3'.
kv_list -> kv : '$1'.
kv -> k ':' v : {'$1', '$3'}.
k -> 'element' : '$1'.
v -> 'element' : '$1'.
v -> list : '$1'.
v -> object : '$1'.
list -> '[' ']' : [].
list -> '[' v_list ']' : [ '$2' ].
v_list -> v ',' v_list : '$1' , '$3'.
v_list -> v.
其中object,list就是json中最基本的结构。kv_list就是剥离大括号后的键值对列表。v_list是剥离中括号的列表。
再讲讲这个解析器的使用吧,json_parser就是yrl文件生成的解析器了,我们就用这个解析器来做解析。文件use_json_parser对json_parser的使用做了一个包装,那就是parser/1函数了,我们给它传入json字符串就返回解析后的erlang列表。例如我们输入use_json_parser:parser("{a, b, c}").就会返回[{'{',1},
{atom,1,a},
{',',1},
{atom,1,b},
{',',1},
{atom,1,c},
{'}',1},
{'$end',999}]。
这个文件还提供一个测试函数了unit_test_()。为了方便大家,我还是讲讲测试方法吧。在命令行输入
cd erlang_json_parser
erl -pa ./ebin/ -eval "make:all([{d, 'EUNIT'},{outdir, \"./ebin/\"}, debug_info]) ,eunit:test(\"./ebin\",[]),init:stop()"
参考更多的解析器制作,可以参考erlang官网提供的计算表达式解析,list解析。也可以从其他网站搜到html,xml等的解析,当然如果你看得多一点还会看到aleppo,erlydtl这类的工程。希望更多的人们投入到这些更有意思的开发中。下次再写yecc,就不写这么简单的了。哈哈。不要期待在下一篇里出现哦。
一种更好的态度,更好的学习、思维方式。它会是网络极佳的生存方式,你喜欢就对。
posted on 2011-12-30 23:28 yangyusong 阅读(3306) 评论(0) 编辑 收藏
erlang xml 解析_用yecc(erlang)写一个json解析器相关推荐
- java json帮助类_java 写一个JSON解析的工具类
上面是一个标准的json的响应内容截图,第一个红圈"per_page"是一个json对象,我们可以根据"per_page"来找到对应值是3,而第二个红圈&quo ...
- 用 Go 手写一个 JSON 序列化器
用 Go 手写一个 JSON 序列化器 方案 实现 字符串转义 忽略类型 序列化器主体 数字和逻辑类型 字符串类型 数组类型 字典类型 自定义结构类型 指针类型 API 使用 安装 调用 测试 开源和 ...
- json数据解析_「Flutter实战」22.JSON解析和复杂数据模型转换
22.JSON解析和复杂数据模型转换技巧 json转Model类 创建model文件夹,在里面新建category.dart类 主要根据这个json来分析我们要做成类的样子 json数据 class ...
- 手把手教你实现一个 JSON 解析器!
1. 背景 JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式.相对于另一种数据交换格式 XML,JSON 有着诸多优点.比如易读性更好,占用空间更少等. 在 ...
- json解析对应的value为null_徒手撸一个JSON解析器
Java大联盟 致力于最高效的Java学习 关注 作者 | 田小波 cnblogs.com/nullllun/p/8358146.html1.背景JSON(JavaScript Object No ...
- 一个Json解析库的设计和实现
一个Json解析库的设计和实现 一个Json解析库的设计和实现 设计思路 实现方法 1. 预处理(去除注释) 2. 词法分析 3. 语法分析 4. 树型优化 5. Json树构建 6. 后端处理 整体 ...
- python解释器用什么写的_用 Python 从零开始写一个简单的解释器(3)
到目前为止,我们已经为解释器写了一个词法分析器和 一个解析器组合子库.在这里,我们会创建抽象语法树(AST)的数据结构,使用组合子库写一个解析器,组合子库可以实现将词法分析器返回的标记列表转换为一个抽 ...
- 怎样写一个拼写检查器-贝叶斯-python
怎样写一个拼写检查器 Peter Norvig 翻译: Eric You XU 原版:http://norvig.com/spell-correct.html 翻译:http://blog.youxu ...
- 【ZT】怎样写一个拼写检查器
这篇真的写的很棒,用心领会吧! 怎样写一个拼写检查器 Peter Norvig 翻译: Eric You XU 上个星期, 我的两个朋友 Dean 和 Bill 分别告诉我说他们对 Google 的快 ...
最新文章
- pyautogui 的用法 python自动操作鼠标、键盘
- 浅谈并发与并行(一)
- .net core EFcore model生成数据
- win10管理员已阻止你运行此应用”解决方法
- v系列服务器cpu,服务器cpu v什么意思
- 再见!妈妈再也不用担心我的计算机基础!
- LinQ高级查询、组合查询
- 高大上!手把手教你在京东云擎上部署个人应用!
- WP8.1学习系列(第二十三章)——到控件的数据绑定
- jemalloc java_jemalloc源码结构分析
- kong_团结的面Kong:国际妇女节
- 【沃顿商学院学习笔记】管理学——06腐败带来的间接成本和全球制裁状况Indirect Costs and Sanction
- 拼接播放地址_杰和科技G330六屏拼接主机带来差异化6屏拼接方案
- 关于 Cannot assign requested address 错误
- myeclipse登陆问题
- GitHub 9K Star!Apollo作者手把手教你微服务配置中心之道
- 1000元如何让旧电脑升级改造?这些方案你得学会
- 宁芝普拉姆键盘说明书
- Ext GridPanel多选问题
- Ableton Max for Live Collection ALP 音频MIDI效果合成控制设备拓展合集
热门文章
- 二叉树的后序遍历(非递归算法)
- 原生JS实现轮播图插件
- nginx启动命令以及与配置systemctl
- 电商收付通,多服务商模式
- 分享一些3D打印笔纸膜和交流平台,玩起来吧。
- IDEA常用插件Top18
- 畅捷通T+与畅捷通T+对接集成批量新增销售订单连通存货批量创建(批量新增销售订单)
- 大连商务英语百家外语商务英语与普通英语有何不同
- 微软上新!Chromium 芯的 Edge 浏览器正式版来了
- php对接ai图片处理,php – 使用imagick将.psd和.ai转换为PNG / JPG