问题描述

    JSON (JavaScript Object Notation) 是一种轻量级的数据交换格式,可以用来描述半结构化的数
据。JSON 格式中的基本单元是值 (value),出于简化的目的本题只涉及 2 种类型的值:* 字符串 (string):字符串是由双引号 " 括起来的一组字符(可以为空)。如果字符串的内容中出现双
引号 ",在双引号前面加反斜杠,也就是用 \" 表示;如果出现反斜杠 \,则用两个反斜杠 \\ 表示。反斜杠
后面不能出现 " 和 \ 以外的字符。例如:""、"hello"、"\"\\"。* 对象 (object):对象是一组键值对的无序集合(可以为空)。键值对表示对象的属性,键是属性名,
值是属性的内容。对象以左花括号 { 开始,右花括号 } 结束,键值对之间以逗号 , 分隔。一个键值对的键
和值之间以冒号 : 分隔。键必须是字符串,同一个对象所有键值对的键必须两两都不相同;值可以是字符
串,也可以是另一个对象。例如:{}、{"foo": "bar"}、{"Mon": "weekday", "Tue": "weekday", "Sun":
"weekend"}。除了字符串内部的位置,其他位置都可以插入一个或多个空格使得 JSON 的呈现更加美观,也可以在一
些地方换行,不会影响所表示的数据内容。例如,上面举例的最后一个 JSON 数据也可以写成如下形式。
{
"Mon": "weekday",
"Tue": "weekday",
"Sun": "weekend"
}给出一个 JSON 格式描述的数据,以及若干查询,编程返回这些查询的结果。

输入格式

第一行是两个正整数 n 和 m,分别表示 JSON 数据的行数和查询的个数。
接下来 n 行,描述一个 JSON 数据,保证输入是一个合法的 JSON 对象。
接下来 m 行,每行描述一个查询。给出要查询的属性名,要求返回对应属性的内容。需要支持多层查询,各层的
属性名之间用小数点 . 连接。保证查询的格式都是合法的。

输出格式

对于输入的每一个查询,按顺序输出查询结果,每个结果占一行。
如果查询结果是一个字符串,则输出 STRING <string>,其中 <string> 是字符串的值,中间用一个空格分隔。
如果查询结果是一个对象,则输出 OBJECT,不需要输出对象的内容。
如果查询结果不存在,则输出 NOTEXIST。

样例输入

10 5
{
"firstName": "John",
"lastName": "Smith",
"address": {
"streetAddress": "2ndStreet",
"city": "NewYork",
"state": "NY"
},
"esc\\aped": "\"hello\""
}
firstName
address
address.city
address.postal
esc\aped

样例输出

STRING John
OBJECT
STRING NewYork
NOTEXIST
STRING "hello"

评测用例规模与约定

n ≤ 100,每行不超过 80 个字符。
m ≤ 100,每个查询的长度不超过 80 个字符。
字符串中的字符均为 ASCII 码 33-126 的可打印字符,不会出现空格。所有字符串都不是空串。
所有作为键的字符串不会包含小数点 .。查询时键的大小写敏感。
50%的评测用例输入的对象只有 1 层结构,80%的评测用例输入的对象结构层数不超过 2 层。举例来说,
{"a": "b"} 是一层结构的对象,{"a": {"b": "c"}} 是二层结构的对象,以此类推。

问题链接:CCF201709-3 JSON查询

问题分析

这是一个文本处理题,处理JSON格式的文件,用于查询关键字的值。

一般而言,文本处理使用的技术有这么几种:一是使用C语言的字符串库函数;二是使用C++的string类的方法;三是使用正则表达式。应该说能够使用正则表达式来处理的话,是最佳的做法,但是需要一定的训练才能做到。

本题这里的解法采用有限状态自动机的思想来编写程序,出现某种语法成分后进入到某一种状态,在某种状态下则做相应的处理。对于文本处理来说,用有限状态自动机的原理进行处理是是否有效的。程序中有三种状态,另外用变量来辅助,最后实现对JSON文本的处理。这种处理是简易的,语法上未必是严密的,虽然能够得100分。

文本处理问题也可以用正则表达式来处理,但是其本质(背后的处理)也是有限状态自动机。

程序说明:(略)

题记:(略)

提交后得100分的C++语言程序如下:

/* CCF201709-3 JSON查询 */#include <iostream>
#include <string>
#include <map>using namespace std;int n, m;
string s, key;
map<string, string> json;
int state;void handle(string& s)
{for(int i = 0; s[i]; i++) {if(s[i] == '{') {if(state == 0) {key = "";} else {
//                cout << "map: " << t << " " << "OBJECT" << endl;json[key] = "OBJECT";}state = 1;} else if(s[i] == '}') {int j;for(j = (int)key.size() - 1; j >= 0; j--) {if(key[j] == '.')break;}if(j >= 0)key = key.substr(0, j);elsekey = "";} if(s[i] == ':') {state = 2;} if(s[i] == ',') {state = 1;} if(s[i] == '"') {  // 双引号string tmp;for(i++; s[i]; i++) {if(s[i] == '\\')tmp += s[++i];else if(s[i] == '"')    // 双引号break;elsetmp += s[i];}if(state == 1) {if(key == "")key = tmp;elsekey += '.' + tmp;state = 2;} else if(state == 2) {
//                cout << "map: " << t << " " << "STRING " + tmp << endl;json[key] = "STRING " + tmp;int j;for(j = (int)key.size() - 1; j >= 0; j--) {if(key[j] == '.')break;}if(j >= 0)key = key.substr(0, j);elsekey = "";state = 1;}}}
}int main()
{cin >> n >> m;getline(cin, s);state = 0;while(n--) {getline(cin, s);handle(s);}while(m--) {cin >> s;cout << (json[s] == "" ? "NOTEXIST" : json[s]) << endl;}return 0;
}

CCF201709-3 JSON查询(100分)【文本处理】相关推荐

  1. 小白能看懂的csp202009-1称检测点查询100分答案

    题目背景 2020 年 6 月 8 日,国务院联防联控机制发布<关于加快推进新冠病毒核酸检测的实施意见>,提出对"密切接触者"等八类重点人群"应检尽检&quo ...

  2. CCF201612-3 权限查询(100分)

    试题编号: 201612-3 试题名称: 权限查询 时间限制: 1.0s 内存限制: 256.0MB 问题描述: 问题描述 授权 (authorization) 是各类业务系统不可缺少的组成部分,系统 ...

  3. oracle查询100到200数据,100分数据库查询语句(ORACLE 11g)

    100分求一个数据库查询语句(ORACLE 11g) 一张表tabl1 如下: epqname             createtime                             e ...

  4. CCF201512-1 数位之和(100分)【进制+文本】

    试题编号: 201512-1 试题名称: 数位之和 时间限制: 1.0s 内存限制: 256.0MB 问题描述: 问题描述 给定一个十进制整数n,输出n的各位数字之和. 输入格式 输入一个整数n. 输 ...

  5. CCF202006-3 Markdown渲染器(100分)【文本处理】

    试题编号: 202006-3 试题名称: Markdown渲染器 时间限制: 1.0s 内存限制: 512.0MB 问题链接:CCF202006-3 Markdown渲染器 问题简述:(略) 问题分析 ...

  6. CCF201912-3 化学方程式(100分)【文本处理】

    试题编号: 201912-3 试题名称: 化学方程式 时间限制: 1.0s 内存限制: 512.0MB 问题链接:CCF201912-3 化学方程式 问题简述:(略) 问题分析:文本处理问题,按字符串 ...

  7. CCF201809-3 元素选择器(100分)【文本处理】

    试题编号: 201809-3 试题名称: 元素选择器 时间限制: 1.0s 内存限制: 256.0MB 问题链接:CCF201809-3 元素选择器 问题简述:(略) 问题分析:文本处理问题,需要有好 ...

  8. CCF201812-3 CIDR合并(100分)【位运算+文本】

    试题编号: 201812-3 试题名称: CIDR合并 时间限制: 1.0s 内存限制: 512.0MB 样例输入 2 1 2 样例输出 1.0.0.0/8 2.0.0.0/8 样例输入 2 10/9 ...

  9. CSP202009-1 称检测点查询(100分)【数学】

    试题编号: 202009-1 试题名称: 称检测点查询 时间限制: 1.0s 内存限制: 256.0MB 题目背景 2020 年 6 月 8 日,国务院联防联控机制发布<关于加快推进新冠病毒核酸 ...

最新文章

  1. 解决:UnicodeEncodeError: 'ascii' codec can't encode character u'\xa0' in position错误
  2. Android 在运行时请求权限
  3. matlab估计arma残差,写给你的金融时间序列分析:补完篇
  4. Apache POI和EasyExcel 第二集:Apache POI的基本Excel写入(分为03版的xls和07版的xlsx)
  5. 2.逆向分析Hello World!程序-上
  6. selenium+chromedriver爬取淘宝美食信息保存到MongoDB
  7. 2259: matrix
  8. Understanding Clouds from Satellite Images比赛的discussion调研与colab数据集下载配置
  9. Qt连接Myql的那些事,关于QT连接报错driverNoLoad问题
  10. 使用Keras框架进行单变量时间序列预测——以上证指数为例
  11. 情爱宝典:识破男女间的“放电”信号
  12. python切片表达式3个参数_Python:Base3(函数,切片,迭代,列表生成式)
  13. kubernetes Containerd shim docker关系
  14. 在linux上,dmg转换成iso或img文件
  15. 介绍一个Office画图工具--visio
  16. JAVA爬取网站查询网络IP所在地
  17. 高端游戏计算机配置单,高端稳定有保障 6000元i7-7700配GTX1060游戏配置推荐
  18. 郭海萍在《蜗居》的台词
  19. Python IDE、IDLE 和 Tcl/Tk
  20. 计算机考试记事本创建文件,你可能永远不知道的记事本功能

热门文章

  1. java中常见的数据结构分类
  2. Grafana全面瓦解
  3. PPT 如何做好关卡设计
  4. 5gh掌上云计算认证不通过_5GH币项目介绍及评级分析
  5. scala中getorElse()方法
  6. python实现qq登录_python实现QQ批量登录功能
  7. apache配置cgi出错_Apache配置实现cgi-阿里云开发者社区
  8. vue查询列表中所有用户信息_vue实现全匹配搜索列表内容
  9. C# 汉字存入bin文件,如何存
  10. 一篇文章快速搞懂排序算法(含实现源码)