通用的结构化数据流通工具
通用的结构化数据流通工具
实现数据开放共享的发明专利技术
发明专利技术“契约数据流通系统集群(Contract Data flow System Clusters,申请号202211022937.X,简称数据通)”是一种通用的结构化数据共享交换方法、通用的通信工具。数据通实现结构化数据通信的原理:数据发送方的数据通对结构化数据进行特殊的编码后使结构化数据转化为XML文件,然后把XML文件作为电子邮件的附件而传输数据;数据接收方的数据通从电子邮件中获得XML文件,数据通把XML文件进行特殊的解码后把结构化数据存储到接收方的本地数据库中。数据通以电子邮件作为结构化数据传输的通信工具,因此,数据通可以在全球范围内,在任何人(自然人、法人)、各种信息系统之间实现各种结构化数据的传输,可以大幅度降低数据共享交换的成本。现有技术不能解决数据共享交换问题的根本原因:现有技术是利用Web Service、API开发专用的数据接口(通信工具)实现数据共享交换,成本非常高。
说明:发明专利技术“契约数据流通系统集群(申请号202211022937.X),如有需要,请联系微信fanyz64 、269779216@qq.com。
现状:网络通,为什么“数据不通,业务不通”?
“网络通,数据不通,业务不通”的根本原因在于现有技术是利用Web Service、API技术开发专用的数据接口实现数据共享交换,效率低,成本非常高。
TCP/IP协议使得全球网络通,TCP/IP协议属于非结构化数据的“机机通信”,或“设备通信”,即非结构化数据在计算机之间的通信。
“数据不通、业务不通”是因为此处的“通信”属于结构化数据的“人人通信”,即结构化数据在人(自然人、法人)与人(自然人、法人)之间的通信。
以TCP/IP协议为基础的“机机通信”的特点是:“你发了,我收了,OK了!”
“人人通信”的特点:你发了,我收了;我要知道你是谁;你要对你发的数据承担法律责任;也要让我识别存储;也要使数据流通痕迹可追溯不可篡改。
“网络通,数据不通、业务不通”属于信息孤岛问题、数据开放共享问题,其根本原因在于当前的TCP/IP通信协议只是设备通信协议,未考虑通信中收发双方的人与数据的责任和权利问题,也未考虑结构化数据的多源异构非标问题,或者说TCP/IP通信协议不够全面,未涉及“通信中收发双方的人与数据的责任和权利问题”。因此,要从根本上解决信息孤岛问题、数据开放共享问题,就需要完善TCP/IP协议,或在TCP/IP协议的基础上建立新的通信协议。
发明专利技术“契约数据流通系统集群”是在TCP/IP协议的基础上,为了实现“人人通信”而建立的新协议,简称“TCP/IP+”协议、人类通信协议。
现有技术在实现结构化数据开放共享时存在的问题
信息孤岛问题是大数据时代面临的一大问题,在解决信息孤岛问题实现数据开放共享、互联互通的过程中,数据在不同的地方的流通是其中必不可少的关键环节,因此,非常有必要设计出一种全球通用的、统一的、使用方便的、廉价的结构化数据流通工具,这种工具可以在全球范围内实现各种信息系统之间、各种信息系统与各国的人之间的任何结构化数据的流通,现有技术中没这样的结构化数据流通工具。
现有技术实现数据流通的主要方法有两种,一是利用电子邮件,二是利用点对点数据连接方式。问题是电子邮件只是通过匿名的方式实现非结构化数据的流通,不适合传递结构化数据,电子邮件也可以通过XML文件传递结构化数据,然而不懂计算机技术的普通用户无法处理、识别XML文件中的结构化数据,因此,只是专业技术人员偶尔使用电子邮件传递结构化数据;点对点数据连接方式虽说可以传输各种数据,但这种连接方式只是专用的数据连接方式,不通用,成本非常高。在现有技术中,人们主要利用API、Web Services技术通过数据交换平台、点对点这种专用的双方直接联通的数据连接方式而实现数据共享交换。
数据交换平台是指将分散建设的若干应用信息系统进行整合,通过计算机网络构建的信息交换平台,它使若干个应用子系统进行数据的传输及共享,保证分布异构系统之间互联互通,建立中心数据库,完成数据的抽取、集中、加载、展现,构造统一的数据处理和交换。数据交换平台都是专用的,不是通用的,这些平台的应用范围只是一家企业、一个城市的某个局的某个系统与其下属单位之间数据交换;即各个数据交换平台都有其特定的应用范围,只是针对数量非常有限有若干个应用系统,针对不同范围的应用必须开发不同的数据交换平台,而无法利用一种通用的数据交换平台而实现全球数千万个以上的各种信息系统、数十亿以上的用户之间的数据交换。
目前的数据交换平台不能成为通用的数据交换平台的主要原因有三个:1、API、Web Services技术天生的就是两系统之间直接互联的点对点技术,不可能利用API、Web Services技术而编写出通用的数据交换平台。2、当前数据平台所完成功能是“数据的抽取、集中、加载、展现”;由于当前的各种信息系统中的结构化数据属于“多源、异构、非标”的,要完成“数据的抽取(ETL)”,就必须针对不同的信息系统而设计专用的软件,用现有技术不可能设计出通用的“数据的抽取(ETL)”软件。3、目前没有全球统一的用户身份认证、识别技术,也没有全球统一的信息系统权限管理及用户管理技术,不同的信息系统各自采用不同信息系统权限管理及用户管理方法。
API、Web Services技术的特点是:API、Web Services有提供方及调用方,提供方根据自己的系统的特点而提供相应的服务,调用方通过调用提供方的API、Web Services而完成相应的数据交换。由于不同的信息系统拥有不同的结构化数据,因此不同的系统必须通过不同的API、Web Services而完成不同的数据交换,即不同的系统不可能通过相同的API、Web Services而完成不同的数据交换,这也导致现有的API、Web Services技术不能编写出通用的数据交换平台,正因如此,API、Web Services技术天生的就是点对点技术。
API、Web Services技术在诞生之初就只是为了甲乙双方之间(或一方对多方)完成某种功能而未考虑“通用”的问题,“通用”的数据流通系统所实现的不仅仅是甲乙双方之间数据流通,也包括全球范围内的各种信息系统之间、任何人之间的数据流通。以API、Web Services技术而开发的点对点数据连接方式实现数据流通时需要配置服务器、操作系统、数据库,也要防攻击、防病毒、防篡改,还要开发专用的应用软件。
现有技术(例如数据交换平台)的一个非常关键的问题就是把数据流通与数据治理当作一件事来处理。只有把数据流通与数据治理分开当作两件独立的事件,把数据流通当作一项单独的事件来处理才可能编写出通用的数据流通工具。现有的各种信息系统之所以称作是信息孤岛,一个根本原因在于现有信息系统只是在自己的系统中存贮处理数据,而不能把相关数据发送给用户,使用户也可以存贮、查询数据,例如,电子商务、水费、电费、银行流水、房产交易数据,及用户登录使用各种信息系统而产生的各种数据及这些数据流通的痕迹,这些数据也应该发送给用户,让用户也可以存贮、查询这些数据。
EDI、SWIFT是专用的数据流通工具,不是通用的工具,不能实现各行各业的结构化数据流通。
契约是指双方或多方共同协议订立的有关买卖、抵押、租赁等关系的文书。本发明对契约数据的定义:契约数据与传统的契约相似,契约数据是指双方或多方共同协议订立的有关买卖、抵押、租赁等关系的结构化数据。
契约数据的典型应用场景:A医院使用B医院的有关患者X的化验单数据,相关的问题是出现医疗事故时,如何鉴定各方的责任;买家通过第三方的电子商务平台下单购买商品;这两种数据即可称作是契约数据。
在契约数据流通中,如何表达及识别甲乙双方的身份也是一个大问题,只有当数据接收方可以方便地识别出数据的发送者是谁,相应的契约数据流通工具才是合格的;当前的问题是契约数据流通涉及到全球范围内的数千万个以上的各种信息系统、数十亿以上的用户,现有技术未能实现对全球用户身份进行统一识别,也没有一种简单通用的识别收发数据双方身份的方法。
TCP/IP协议是针对设备之间进行通信的协议,因此这种通信可称为设备通信。由于各种信息系统之间的通信中含有人的因素,因此这种通信可称作人类通信。本发明引入人类通信、设备通信的概念是为了说明通信分为两大类,各有特点,两者之间有本质差异。信息孤岛问题、数据开放共享问题是人类通信中的问题,问题的根本原因在于当前的以TCP/IP为基础的通信是设备通信,TCP/IP协议中未包括与人相关的内容,不适合人类通信,或者说现有的通信技术不能全面解决人类通信中出现的新问题。人类通信与设备通信之间的本质差异在于设备通信是以匿名的非结构化数据为主,人类通信是以实名的结构化数据为主,人类通信涉及到数权,也涉及到多源异构问题。
在法律上,有物权法,对于数据而言,数据也有责、权、利,简称数权。数权也包括是否有权获得数据、对数据承担的责任和义务。设备通信中未涉及数权问题,设备通信关注的重点是可靠性,即如何使数据在传输中不丢失数据,TCP/IP协议中也没有与数权相关的内容。对设备通信而言,我发送数据,你接收到了数据,就OK了,你我之间没有责权利问题。人类通信关注的重点不仅是可靠,更关注数据的可信,即如何确保数据是可以信任的。数据的可信包括:谁发送的数据、谁对数据承担责任,以及数据流通痕迹的可追溯不可篡改。TCP/IP协议中未包含数据可信方面的内容。在数据流通中,数权是收发数据双方对数据的责任和权利。数权是数据流通中必须解决的问题,本发明强调收发数据双方以实名为基础就是为了解决数权相关的问题,数据的发送者必须为所发送的数据承担相应的法律责任。
设备通信是以通信协议为基础,以通用的通信工具而进行通信,例如,浏览器、FTP软件、电子邮件就是设备通信中通用的通信工具。现有技术可以实现人类通信,只是通信方式落后,低效昂贵。以信息系统(其拥有者是法人)之间的通信为例,信息系统是通过用户管理、信息系统权限管理、各个信息系统通过开发专用的点对点式的、两系统之间直接连接的数据接口而实现人与人之间的人类通信。能否设计出犹如浏览器、FTP软件、电子邮件这样的通用的人类通信工具软件?现有技术中没有这样通用的工具软件。本发明的目的就是为了设计出通用的人类通信工具软件以及人类通信协议。
综上所述,利用现有技术,可以用很多方法实现结构化数据的流通,然而,全部都是通过开发专用的点对点这种使通信双方直接互联的数据连接方式实现结构化数据流通,低效昂贵,人们并不满意。
数据通所解决的问题
在本发明中,数据流通指的是不同信息系统、不同人(自然人、法人)之间的结构化数据的流通,同一系统之中的各用户之间的数据流通不属于本发明的范围。本发明所解决的与数据流通相关的共性问题主要有4个:1、数权(用户身份、信息系统权限、数据的责任);2、流通(数据流通及痕迹);3、结构(多源异构数据的存贮查询);4、可信(数据的可信)。
1、数权(用户身份、系统权限、数据的责任)问题:现有的各个信息系统都有自己专用的的用户管理方法和系统权限管理方法。用户要登录某个系统,就必须在登录系统之前首先注册用户,然后再根据用户名和密码登录系统。由于全球的信息系统太多,谁也不可能全部记住曾经使用过的系统的用户名和密码。注册一个用户约需要十分钟,每个人一年要在多个系统中注册用户;一个人一年,在注册用户、遗忘用户名和密码的找回密码方面需要花几个小时的时间。对于全球数十亿用户而言,如果实现了全球统一的用户身份认证管理及信息系统权限管理,由此全球用户每年减少数百亿小时注册用户、遗忘用户名和密码的时间。由于各个信息系统的用户身份认证管理方法各不相同,当全球范围内的数千万个以上的各种信息系统之间共享交换数据时,也会产生各个系统之间不能识别对方的用户身份的问题,数据的接收方不知道是谁发送的数据也就不可能信任接收到的数据。本发明之所以提出契约数据的概念,就是期望在不同的信息系统、不同的人(自然人、法人)之间流通的数据都能成为契约,而成为契约的首要条件就是数据接收者可以准确地了解是谁发送的数据,谁对数据承担责任,也只有知道了是谁发的数据才会成为可信的数据。信息系统中的数据其实是信息系统的拥有者(法人)的数据,由法人承担相应的责任。对于契约数据而言,当系统A把数据发送给系统B时,系统B必须通过某种方法而自动识别出系统A的法人是谁,然而现有技术未做到这一点。现有技术是通过点对点的方式交换数据,双方在事前已知对方是谁,因此,基本上不涉及用户身份识别问题。当前的单点登录及统一身份认证只是针对指定的某个单位、某个地方的有限的若干个系统,而不是全球的各种信息系统。不同的单点登录及统一身份认证系统也各自拥有各自的特点,不同国家、不同地区的单点登录、统一身份认证系统之间也不能相互认证。例如,A省的与B省的统一身份认证系统之间就不能互联互通。当全球范围内的数千万个信息系统之间共享交换数据时,需要有一种全球统一的、通用的用户身份认证、识别及信息系统权限管理方法。
2、流通(数据流通及痕迹):契约数据应该象合同一样,合同双方都有合同原件,收发契约数据的双方也应该都保留契约数据流通的痕迹,这样才能形成具有法律效力的完整的证据链,使得事后可以全面追溯数据流通的轨迹。目前的各种信息系统,例如电子政务、电子商务中的数据都是都只是单方保留数据流通的痕迹,而未把数据发送给普通用户,目前也没有可供普通用户保存、查询、阅读这些结构化数据的通用的工具。
3、结构(多源异构数据的存贮查询):由于大多数信息系统都是采用关系数据库存贮数据,而这些数据都存在多源异构的问题,当数据的接收方到大量的多源异构数据后,数据的存贮查询的代价非常高。
4、可信(数据的可信):数据的可信包括收发数据双方的身份的可信、收发数据的载体的可信、提供数据流通服务的机构的可信、可追溯不可篡改的数据流通痕迹,使数据流通过程成为具有法律效力的完整证据链。
本发明的有益效果
1、用户一次注册身份数据即可登录各种以本发明为基础而设计的各种开放型系统,开放型系统根据用户的真实身份数据而为用户分配相应的使用权限,利用本发明可实现全球统一的用户身份认证及信息系统权限管理,实现单帐号登录各种开放型系统;2、只要可以收发电子邮件,众多的信息系统、众多的人(自然人、法人)之间借助于通用的契约数据流通系统(简称数据通)即可实现各种结构化数据的互联互通,各信息系统不必开发专用的点对点式的数据连接方式的数据接口,也不必配置前置机;这是因为本发明是利用数据通而间接地使两系统之间通信,而不是通过数据接口这种直接通信的方式;3、使数据流通痕迹成为可信、可追溯的、不可篡改的、法律上认可的完整的证据链;4、本发明是一种通用的、使用方便的数据流通工具,可以实现跨层级、跨地域、跨系统、跨部门、跨业务的结构化数据流通,大幅度降低数据流通成本。
发明的思路
本发明的思路是设计出一种犹如轮船一样的通用的运输工具,各种货物(数据)都装到集装箱(数据集装箱)中,然后再把货物(数据)放到轮船上运输到世界各地。由于现有技术中没有通用的结构化数据流通工具,具体到通用的结构化数据流通工具该长啥样、该实现哪些功能、该如何实现,还不清楚,也无章可循。
在初始阶段,想通过API、Web Services技术来编写通用结构化数据接口,然而经过多年的探索才认识到API、Web Services技术只能开发出点对点式的专用数据连接方式,无法开发出通用的数据接口。
是否可以让电子邮件成为结构化数据的载体来实现结构化数据在全球范围内的流通?经过长期试验,此方法是可行的。本发明把结构化数据转化为XML文件作为电子邮件的附件而传递,问题的关键在于如何对结构化数据进行编码解码,以及如何对接收到的数据进行存贮查询处理。
数据通是在接收数据后的数据解码阶段才用到数据集装箱,或者在发送数据之前的编码阶段把数据存入数据发件箱时用到数据集装箱,而不是在运输过程中使用数据集装箱。数据通在实现数据传输过程中,结构化数据是通过电子邮件以XML文件的形式再加上编码数据而进行传递。数据通利用了电子邮件可以实现全球通的特性,电子邮件只是传输工具,数据的编码解码、存贮、查询由数据通完成。由于结构化数据非常复杂,在发送结构化数据的同时也要把有关结构化数据的结构的编码当作电子邮件的一部分发送给数据的接收方,数据的接收方通过解码邮件中的XML文件而获得相应的结构化数据。本发明利用数据集装箱解决了结构化数据在流通过程所存在的多源异构的问题,每一次数据流通中的所有数据都存贮到一个集装箱中,图2为契约数据流通示意图。
数据通传输数据过程参考“图2数据流通示意图”。在“图2 数据流通示意图”中,1是将要发送的结构化数据;2是数据通;3是数据通对数据进行编码,同时把将要发送的数据以数据集装的形式存贮到关系数据库中的表(即数据发件箱);4是数据通利用电子邮件发送数据,5是网络,6是数据接收者的电子邮件系统接收电子邮件(数据),7是数据通从电子邮件系统中接收数据,8是数据通对接收到的数据进行解码并把数据存贮到关系数据库中的表中(即数据收件箱),9数据接收者所看到的与数据发送者所发送的完全一样的数据。
互联网名言:“在互联网上没人知道你是一条狗。”这针对的是匿名数据,然而对于数据流通,“你不但需要知道对方是一条狗,还有必要知道对方是哪条狗。”
本发明是通过可信的第三方机构而实现全球统一的身份认证,以用户的实名邮件地址作为用户名,开放型系统根据用户的真实的身份数据而为用户分配相应的使用系统的权限,用户不必在各个信息系统中注册即可使用开放型系统。
要使流通中的结构化数据成为有效的契约数据,必须满足如下条件,本发明已满足这些条件:
必须能够确定数据的发送方及数据的接收方的身份;
契约数据必须是结构化数据;
数据流通过程必须形成完整的证据链,可追溯、不可篡改;
必须能够方便地实现对收发的结构数据进行存贮、查询;
必须有一种通用的、统一的、标准的、使用方便的、廉价的数据流通工具。
契约数据流通系统集群
契约数据流通系统集群(如图1所示)是由实名邮件注册管理系统及若干个以相同的技术标准而建立的契约数据流通系统和若干个以相同的技术标准而建立的开放型系统组成。
第三方机构
契约数据流通系统集群是由第三方机构提供服务,第三方机构包括数据流通服务机构和数据流通协会。
数据流通协会包括国际数据流通协会、国家数据流通协会。国际数据流通协会由各个国家的国家数据流通协会组成。
国际数据流通协会的职责:1、负责管理国际实名邮件注册管理系统;2、制订与数据流通相关的国际标准、规范、规则、制度、服务公约等;3、负责协调各个国家之间、各个数据流通服务机构之间的关系;使大家遵守统一的国际规范;4、对数据流通服务机构的服务质量监督管理。
国家数据流通协会的职责:1、负责管理本国的实名邮件注册管理系统;2、当数据流通服务机构在实名邮件注册管理系统中注册其实名电子邮件系统时,数据流通协会负责对数据流通服务机构的资格进行审核,审核合格后把数据流通服务机构的实名电子邮件系统登记到实名邮件注册管理系统中;3、对本国的数据流通服务机构的服务质量监督管理;4、制订与数据流通相关的国家标准、规范、规则、制度、服务公约等。
数据流通服务机构的职责:1、通过用户身份管理系统为用户提供注册身份数据服务;负责对用户的真实身份的审核,对用户的身份数据进行备案;提供用户身份数据查询服务:2、利用数据通的“实名邮件系统、发送数据系统、接收数据系统、数据处理系统、数据浏览系统”为用户提供契约数据的流通服务。
- 实名邮件注册管理系统
实名邮件注册管理系统是全球契约数据流通的基础。实名邮件注册管理系统分为国际实名邮件注册管理系统和国家实名邮件注册管理系统。国际实名邮件注册管理系统由国际数据流通协会负责管理。国家实名邮件注册管理系统由各个国家的数据流通协会负责管理。实名邮件系统由数据流通服务机构提供。各个国家的数据流通协会负责审核本国的数据流通服务机构的资质、资格,审核合格后,数据流通协会将在实名邮件注册管理系统中注册数据流通服务服务机构的实名邮件系统。只有在实名邮件注册管理系统中注册、登记的邮件系统才是可信的实名邮件系统。国际实名邮件注册管理系统汇总各个国家的实名邮件注册管理系统中的数据。
数据通是一种实现结构化数据流通的通用的工具,由数据流通服务机构提供,由实名邮件系统、用户身份管理系统、发送数据系统、接收数据系统、数据处理系统、数据浏览系统组成。利用数据通收发数据时,由数据的发送者负责承担与数据内容相应的法律责任。契约数据流通集群中可含有若干个数据通,各个数据通由不同的数据流通服务机构提供服务。
数据通通过实名电子邮件系统实现结构化数据的传输。实名电子邮件系统也一种电子邮件系统,与普通的电子邮件系统的区别在于实名电子邮件系统是在实名邮件注册管理系统中注册的电子邮件系统,而普通的电子邮件系统未在实名邮件注册管理系统注册。实名电子邮件系统只能接收已在实名邮件注册管理系统中注册的实名电子邮件系统所发送过来的电子邮件,也只能向已在实名邮件注册管理系统中注册的实名电子邮件系统发送电子邮件。
为了实现结构化数据的可信流通,实名电子邮件系统与普通的电子邮件系统必须通过技术手段使两者相互隔离,实名电子邮件系统不能向普通电子邮件系统发送电子邮件,也不能接收普通电子邮件系统发送过来的电子邮件。实名电子邮件是为了实现结构化数据的流通,是数据通专用的数据传输工具,并不是为了收发普通的电子邮件,因此,不能向普通用户开放实名电子邮件,也不向普通用户提供使用实名电子邮件的用户名和密码。普通用户只能通过数据通而间接地使用实名电子邮件。
- 用户身份管理系统
要实现全球范围的数据流通,就必须拥有全球统一的用户身份注册、识别的用户身份管理系统才能做到一次注册全球通用,而不能象现在的信息系统那样,每登录一个信息系统之前都要注册用户,然后才能登录使用系统。用户身份是开放型系统及数据流通中的必不可少的关键因素,是确保数据真实可信的基础。用户身份管理系统及相关服务由数据流通服务机构提供。数据流通服务机构的职责:1、对用户身份数据进行审核、确认;2、用户身份数据审核合格后为用户颁发实名数据邮件地址并开通使用数据通的权限。
用户身份管理系统包括:用户身份注册模块、用户身份审核模块、系统初始化模块、用户身份查询模块。用户身份数据注册模块是用户身份管理系统的子系统,用于实现用户注册身份数据,负责接收、存贮用户的身份数据。实名用户包括自然人用户和法人用户两种。用户身份数据注册模块的数据结构及数据内容的示例如下表1所示。在具体应用时,可根据每个自然人、法人的具体情况而由用户自己确定自己的身份数据包括哪些内容,不同用户的身份数据的内容及数据的多少可以各不相同。
表1:自然人身份数据示例表
ID |
事物代号 |
事物属性 |
事物属性值 |
... |
2122 |
数据大类 |
用户身份数据 |
||
2122 |
数据小类 |
自然人身份数据 |
||
2122 |
身份证号 |
4103051964XXXX |
||
2122 |
姓名 |
XXX |
||
2122 |
房产证发证机关 |
X市 X局 |
||
2122 |
毕业证发证机关 |
XXX校 |
||
2122 |
实名邮件地址 |
自然人用户在用户身份数据注册模块注册时需要提供可以证明身份的文件、资料(例如身份证、户口本、职称证、结婚证、驾驶证、工作证、工作单位、职务、工作部门等)。用户可以根据情况而随时申请更新自己的身份数据。法人用户在实名用户身份认证系统注册时需要提供工商营业执照、税务机关税务登记证、组织机构代码证、各种资质证等证明身份的文件。数据流通服务机构负责对用户的真实身份数据进行审查。自然人数据通与工作用的数据通有一定的差异,自然人数据通用于处理与私人有关的数据,工作用的数据通用于处理与工作相应的数据,这是由于工作用的数据通中的数据会由单位汇总存贮,私人数据不便在单位存贮。
表2:法人用户身份数据示例表
ID |
事物代号 |
事物属性 |
事物属性值 |
... |
2165 |
数据大类 |
用户身份数据 |
||
2165 |
数据小类 |
法人身份数据 |
||
2165 |
组织机构代码 |
766246XX-X |
||
2165 |
组织机构名称 |
广州XX公司 |
||
2165 |
组织机构代码证扫描件 |
|||
2165 |
实名邮件地址 |
|||
2165 |
数据通密码 |
******** |
||
2165 |
组织机构代码证 |
|||
2165 |
税务机关税务登记证 |
|||
2165 |
工商营业执照 |
表3:组织机构内部工作人员身份数据示例表
ID |
事物代号 |
事物属性 |
事物属性值 |
... |
3166 |
数据大类 |
用户身份数据 |
||
3166 |
数据小类 |
工作人员身份数据 |
||
3166 |
组织机构名称 |
X省X市X局 |
||
3166 |
组织机构分类 |
政府机关 |
||
3166 |
查询共享数据的权限 |
电子证照 |
||
3166 |
姓名 |
XXXXXX |
||
3166 |
实名邮件地址 |
用户身份审核模块由数据流通服务机构使用,用于审核用户身份数据。数据流通服务机构对用户注册的身份数据进行审核,审核发现问题时通知用户修改;审核用户身份数据合格后为用户颁发实名邮件地址,并为用户开通使用数据通的权限,并调用系统初始化模块完成用户使用数据通的初始化工作。用户登录数据通的用户名及密码统一为“用户的实名邮件地址+密码”形式,这可以实现全球统一的用户帐号管理。
在为用户建立登录数据通帐号后,数据通的系统初始化模块将自动地为用户建立“数据发件箱、数据收件箱”。数据发件箱在关系数据库中以一张表的形式存贮已发送的各种结构化数据,数据收件箱在关系数据库中以一张表的形式存贮已接收到的各种结构化数据。数据发件箱与数据收件箱可设置为数据流通机构的数据库中的表,也可设置为用户自己本地的数据库中的表。
用户身份查询模块用于查询用户的身份数据。在查询用户身份数据时,必须首先征求用户意见,用户同意时,用户身份查询子系统才会提供身份数据。例如,用户A想查询用户B的身份,用户A可以利用自己的数据通向用户B对应的数据流通服务机构的指定的实名邮件,例如webmaster@xxxxx.com,发送查询用户B的身份的请求;数据流通服务机构的用户身份查询模块收到用户A的查询请求后把用户A的请求转发给用户B,若用户B同意向用户A提供自己的身份数据则回复同意;用户身份查询模块接收到用户B同意向用户A提供身份数据时,用户身份查询模块则查询用户B的身份数据并向用户A提供用户B的身份数据;若用户B不同意向用户A提供身份数据时,用户身份查询子系统回复用户A,说明用户B不同意提供身份数据。
- 发送数据系统
数据通的发送数据系统通过如下步骤而发送结构化数据:
步骤1、与发送普通电子邮件一样,输入收件人的邮件地址、邮件标题及邮件内容;用SQL语句把将要发送的结构化数据存贮在DataSet中;发送数据系统自动地把DataSet中的数据转换为XML文件并添加到邮件附件中,并获得结构化数据的数据结构编码,把编码合并到邮件内容中,数据结构编码与邮件内容两者之间以特殊字符分开,例如特殊字符可为“!@~#”;若邮件中包含附件之类的文件,则作为邮件的附件加到邮件中;当结构化数据中含有图片、WORD文档等数据时,结构化数据转换为XML文件后,若不能明确地标识图片、WORD文档等数据,那么数据由XML文件转换为关系数据库中的数据时会出现问题,不能原样转换为对应的数据,因此,需要通过一定的编码来标明结构化数据的数据结构及其中所包含的数据,需要有相应的编码来标明数据的具体内容,数据编码添加到邮件内容中,这是由系统自动实现的,也由系统自动解码。为了避免解码XML文件出问题,应限制数据通发送不是由数据通自己产生的XML文件,若非要发送,则把XML文件转换为压缩文件的方式来发送;数据通在发送数据时,用户身份数据是由数据通根据用户注册的身份数据而生成的,不是用户填写的,这可确保用户身份数据是可信的。用户可设置在发送数据时提供哪些身份数据。
步骤2、在发送邮件之前,首先判断收件方的邮件地址是否为实名邮件地址,若是实名邮件地址则发送,若不是实名邮件地址则不发送数据并提醒用户;
步骤3、数据发送系统发送邮件;
步骤4、数据发送系统调用数据通的数据处理系统,数据处理系统把所要发送的结构化数据及邮件地址、邮件标题、邮件内容及发送者身份数据转换为数据集装箱的结构形式,并把数据存入数据发件箱,若有附件,则附件存入指定的文件夹中;数据发件箱与电子邮件的发件箱是完全不同的,数据发件箱为关系数据库中的一张表,表中存贮的是已发送的各种结构化数据。数据集装箱是记录收发的契约数据的容器,在本发明中,契约数据的每一次的流通中的相关的数据全部存贮在一个数据集装箱之中。
为了方便软件设计人员发送结构化数据,数据通的发送数据系统可以设计为DLL动态链接库。
- 接收数据系统
接收数据系统接收数据的过程与接收普通电子邮件完全相同,所不同的是接收到数据之后如何存贮、处理数据。接收数据系统通过如下步骤接收、存贮、处理数据:
步骤a、在接收之前需要判断相应的电子邮件是不是实名数据邮件,若是则接收,若不是则不接收并提醒用户;
步骤b、接收邮件中的数据;
步骤c、把接收到的邮件的附件存贮到指定的文件夹,该文件夹由数据通自动为每个用户建立,不同用户的数据存入不同的文件夹;接收数据系统所接收的每一个邮件中所有附件全部存入同一个子文件夹,子文件夹名可设置为收件流水号,不同邮件的附件存入不同的子文件夹;
步骤d、调用数据处理系统处理接收到的数据,把数据以数据集装箱的结构形式存入数据收件箱。
- 数据处理系统
数据处理系统的功能之一是把已发送的数据存贮到数据发件箱,功能之二是把接收到的结构化数据经过解码后存贮到数据收件箱之中。
- 数据集装箱
本发明是通过数据集装箱(如图3、图4、图5所示)的方式来解决数据流通过程中的结构化数据的多源异构问题。数据集装箱使得结构化数据流通中的多源异构问题通过标准的数据集装箱而得到解决。交通运输行业是通过如下方式而运输货物:1、货物装入集装箱;2、运输货物;3、接收货物;4、拆箱取货。在本发明中,数据集装箱只是为了在数据发件箱和数据收件箱存贮结构化数据,在数据的传输环节不使用数据集装箱;普通用户所看到的是数据发件箱及数据收件箱中的结构化数据,数据的收发过程是普通用户看不到的,用户在数据收件箱和数据发件箱中看到的是数据集装箱中的内容,因此对普通用户而言数据通犹如是以集装箱的形式传输的。
为了高效地实现数据共享,可以开发数据通的CS架构接收数据系统,其功能是自动地定时接收数据,并把数据以数据集装箱的结构形式存入数据收件箱(也可把数据收件箱设置为本地数据库中的表)。
数据集装箱中的数据分为“数据封面、发送者身份、数据流通状态、数据内容”4个组成部分,同一数据集装箱中的数据全部存入同一张表中。
数据发件箱中的数据集装箱的数据结构和数据内容如表4所示:
表4:数据集装箱、数据发件箱中的数据的数据结构示例
ID |
事物代号 |
事物属性 |
事物属性值 |
... |
38999 |
数据集装箱编号 |
16698 |
【注:数据封面数据】 |
|
38999 |
数据分类 |
数据封面 |
||
38999 |
收件人地址 |
xxxx@xxxxx.com |
||
38999 |
邮件标题 |
销售订单 |
||
38999 |
邮件内容 |
XXXXX |
||
39000 |
数据集装箱编号 |
16698 |
【注:发送者身份数据】 |
|
39000 |
数据分类 |
发送者身份 |
||
39000 |
发送者姓名 |
XXX |
||
39000 |
发送者单位 |
XXX公司 |
||
39000 |
数据发送者的职责权限 |
|||
39001 |
数据集装箱编号 |
16698 |
【注:数据流通状态】 |
|
39001 |
数据分类 |
数据流通状态 |
||
39001 |
数据流通状态 |
已发送到对方的数据通 |
||
39001 |
撤回 |
|||
39001 |
发送数据的时间 |
2022/6/9 |
||
39001 |
接收数据的时间 |
|||
39001 |
回复数据的时间 |
|||
|
39002 |
数据集装箱编号 |
16698 |
【注:数据内容】 |
|
39002 |
数据分类 |
数据内容 |
|
|
39002 |
事物名称 |
销售订单 |
|
|
39002 |
订单编号 |
XXXX79789 |
|
|
39002 |
订单ID |
10248 |
|
|
39002 |
销售负责人 |
赵军 |
|
|
39002 |
订购日期 |
2022/6/9 |
|
|
39002 |
到货日期 |
2022/6/19 |
|
|
39002 |
发货日期 |
2022/6/10 |
|
|
39002 |
运货商 |
四通货运 |
|
|
39002 |
运货费 |
32.38 |
|
39002 |
货主名称 |
余小姐 |
||
|
39002 |
货主地址 |
光明路124号 |
|
39003 |
数据集装箱编号 |
16698 |
||
|
39003 |
数据分类 |
数据内容 |
|
|
39003 |
数据大类 |
产品销售系统 |
|
|
39003 |
数据小类 |
销售订单明细 |
|
|
39003 |
事物品种 |
猪肉 |
|
39003 |
订单ID |
10248 |
||
|
39003 |
商品名称 |
排骨 |
|
|
39003 |
单价 |
50 |
|
|
39003 |
数量 |
12 |
在数据通中,每个用户拥有一个数据发件箱,每个用户的数据发件箱中的全部结构化数据全部存贮到一个指定的表中,该表由系统自动生成。数据通每发送一个邮件,邮件中的数据都存贮到一个数据集装箱中,数据集装箱的数据结构如表4所示。在数据发件箱中,每一个数据集装箱都有一个唯一的数据集装箱编号。数据集装箱的编号由数据通统一编码,数据集装箱编号一般可设置为发件流水号。在数据发件箱中,数据集装箱的数据分为“数据封面、发送者身份、数据流通状态、数据内容”4个组成部分。
数据发件箱中的数据集装箱的数据封面的数据内容为:数据集装箱编号、数据分类(注:数据分类对应的数据为“数据封面”)、收件人地址、邮件标题、邮件内容。
发送者身份数据的内容为:数据集装箱编号、数据分类(注:数据分类对应的数据为“发送者身份”)、发送者姓名、发送者单位、数据发送者的职责权限等内容。若发送者为自然人用户则发送者身份数据中可不包括“发送者单位、数据发送者的职责权限”。数据发送者身份数据由用户设置,用户可设置为对方提供哪些身份数据;身份数据的内容是由数据通根据用户身份管理系统中的数据而生成。
数据流通状态的内容为:数据集装箱编号、数据分类(注:数据分类对应的数据为“数据流通状态”)、数据流通状态、撤回、发送数据的时间、接收数据的时间、回复数据的时间。数据流通状态数据由数据通自动生成。“数据集装箱编号”是当前的数据通所发送的数据及相关内容的数据集装箱编号;“数据流通状态”表明数据是否已发送到对方的数据通中、对方是否已接收到数据(由数据接收方的数据通反馈过来);“撤回”是撤回当前发送的数据,若对方已接收数据,则不可撤回;“接收数据的时间”由数据接收方的数据通反馈过来。“数据流通状态”的内容由数据通系统自动生成。
数据内容中的相关数据项为:数据集装箱编号、数据分类(注:数据分类对应的数据为“数据内容”)、相关的结构化数据的内容。数据通只负责收发结构化数据,不对收发的数据的内容进行限定,发送什么样的数据完全由发送者自己决定。数据通只负责原样传输数据,不对数据的真实性负责,数据的发送者需要对发送的数据承担相应的法律责任。
数据收件箱中的数据集装箱的数据结构及数据内容如表5所示:
表5:数据集装箱、数据收件箱中的数据及数据结构示例
ID |
事物代号 |
事物属性 |
事物属性值 |
... |
77328 |
数据集装箱编号 |
6828 |
【注:数据封面数据】 |
|
77328 |
数据分类 |
数据封面 |
||
77328 |
发件人地址 |
XXXX@XXXX.COM |
||
77328 |
邮件标题 |
销售订单 |
||
77328 |
邮件内容 |
XXXXX |
||
77329 |
数据集装箱编号 |
6828 |
【注:发送者身份数据】 |
|
77329 |
数据分类 |
发送者身份 |
||
77329 |
发送者姓名 |
XXX |
||
77329 |
发送者单位 |
XXX公司 |
||
77329 |
数据发送者的职责权限 |
|||
77330 |
数据集装箱编号 |
6828 |
【注:数据流通状态】 |
|
77330 |
数据分类 |
数据流通状态 |
||
77330 |
数据流通状态 |
未回复(已回复) |
||
77330 |
发送数据的时间 |
|||
77329 |
接收数据的时间 |
|||
77330 |
回复数据的时间 |
|||
|
77331 |
数据集装箱编号 |
6828 |
【注:数据内容】 |
77331 |
数据分类 |
数据内容 |
||
|
77331 |
事物名称 |
销售订单 |
|
|
77331 |
订单编号 |
XXXX79789 |
|
|
77331 |
订单ID |
10248 |
|
|
77331 |
销售负责人 |
赵军 |
|
|
77331 |
订购日期 |
2022/6/9 |
|
|
77331 |
运货商 |
四通货运 |
|
|
77331 |
运货费 |
32.38 |
|
|
77331 |
货主名称 |
余小姐 |
|
|
77331 |
货主地址 |
光明路124号 |
|
|
77332 |
数据集装箱编号 |
6828 |
|
77332 |
数据分类 |
数据内容 |
||
|
77332 |
数据大类 |
产品销售系统 |
|
|
77332 |
数据小类 |
销售订单明细 |
|
|
77332 |
事物品种 |
猪肉 |
|
77332 |
订单ID |
10248 |
||
|
77332 |
商品名称 |
排骨 |
|
|
77332 |
单价 |
50 |
|
|
77332 |
数量 |
12 |
在数据通中,每个用户拥有一个数据收件箱,每个用户的数据收件箱中的全部结构化数据全部存贮到一个指定的表中,该表由系统自动生成。在数据收件箱中,每一个数据集装箱都有一个唯一的数据集装箱编号。数据集装箱的编号由数据通统一编码,数据集装箱编号一般可设置为收件流水号,数据收件箱中的数据集装箱编号与数据发件箱中的数据集箱编号不是同一个编号。数据通每接收一个邮件,邮件中的数据都存贮到一个数据集装箱中,数据集装箱的数据结构如表5所示。在数据收件箱中,数据集装箱的数据为“数据封面、发送者身份、数据流通状态、数据内容”4个组成部分。
数据封面的数据内容为:数据集装箱编号、数据分类(注:对应的数据为“数据封面”)、发件人地址、邮件标题、邮件内容。
发送者身份的数据内容为:数据集装箱编号、数据分类(注:对应的数据为“发送者身份”)、发送者姓名、发送者单位、数据发送者的职责权限等,若发送者为自然人用户则发送者身份数据中可不包括“发送者单位、数据发送者的职责权限”。发送者身份数据由发送者所用的契约流通系统根据发送者身份数据及发送者自己的设置而生成的。
数据流通状态的数据内容为:数据集装箱编号、数据分类(注:对应的数据为“数据流通状态”)、数据流通状态、发送数据的时间、接收数据的时间、回复数据的时间。数据流通状态数据由数据通自动生成。此处的“数据分类”为“数据流通状态”;“数据流通状态”为“未回复、已回复”,“数据流通状态”的内容由数据通系统自动生成。
数据内容中的相关数据项为:数据集装箱编号、数据分类(注:对应的数据为“数据内容”)、相关的结构化数据内容。
接收数据时数据处理系统处理数据的步骤:步骤a、接收邮件中的数据;步骤b:从邮件内容中截取与数据结构相关的编码;步骤c、根据数据编码把接收到的XML文件解码成结构化数据;步骤d、把“发件人邮件地址、邮件标题、邮件内容”、数据流通状态及解码后的数据存入数据集装箱;步骤e、把数据集装箱中的数据存入数据收件箱中。
数据收件箱、数据发件箱是关系数据库中的表,该表可以设置为数据流通服务机构的关系数据库中的表;也可设置为用户方局域网中的关系数据库中的表,这样就可以使用户在本地的数据库中处理收发的结构化数据。
为了方便普通用户使用数据通,数据通在展示数据的形式上与电子邮件类似,数据通自动地把接收到的数据转换为结构化数据。对普通用户而言,接收、浏览各种结构化数据犹如电子邮件那样简单,这是现有技术未做到的,目前也没有这样的产品。数据通可以接收各种信息系统发来的各种各样的结构化数据,例如水电费、银行流水、电子商务等方面的结构化数据。
与普通电子邮件所不同的是:普通用户在数据通所看到的是结构化数据,电子邮件中的数据是非结构化数据。
- 为什么用万能数据结构表、数据集装箱存储收发的结构化数据?
这是为了解决“多源异构问题”。
当数据的接收方接收到来源于成千上万个不同的信息系统发过来的数万个以上结构各不相同的异构结构化数据时,这些数据的存储、查询就是个大问题。
可以开发出通用的万能查询系统。
方便普通个人用户查询浏览接收到的数据。
- 数据浏览系统
数据通的数据浏览系统可以两种方式展示接收到的数据,一是以数据集装箱的结构方式展示给用户;二是把数据集装箱中的数据转换为若干张二维表方式展示给用户,二维表中的数据存贮在DataSet中,对用户而言,发送的是若干二维表中的数据,接收的也是二维表中的数据,这可以使用户所看到的数据的结构形式与发送所发送的结构完全一样。
- 匿名数据流通系统
数据流通系统可分为实名数据流通系统、匿名数据流通系统及内部用流通系统。匿名数据流通系统所收发的只是数据,数据是否可信完全由数据的接收者自己判断,数据的发送者不必为数据的真伪承担法律责任。数据通与匿名数据流通系统相互隔离,不能直接互联互通,目的是为了尽量避免用户因操作的失误而把匿名数据发送到实名的数据通中。匿名数据流通系统与数据通的原理是一样的。内部数据流通系统的原理与实名数据通是一样的,只是只能供组织机构内部使用,不能与外界的系统互联互通。内部数据流通系统只要遵守内部规定即可。
- 开放型系统的设计方法
开放型系统的定义:以实名电子邮件地址作为用户名,以用户身份数据作为信息系统权限管理的基础,以数据通作为数据流通的工具的信息系统,从而实现全球统一的“单帐号登录系统、用户身份认证、系统权限管理、数据流通”的信息系统称作是开放型系统。开放型系统是在数据通的基础上而实现的。
开放型系统主要是为了解决两个问题:一是实现“单帐号登录、统一登录”,用户只要在数据通的用户身份管理系统中“一次注册”身份数据,即可做到全球通用,不必在各个开放型系统中再注册用户,用户直接输入实名邮件地址即可在全球范围内使用各种开放型系统。二是全球范围内众多的信息系统都可以利用数据通把数据发送给用户,用户可以保存、查询数据流通痕迹。
对于传统的契约而言,双方都要保留契约原件,然而在现有技术中,现有的各种信息系统,例如各种电子商务平台、电子政务平台都只是平台单方保留数据流通痕迹,而平台未把数据流通痕迹发给最终用户方。此处的数据流通痕迹指的是结构化数据而不是非结构化数据。电子商务平台虽保留了买卖双方的数据流通痕迹,然而不同的电子商务平台所产生的数据也难以汇总,也不能让最终用户可以通过一种工具而查询在各平台上所产生的数据流通痕迹,因各平台所产生的数据是结构各不相同的结构化数据,即多源异构的数据。
本发明所实现的是“一次注册用户身份数据,然后用同一用户帐号登录全球范围的开放型系统”。本发明中的用户帐号统一为“实名邮件地址+密码”,或只要“实名邮件地址”不要“密码”也可以登录全球范围的所有开放型系统。
在信息系统权限管理方面,本发明与传统方法也完全不同。传统的“统一认证及单点登录”系统是根据注册的用户而为用户授权,根据授权而发令牌,根据令牌而登录同一单位内部的各种信息系统,从而实现单点登录。本发明的“统一注册,单帐号登录”所实现的是:用户只要在契约数据流通系统集群中的任何一个数据通中的用户身份管理系统中注册一次用户身份数据并获得用户帐号后,用户就可以用这一个帐号而登录全球范围内的所有开放型系统。现有技术的问题是未能实现统一注册,因此,肯定实现不了统一认证;只有实现全球用户的身份数据的“统一注册”,才能实现全球信息系统的用户身份“统一认证”,因为注册是认证的基础。本发明不要求用户在同一数据流通服务机构注册身份数据。用户可在不同国家、不同的数据流通服务机构的用户身份管理系统中注册用户,各个数据流通服务机构必须是采用全球统一的、标准的用户身份注册方法,用户身份数据的结构和数据内容也必须标准化,特别是不同国家、不同语言的用户身份数据也必须符合统一的标准,只有数据结构、内容统一、标准,才能实现统一认证。概括而言,本发明所实现的是“全球统一身份注册、统一身份认证、统一用户帐户管理、统一权限管理”。
开放型系统以两种方式实现用户登录系统并实现“一次注册用户全球通用”的用户管理的方法:
第一种是以“实名邮件地址+密码”的方式登录开放型系统,相应步骤是:
步骤a1.1、用户X在第一次登录某个开放型系统时,在系统中输入自己的实名邮件地址及自己设定的密码,然后点击登录系统;
步骤a1.2、开放型系统判断用户X是不是第一次登录系统,若用户X是第一次登录开放型系统,则开放型系统通过数据通的用户身份管理系统获得用户身份数据:
步骤a1.3、开放型系统接收到用户X的身份数据后根据用户X的身份数据而为用户X分配使用系统的相应的权限,并记录用户的身份数据;开放型系统记录用户X设定的“实名邮件地址+密码”的登录系统的帐号并允许用户X登录系统;
步骤b1.1、若用户已登录过开放型系统,用户X可用“实名邮件地址+密码”方式而登录系统。
第二种是以“只要实名邮件地址,不要密码登录系统”的方式登录开放型系统,相应的步骤是:
步骤a1.1、用户X在登录某个开放型系统时输入自己的实名邮件地址;
步骤b1.1、开放型系统判断用户X是不是第一次登录系统,若用户X是第一次登录系统,则开放型系统通过数据通的用户身份管理系统获得用户身份数据:
步骤b1.2、开放型系统接收到用户X的身份数据后根据用户X的身份数据而为用户X分配使用系统的相应的权限,并记录用户的身份数据;
步骤b1.3、开放型系统把用户登录系统的链接发送到用户X的数据通;
步骤b1.4、用户X在自己的数据通中点击链接地址即可登录开放型系统;
步骤b2.1、若用户已登录过开放型系统,开放型系统根据已记录的用户身份数据而直接把用户登录系统的链接发送到用户X的数据通,
步骤b2.2、用户X在自己的数据通中点击链接地址登录开放型系统。
各数据通可统一采用“webmaster@实名电子邮件域名”的实名邮件地址接收用户身份数据查询请求。开放型系统通过可信的第三方数据流通服务机构而获得用户真实的身份数据,再根据用户身份而为用户分配使用系统的权限。
开放型系统的系统权限管理的实现步骤:步骤a、根据用户的身份数据而为用户分配使用系统的角色;步骤b、根据用户的角色而为用户分配使用系统的权限。例如,根据用户的性别、年龄而为用户分配不同的使用系统的角色、权限,也可以根据用户的工作单位、职务、部门等而为用户分配不同的使用系统的角色、权限,也可以根据用户的国籍、居住地、民族等而为用户分配不同的使用系统的角色、权限。
对于传统的契约而言,只有当事人双方都签字确人后才生效,双方都要保留契约原件。目前的信息系统在接收组织机构之外的用户数据时存在的问题:用户在信息系统录入数据后,信息系统会留下用户录入数据的记录,然而用户方未能留下自己录入的数据的记录。在设计开放型系统时,要求开放型系统及系统的用户双方都留下双方交流的数据流通痕迹。开放型系统与系统用户之间的数据交换、使双方都能保留数据流通痕迹是按以下步骤来实现:步骤a、开放型系统通过数据通而把用户录入的数据,或系统产生的与用户相关的数据,发送给用户;步骤b、用户在自己的数据通中对数据进行核对;步骤c、用户对数据核对无误后给开放型系统回复确认;步骤d、开放型系统根据用户回复的意见而处理用户录入的数据,或处理系统产生的与用户相关的数据。
当前的各种在互联网上运行的信息系统只要少量的升级改造即可成为开放型系统,只要对下面三方面的内容进行升级即可:以实名电子邮件地址作为用户名、以用户身份数据作为信息系统权限管理的基础、以数据通作为数据交换的工具。现有的信息系统通过上述的升级,即可升级为开放型系统,并实现全球统一的身份认证识别、系统权限管理、数据流通。
- 推式数据通信的实现方式可按以下步骤实现:
步骤1、各种信息系统通过数据通把结构化数据推送到数据接收方的数据通中;
步骤2、数据接收方从数据通的数据收件箱中接收、处理收到的数据。
- 拉式数据通信(简称“拉式共享”)通过如下操作步骤而实现:
步骤a、数据需求方通过数据通向数据提供方发送查询处理数据的参数,该参数的格式由数据提供方设定,参数存贮在二维的表中即可,数据需求方只要按数据提供方设定的格式设置查询参数即可;步骤b、数据提供方从数据通中接收数据;步骤c、数据提供方利用用户身份管理系统的查询模块查询用户身份,并根据用户身份判断数据需求方是否具有查询处理数据的资格、权限,若有查询处理数据的资格、权限,则执行一步的查询处理数据操作;步骤d、数据提供方判断数据需求方提供参数是否符合要求,若参数合格则根据参数而执行相应的功能;若参数不合格则通过数据通回复数据需求者参数不合格;步骤e、数据提供方根据接收到的参数查询处理数据;步骤f、数据提供方利用数据通把查询处理结果发回给数据需求方;步骤g、数据需求方从数据通中获得查询处理结果。
拉式数据通信的适用范围:数据需求方发送结构化数据作为查询处理数据的参数,数据提供方返回结构化数据的应用。通过本发明的数据通而实现结构化数据通信可以大幅度降低数据流通的成本而不需要配置前置机,因为数据通与业务系统之间是通过电子邮件而间接联系。利用拉式数据通信可以实现不同单位之间的数据共享。
利用数据通按以下步骤即可实现不同单位之间的协同审批:1、用户A通过数据通将数据(例如该数据可以是公文、订单、合同等)发送给用户B(或多个用户);2、用户B通过数据通接收数据;3、用户B对数据进行编辑并加上自己的意见;4、用户B通过数据通把编辑后的数据发回给用户A,或发送给用户C(或多个用户)。
注意事项
注意事项:1、本发明把数据流通当作单独的一件事来处理,所实现的是结构化数据的流通,即照原样收发结构化数据,不包括数据的识别及治理,数据的识别及治理由收发数据的双方根据实际情况而处理;2、为了使契约数据流通集群能在全球范围内成为通用的数据流通工具,使开放型系统成为单帐号登录的系统,必须使数据通和开放型系统的用户和权限管理统一化、标准化,必须按同一标准而设计数据通和开放型系统。
同一个契约数据集群的定义:按同一标准而开发若干个数据通及若干个开放型系统所组成的集群是同一个集群,相应的数据通之间可以实现互联互通,相应的开放型系统可以实现单帐号登录。按不同标准而设计数据通及开放型系统所组成的集群是不同的集群,不同的集群之间在实现互联互通时会出现问题。
开放型系统的标准化设计要求:开放型系统必须以“用户登录帐号、用户身份注册、用户身份认证、信息系统的权限管理”的统一化和标准化为基础,即“统一采用‘实名邮件地址+密码’,或‘只有实名邮件地址,不需要密码’的用户帐号管理方式”,统一根据用户身份管理系统中的用户真实身份数据而进行用户身份认证,用户身份管理系统中的用户身份数据的数据结构和数据内容必须标准化、统一化,统一根据用户真实身份数据而为用户分配系统使用权限。
数据通的标准化设计要求:“用户身份管理系统中的用户身份数据的数据结构和数据内容、发送数据系统的发送数据的方法及发送数据的编码、数据接收系统的接收数据的方法及接收数据的解码、数据集装箱的数据结构”必须标准化、统一化。
若将契约数据流通系统集群中的各个系统折分之后应用则不能产生出本发明的技术效果,例如,若无契约数据流通系统集群,就不可能实现单账号登录系统,也不可能实现可信的结构化数据的流通。单帐号登录系统需要以数据通中的户身份管理系统为基础,而这是契约数据流通系统集群的一部分,数据通由数据流通服务商提供,数据流通服务商则由协会审核、监督管理才能做到数据流通的可信。本发明的技术效果是在契约数据流通系统集群中的各个系统及其子系统和国际数据流通协会、各个国家的数据流通协会和众多的数据流通服务商的整体作用下而产生的。
数据通实现数据共享交换的优势:高效廉价、无接口通信
不需要一一注册用户:API需要用户一一注册。
减少租用云服务的费用
一个实名邮件地址即可收发各种结构化数据,即实现了互联互通。接收到大量的软件系统所发送过来的数万种以上的异构数据之后,如何存储、查询。例如,普通用户,水费、电费、物业费、资金流水帐、购物清单、登录各种网的办事情况,多源异构,如何浏览收到的数据?
针对原来无法收发结构化数据。或需要开发专用的数据接口才能实现点对点通信。
有了CDSC,就可以收到各种结构化数据,不需要数据接口。与短信、电子邮件不同,是结构化数据。
单帐号登录
记录数据流通痕迹,可追溯不可篡改。点对点在记录数据流通痕迹方面有缺陷,没有第三方参与,不公证。
不需要开发接口就可以接收到数据,尤其是普通用户。
通用的结构化数据流通工具相关推荐
- 非结构化数据定义、处理方法及重要性
一.非结构化数据定义 不方便用数据库二维逻辑表来表现的数据即称为非结构化数据,包括所有格式的办公文档. 文本.图片. 标准通用标记语言下的子集 XML. HTML.各类报表.图像和音频/视频信息等等. ...
- 分析非结构化数据的10个步骤
如今,数据分析正在成为企业发展的重要组成部分.企业必须对结构化和非结构化数据有所了解,才能更好地为业务发展做出正确决策.以下是帮助企业分析非结构化数据的10个步骤: 0 1 确定一个数据源 了解有利于 ...
- 非结构化数据 mysql_Apache Sqoop 结构化、非结构化数据转换工具
简介: Apache Sqoop 是一种用于 Apache Hadoop 与关系型数据库之间结构化.非结构化数据转换的工具. 一.安装 MySQL.导入测试数据 2.导入测试数据 mysql > ...
- 【C/C++13】天气APP:数据挖掘/HTTP协议/非结构化数据存储(filetoblob.cpp),数据管理/监控告警(hsmtable.cpp,tbspaceinfo.cpp)
文章目录 1. 数据挖掘:/etc/rc.local,sudo su 2.HTTP协议:优先wget 3.非结构化数据存储:blob,pzhrain24file 4.数据管理子系统:数据字典表 5.监 ...
- 我被“非结构化数据包围了”,请求支援!
阿里妹导读:非结构化数据的内容占据了当前数据海洋的80%.换句话来说,就是我们都被"非结构化数据"包围了.由于非结构化数据的信息量和信息的重要程度很难被界定,因此对非结构化数据的使 ...
- 非结构化数据和结构化数据提取
页面解析和数据提取 一般来讲对我们而言,需要抓取的是某个网站或者某个应用的内容,提取有用的价值.内容一般分为两部分,非结构化的数据 和 结构化的数据. 非结构化数据:先有数据,再有结构, 结构化数据: ...
- DAMA数据治理与数据质量--非结构化数据的数据质量管理
本文根据汪广盛先生在[DQMIS 2020第四届数据质量管理国际峰会]现场演讲内容整理而成. 图1.1 DAMA(国际数据管理协会)中国区主席 汪广盛 演讲嘉宾介绍 -- 汪广盛 国际数据管理协会( ...
- web系统中的结构化数据标记
Web 系统的设计要点之一是内容和表示的分离,网站以HTML发布内容,对内容进行操作的服务也只能访问 HTML.随着表现形式各异的设备在大量地增加,也大大增加了网站针对不同表示格式的数量.同时,一些新 ...
- 未来电子病历系统 以结构化数据为核心
未来电子病历系统 以结构化数据为核心 2014-04-06 病历包含与疾病过程有关的临床发现.诊断.检验结果和治疗信息.如何提高电子病历的标准化和有序化,更好地反映医护者的思路,临床发现.为制定治疗计 ...
最新文章
- 基于矩阵分解的推荐算法
- 以太坊DApp开发环境搭建
- 用户名 不在 sudoers文件中,此事将被报告
- iView 实现可编辑表格
- 【转】windows Server2012安装iis
- 【STM32】窗口看门狗相关类型和函数
- Android开机自启动 .
- Ubuntu下安装tilix终端仿真器
- java 生成随机数_Java 生成随机数的 N 种方法
- leveldb - 并发写入处理
- 地震了?不,是心动了!
- 双拼输入法键位图_你知道双拼输入法吗?
- python运行出现SyntaxError: 'return' outside function的原因和解决办法
- python处理grd格式文件_Surfer的grd文件格式说明
- 华中科技大学计算机学院本科生宿舍,[业余派]告诉你一个真正的华中科技大学...
- You are using pip version 21.2.4; however, version 22.0.4 is available.
- 干辣椒和鲜辣椒的区别
- Python快速复制粘贴ins数据,采集网站内视频内容
- windows安装pgsql exe后开启服务sql shell(psql)登录
- pure virtual method called terminate called without an active exception Abor