通过上一章的阅读,我清楚地认识到了物理、生物和数字世界的区别和联系,从而更深层次地明白了三个世界之间的结合与共同作用,极大程度上拓宽了人类的生存空间与发展未来前景,推动着人类文明的向前与科技的进步。不仅如此,数据在其中地作用也是不可或缺的。以数据为驱动的信息革命使知识的生产成为主要的生产形式,知识成了创造财富的主要资源。以数据为驱动,使信息的传输速度,传输的信息量相较于工业革命时代有了较大飞跃,大大加速了全球化的进程。到底数据是怎样在其中发挥作用并且推动社会进步呢?本章就是围绕数据法则来展开的。

在谈论数据法则之前,我们先对数据的进行了一定的了解。数据可以被定义为反映、记录和展现事物存在及变化的符号。我认为这是较为合理的科学定义。因为数据按性质分类可以分为表示定位数据,定性数据,定量数据,定时数据等。各种类型的数据存在于物理,生物与数字世界中,反应着物理规律与存在的事物变化。如各种物理规律的证明与表达需要依靠数据来实现,再如不管是疫情时期的科学防控,统一部署无不依赖着统计数据等。其中的疫情趋势的预测更是依靠着相似的数据模型计算得到,与实际情况达到几乎吻合。可以说数据很好地达到了对事物及其变化预测的目的。而如果将数据定义为反映、记录和展现物理和生物世界的符号,我认为则不够全面。数据不仅在物理和生物世界里进行交换与表达,也在数字世界中起着至关重要的作用。因为作为“三个世界”理论中的数字世界,它的存在方式也是以数据为主要元素构成的。大到经济的运营小到芯片的研发,数据始终是每一个过程的参与者与贡献者。并且世界上的数据大多数都可以被表示为数字数据,数据可以进行数字化变化,例如可以通过十进制到二进制的转化,可以将量化后的信号再转为数字信号。

在科学数据第一法则的表述中,第一法则被定义为“世界上任何事物均可以被数据化,即客观世界的存在与变化均可被抽象表达为某种符号。任何数据均可以数字比特的方式表述、记录和处理,即世界上的任何事物均可以被数据化,即可被映射到一个虚拟空间表达为某种符号。”数据科学第一法则认为客观世界可以由某种数据系统映射为某种符号,这种符号与所反映的事物的关系有很多种。 首先,这种关系可能是显性关系。比如某些人工的数据系统,它在人类的科技发展与进步中起到了重要的作用,正是因为人工数据系统,使世界中被数据化的事物可以自发地产生,存在,运动并且发挥作用。他们在发展中逐渐与自然地生物数据系统共存发展,使数据系统更加完善。在信息革命中更是增长飞速,使数字世界爆炸性增长。在显性数据中又可以分为直接数据和间接数据。比如某个城镇的面积数据,某条河流的长度数据,某个飞机的速度数据,某种棉花的量产数据等等,这些实在的事物均可以被直接地记录为各种的数据,通过数据使这些事物全面具体地被映射。这些数据并不需要经过各种复杂地处理就可以直接记录为某种数据。除此之外,这种关系可能也是间接的关系,即不可以被直接地表示出来,需要经过一系列各式各样地变化才能被记录,映射,呈现。例如声波的采样与转换为电信号,生物电流的模拟与记录等,这些事物需要一定的运算变化才可以被以某种方法记录下来。而隐性关系则是生物处理系统这些平时不能直接感知得到的,它们不易被人们所察觉却又在生物的进化与发展之中进行着事物的映射的功效。

数据科学第二法则是指:“数据的存在和运动必须依赖于某种物质和消耗一定的能量,并遵循相应的物理规律。”这条法则主要是针对数据的存在与运动的规律提出的。数据的传播与交换并不是无拘无束的,不需要条件的,事实上它需要凭借物质作为媒介来达到目的,除此之外,还需要能量作为动力来推动整个过程的产生与持续。那么数据所映射的现实中的实在事物也就必然需要物质与能量,并且始终遵守着物理规律。例如电磁波是由同向且互相垂直的电场与磁场在空间中衍生发射的震荡粒子波,是以波动的形式传播的电磁场。而场就是一种物质。再入今天的信息时代中,各种数据更是离不开光盘,u盘,硬盘等电子类型的设备储存,哪怕云盘等储存也离不开服务器的支持。这些载体也都是客观实在的事物,就必然遵守物理的规律。在科学发展的过程中,有许多科学家用了多种实验来证明,得到的结果为:即使处于最理想的极限情况,对于数据的处理仍然需要消耗能量。虽然科学发展非常迅速,科学理论非常完备,但总有人认为社会中总有一些现象似乎不需要物质与能量。比如所谓的精神,灵魂,超自然的神学等等,以现在的科学暂时无法合理解释的超物质或现象。这也需要我们对于物理与科技的进一步探索才能发现其中的真相。但许多科幻小说家已经就这种超物质进行了一定的预测与大胆的假设,例如著名科幻小说作家刘慈欣就在他的小说《球状闪电》中就用假设的方法对灵魂做出了解释。再者由长辈们口口相传的经验或者谚语,看似没有经过物理的载体,但如果研究就会发现,这些信息储存在大脑里,而大脑中与记忆相关的细胞与神经也需要消耗一定的能量来保证功能的正常作用,并且它们也受物理定律的影响。这也从侧面证明了数据科学第二法则的正确性与其价值。

不仅如此,数据科学第二法则的另一个实际需要考虑的应用就是如何降低数据比特需要消耗的物质与能量。找到数据的传递过程中所需要的物理与能量的极限,最终趋向于其物理层面上真正意义的极限。而作为电子信息的基石,处理数据的各种载体也在不断地更新,从最开始的由电磁感应来控制的开关继电器,到后来的真空电子管,再到半导体晶体管,以及集成电路的研发。针对芯片上集成的晶体管数目,科学家们又提出了“摩尔定律”。

(摩尔定律)

并基于这个定律形成了“登纳德缩放定律”。在登纳德定律失效后,主要延续摩尔定律所采用的缩小晶体管尺寸的努力与创新,集中在三个方面,分别是改进光刻技术、改进晶体管的材料和结构、减少缩小尺寸的负面影响,如功耗增加等。这与数据科学第二法则所要应用的方向非常符合。整个数字系统的功能和各方面的性能将会随着单个比特的能量和物质的减少指数上升。晶体管开关的速度也有最终极限,要提高开关的速度,就要减少特征尺寸以及晶体管源到漏极沟道的长度,长度越短,电子输运的时间就越短。但同时也会增加泄漏电流而引起静态功耗。另外,栅极与沟道之间的接触面积减少也会影响栅极对电流的控制。所以,当降低栅极电压到约为1V和沟道长度约20nm时,造成的功耗增加超出了芯片和系统热管理的极限,晶体管开关速度不能再继续增加。 我们也期待着这种瓶颈的突破。

数据科学的第三法则可以表述为:数据是协助人与人、人与机以及机与机之间相互作用的媒介,也是人类和智能系统认识和改造世界的工具。这第三法则在现在的信息时代中应用颇深,数据之间的交换变得越来越频繁。随着越来越多基于数据的技术产生并且应用于现实生活中,我们对于物质和能量的处理也在不断提升,数据使我们与客观世界的联系更加紧密,它就像其中的媒介与工具。例如,可以通过数据的收集等各种手段,采集到足够多的数据作为大数据的数据库,再对这些数据进行统一的建模处理,便可对每一类的人有一个准确的三维坐标点,点离的越近的人就会越相似,根据这种数据的分析便可以很轻易的给某个人以精准的人物画像,而企业更会通过这种方式快速的了解一个人的各种方面,并对他采用相应的信息推送或者产品的销售。这种个性化的服务也会让用户消费者对企业产品产生依赖,无形之间完成了人与人之间的相互作用。人与机之间也会通过数据进行相互作用,例如物联网一类的工程,借助各种信息传感器、射频识别技术、全球定位系统、红外感应器、激光扫描器等各种装置与技术,实时采集任何需要监控、连接、互动的物体或过程,采集其声、光、热、电、力学、化学、生物、位置等各种需要的信息,化作数据,通过各类可能的网络接入,实现物与物、物与人的泛在连接,实现对物品和过程的智能化感知、识别和管理。这使人机之间的相互作用变得更加直接且有效。再如机器学习,深度学习等项目,更是通过大量数据的交换来训练机器的智能处理数据的能力,并在此基础上进行模仿学习,以通过图灵测试。

数据科学第三法则还认为人类发展有“虚拟化”趋势,就是随着产生、接收和处理的数据量增加,人类个体和社会的生命和生活将被数据化,最终产生一个高度数据化的自己和数据化世界。那时的数字世界将会给人类带来更大的空间和更多的自由。毫无疑问,数字世界将会为我们带来更多的可能性,比如近些年兴起的移动支付,则是通过数字世界,将货币数据化。随着它的推广与普及,移动支付给与了人们支付方式上的巨大变革,它赋予了人们更多的支付自由。在将来,人的各项数据可能都会被记录并且分析,如情绪,人生经历等数据,这样数据可能使古人与后人进行跨越时空层面的对话与了解。再某种意义上给了人们更多的长久存在的自由。

物理和数字空间均为人类活动的空间。不同的是物理世界中的事物的客观存在一定程度上受种种因素的限制,例如时间或者空间上的限制。而数字世界则不会受上述各种因素的约束,人们可以再数字世界中跨越距离地交流,人们可以在几乎无限的空间中可以发挥自己的创造力,使数字世界更加的丰富,同时当数据量到达一定程度后,数字世界将愈发地真实与广阔。人类将更多地进入由数据构成的数字世界,极大程度上拓宽了人们的生存空间。

通过本章对于数据科学三法则的深入学习,让我可以从不同的视角看待数据以及“三个世界”。科学数据三法则分别从数据的定义,数据的存在与运动,数据的作用三个层面来全面细致地描述了数据。越来越多的数据的产生与交换将会带来科技方面的机遇与进步,同时也会重新定义未来的世界。

参考文献:

黄卫平. 数据智能科学技术导论[M].北京:清华大学出版社,1-274.

深入理解信息科学中三条“数据法则”相关推荐

  1. 统计|如何理解估计量的三条评价标准

    本博文源于<商务统计>,主要探究理解估计量的三条评价标准,为后面的假设检验学习作出相应的铺垫. 估计量起源 我们一般会用样本的一些特性去描述总体的一些特性,以达到最好的估计.样本去估计整体 ...

  2. 【Linux服务器开发】1.4 布隆过滤器-判断海量数据中某条数据是否存在

    目录 0.链接 1.问题的引入 2.看看是否有可供选择的数据结构来帮助我们判断在海量数据中某条数据是否存在  2.1 红黑树 2.1.1 从时间来分析 2.1.2 从空间来分析 2.2 哈希表 2.2 ...

  3. MySQL获取每个分类下面的前三条数据

    现在项目遇到个问题,我相册图片里面有很多分类,我想取出每个分类下面的前三条数据,应该怎么做呢? 数据结构如下: DROP TABLE IF EXISTS `t_picture`; CREATE TAB ...

  4. Oracle取排序的第五条数据,OVER(PARTITION BY)函数介绍 【oracle中按A分组按B排序,再取B中第一条数据的查询】...

    目录 一.小案例: school表中有①id 序号②class 班级 ③score成绩 三个字段, 使用oracle实现按照班级分区,然后取班级中的第一名. 1.1测试数据如下: --创建学校表sch ...

  5. [设计原则与模式] 如何理解TDD的三条规则

    cp from  :  https://blog.csdn.net/ibelieve1974/article/details/54948031 如何理解Bob大叔的TDD三条规则? 第一条和第三条讲的 ...

  6. mysql查询倒数第三个_SQL查询倒数第三条数据 LIMIT + ORDER BY 用法,实例秒懂,避免入坑!...

    Background LIMIT 用错了好几次,经常以为LIMIT(10,20) 的意思是检索第11行到第20行,其实不是! 而应该是检索从第11行开始的后20行数据.今天定要重新写一遍避免自己入坑, ...

  7. python爬虫中三种数据解析方式

    一.正解解析 常用正则表达式: 单字符: .: 除换行以外所有字符 []:[aoe] [a-w]匹配集合中任意一个字符 \d:数字 [0-9] \D: 非数字 \w :数字.字母.下划线.中文 \W ...

  8. MongoDB分组取每组中一条数据

    需求背景 有一个mongo collection,里面存放了运送货物的司机位置信息,字段主要有 _id: mongodb默认的主键字段 orderId:订单id positionTime:位置上报时的 ...

  9. oracle中多条数据的增查,Oracle数据库,数据的增、删、改、查

    oracle数据库中,数据的增.删.改.查,通过SQL语句实现 SQL:结构化查询语言: 特点:不区分大小写:字符串用单引号引起来:语句结束用分号表示结束: 行注释,在语句的最前面加"--& ...

最新文章

  1. MySQL · B+树并发控制机制的前世今生
  2. 杨剑勇:物联网是一个未来概念?其实就在身边
  3. Webstrom卡顿问题解决
  4. 永洪Desktop全能力永久免费 国产数据分析工具迈向新阶段
  5. Android开发工具之Android Studio-合并主干和分支代码
  6. 为减少用户电话排队,阿里研发了智能客服调度系统
  7. 网页设计html加音频,HTML5网页中如何嵌入音频,视频?
  8. 查看Centos7 系统位数
  9. 桂林理工大学计算机研究调剂,2018年桂林理工大学考研调剂信息
  10. php程序301重定向,php 301重定向的实现方法
  11. javascript 跳转页面写法
  12. mysql update case when和where之间的注意事项
  13. Thrift 的原理和使用
  14. 数据库和数据库管理系统的区别
  15. 如何修改图像尺寸?教你两招轻松修改图像宽高像素
  16. matlab 一阶微分方程求解,一阶微分方程的matlab数值解法.doc
  17. 永恒都市3服务器一直维护,感恩有你 《永恒都市3》删档二测已于昨日完美谢幕...
  18. Ubuntu 16.04通过Trickle限制某个软件的下载/上传速度
  19. Android5.0录屏
  20. SpringCloud-1-概念及实现模块间调用

热门文章

  1. 客户端架构(C/S架构和B/S架构)
  2. MySQL事务的隔离级别
  3. 百余个实用网站,一次性分享出来,值得收藏。
  4. RFID电子标签未来发展三大趋势分析
  5. 强化学习笔记:多臂老虎机问题(6)--Upper Confidence Bound
  6. KILE5生成bin文件
  7. HR面-面试题及套路总结
  8. CAD2010在布局中加入标准图框直接打印图纸
  9. 算法-设计模式-框架区别
  10. 中文文本实现word2vec