说明

数据是抽象的,数据处理的工艺也是抽象的,我觉得需要有一些可见的模型进行类比才好记忆和思考。我一直把数据处理和实体制造进行类比,也可能是我过去做过一些制造业的管理咨询有关系,我觉得很自然。

本篇就着一个小bug来探讨一个更具体的思维模型(不是数学模型或计算机模型)。

内容

1 制程(Schema)

在过去,我一直把数据处理想象成一条流水线。工艺的变化也就是一个产品的制造过程变化,有时候是小改动,有时候是大改动。与实体制造不同,现在数据的制造可以无损的重复千万次,很多时候计算机也就在千万次的计算、比较然后迭代找到可行解。

整体上,目前已经构造了分布式网络,来进行大量的存储和计算。当然离完成还有很多工作,但是从数据库上、优化算法上都已经ready,目前只是随着时间去逼近。

制程在整体的抽象模型上是偏上层的,现在碰到很多问题还是底层的居多。

2 过程(Procedure)

某个制程是由若干个过程组合在一起形成

这次的主题其实是关于过程的,如何将一个过程变得更加可靠和简单。

虽然数据的结构可以有很多种,实际上在接口间传递数据时也是采用字典的方式。但是我们可以认为传过来的原始数据是一个“包”,过程的第一步是将这个包打开,然后取出对应的要处理的材料。处理之后也无非再打一个包。打包和解包的规范是一个标准,例如这些包可以都是一个扁平字典:

  • 1 data: 数据,通常是列表形态
  • 2 msg: 消息字符串

建模杂谈系列159 数据“板材“模型相关推荐

  1. 建模杂谈系列100 数据工厂

    说明 我觉得这个概念可以把很多之前讲的概念串起来.概念是非常重要的(<反脆弱>有提到),找到合适的概念来表达思想可以更好的帮助思考和分析. 内容 数据工厂包含了两方面的解释: 1 从业务上 ...

  2. 建模杂谈系列62- knime模型实例1- 流失预测 Churn Prediction

    说明 KNIME是一个开源的机器学习平台,有兴趣可以自己查一下怎么用,这里几篇都是关于其中的示例介绍. 内容 1 获取数据 原始程序读取了两个文件并拼接在一起 根据节点里的信息找到文件位置,拿出来 从 ...

  3. 建模杂谈系列226 流程与对象

    说明 鲁迅说:我家门前门前有两棵树,一棵是枣树,另一棵也是枣树. 从编程语言的角度,可以分为两大类(面向过程或面向对象),可以参考这篇文章 文章的内容其实不多,我贴一下: 对于两者的比较,文章这么说: ...

  4. 建模杂谈系列225 小结与反思

    说明 一个项目结束了,趁这两三天在休息,把本次的收获和教训都盘点一下,然后再开始一个更刺激的项目. 短暂的停顿,是为了把过去一段时间辛苦的成果固化一下,把那些很容易消散的宝贵知识和经验可以给未来做决策 ...

  5. 【杂谈】关于数据和模型,初学者极容易忽视的两个问题!

    说起深度学习与CNN,想必大家很熟悉:说起计算机视觉中的目标检测等各个方向,相比大家平时也接触过不少东西了:不过有两个小的方向,虽然相关的论文.项目.甚至研究方法都不多,却是做研究与实际项目落地中非常 ...

  6. 建模杂谈系列142 关于MVD的思考

    说明 概念的创建是重要的 现实中,数据的获取和处理(ETL)是很麻烦的事,以下是一些关于数据处理的思考. 内容 MVD(MultiVerse Data) 多元宇宙数据 借用了<奇异博士>里 ...

  7. 建模杂谈系列102 信息安全一二

    说明 现在考虑信息安全还偏早,并且纯技术的信息安全也并不可靠,本文简单梳理一下如何从大的层面确保信息安全. 内容 1 从数据存储上 1.1 AB类 首先,一些数据/算法永远不会存在公网机上.可部署在公 ...

  8. 建模杂谈系列61- 行业分类的逻辑

    说明 假设只从公司的名称上,能不能对行业分类? 理论上应该是可行的,但是就行业分类背后的逻辑来说,我觉得还是不太统一.本篇探讨一下行业分类的内在逻辑. 内容 1 为什么要行业 为什么有行业? 因为有社 ...

  9. 建模杂谈系列81 项目元数据实践3

    说明 这个实践接着前面的总结,结合可用的时间,进行一定的升级. 内容 1 背景 在跑批时,由于目标库的空间不足,导致大约40%的结果没有存入.并且我发现,由于没有做交付的确认(向目标库查询),程序默认 ...

最新文章

  1. textview 背景变形_西安昆明池桁架舞台背景搭建欢迎致电
  2. Java并发编程:Synchronized底层优化(偏向锁、轻量级锁)
  3. 魅族C++协程框架(Kiev)技术内幕
  4. 区分TTL、MSL、RTT
  5. mysql连接com.mysql.jdbc.exceptions.jdbc4.CommunicationsException: Communications link
  6. 下载 | 新版Java开发手册有哪些亮点?
  7. Golang 常见设计模式之装饰模式
  8. docker添加jar包_docker配置容器运行jar包
  9. 时间序列预测 时间因果建模_时间序列建模以预测投资基金的回报
  10. java创建对象new后面为啥可以传入参数_你有认真了解过自己的“Java对象”吗?渣男...
  11. eclipse 中配置php的 XDebug调试
  12. c#中跨线程调用windows窗体控件
  13. android 点击后退按钮,android – 按下后退按钮后重新选择正确的NavigationView菜单项...
  14. 2分钟入侵网站全程实录
  15. ajax oracle数据库数据类型,ajax连接oracle数据库数据
  16. mysql top percent_SQL Server -- TOP子句/TOP Percent,IN 操作符
  17. java 图片格式校验_(转载)Java对上传的图片进行格式校验以及安全性校验
  18. 就业喜报|最高薪资15K,平均7216元,这个双十一不做“吃圭人”!
  19. 24.请编写一个函数fun,它的功能是:将一个数字字符串转换为一个整数(不得调用C语言提供的将字符串转换为整数的函数)。
  20. node.js邮箱验证码

热门文章

  1. 比搞笑诺贝尔奖更搞笑的研究
  2. 深度学习中用到的numpy命令数组运算部分命令汇总
  3. 以太坊 “后偷渡时代” 盗币之 “拾荒攻击”
  4. 创建驱动设备(打开、关闭、读取。写入)
  5. Win10 更新 KB5000842失败报错0x800F0922的解决
  6. 【听】说谎心理学,说谎错了吗?
  7. Labview实现图片24bit转变为8bit及灰度图的伪彩显示
  8. 牛津大学计算机科学系,牛津大学计算机科学与哲学专业排名,深度科技,人类智慧...
  9. 弘辽科技:京东快车+海投的操作
  10. [原创]ExtAspNet秘密花园(二) mdash; 一切从头开始