洗衣机,数据挖掘的物理模型

昨天整洗衣机。看着大大小小新新旧旧,机身多赫然印一大字:
Fuzzy

Fuzzy Logic,模糊逻辑控制, 大概说"只需按下启动键,从选择程序到漂洗、脱水,实现了全自动的控制。这种模糊逻辑控制的洗衣机可以自动检测洗衣内的衣物重量,从而自动选择水位和洗涤程序,这样不但大大简化了操作步骤,而且可以比较准确的配置水位和洗涤时间,节约了能源。"

看了这些就乐了。原来洗衣机还是这么一个机器学习/数据挖掘的物理模型,一个分类模型吧,输入是一大堆衣物和污渍。一个好的分类模型(洗衣机)要把衣服和污渍尽可能地分离出来,这样洗衣机的输出就是一个二分类变量,比如1代表没有污渍的衣物,0代表污渍。对照洗衣机这么个物理模型,很多问题就可以说开去了。

比如数据挖掘的流程。先从客户手里拿来数据,他们说这衣服你要洗成什么样什么样,如果他们没有见解,我们就说我们能把你们的衣服洗成如何如何。定义好问题,就得准备洗衣粉、脸盆之类的吧。衣服也要进行些预处理,比如一个小物件不适合放进洗衣机,就直接剔掉了。清洗数据,把衣服口袋里的钥匙、小纸条都掏出来,进行分组,比如牛仔裤放一起,床单被罩搁一块。还有一些肉眼就能识别的模式,比如那件裤子上粘的一块大口香糖,用手拨出来就是。诸如此类,数据可以丢进我们的洗衣机了。选用哪个模型?决策树?神经网络?手洗模式?儿童模式?还是Logistic回归?选上一个,我们来设置参数,洗衣机控制面板上那些按钮狂摁一通就是。有时还需要设置阀值,规定模型停止计算的条件,选"洗衣定时"就可以。不管了,把电脑合上,让它跑就是。一个小时后过去看看,电脑屏幕刷出一大块结果,说衣服洗好了。不满意,再加水添洗衣粉。如此反复,期限也快到了,衣服怎么着也得拿出来晾了。衣服洗好了,但还是乱七八糟地躺在洗衣机里,整理一下结果喽,以清晰的方式摆在衣架上,就等着人家来评估实施了。
还拿洗衣机说事,为什么有些人那么相信挖掘模型?这个问题还可以这么表述,为什么我那么相信洗衣机,即使是我以前那台老破旧笨?

  1. 数据量庞大,衣服床单一大堆,手工计算几乎不可能。要手洗,耗水耗时间,对我而言,洗干净也几乎不可能。还有,看大伙都用上数据挖掘了,我的衣服还手洗就显得落伍了;
  2. 洗衣机自称"模糊控制",挺咋呼的听着。决策树、神经网络、最大熵、支持向量机,一个个听着也是能耐大,衣服放进去,有指望;
  3. 洗衣机跟所有算法一样,都是一个黑箱,把衣服丢进去,设好参数,就等着结果了。要是不满意,再把衣服丢到模型里跑。既然决定不手洗了,而且结果也一定要在某日赶出来,那么你总要把衣服拿出来晾,那时自己也会觉得这模型是好用啊。洗衣店为什么都用洗衣机?似乎手洗的客户不放心,不代表先进生产力。

这样的附会可以一直说开去,大伙可以补充,懒得发挥了,随手记一些:

  1. 一些小件衣物不适合放洗衣机,羽绒服最好也不要机洗,说明数据挖掘也不是什么都能对付;
  2. 以前听一个商业案例,说某家的某款洗衣机可以洗土豆。好东西。
  3. Fuzzy听着挺厉害,现在还有厂家推出NEURO&FUZZY的概念,好像是三洋吧,据说更加智能更加精确。然后LG也有CHAOS&FUZZY,不知道是炒概念还是真有用。这些我是在说BI界的事,潮流瞬息万变。
  4. ……

吃饭去了。这篇随感写得挺顺,就是老把"洗衣机"敲成"冰箱"。一会想想冰箱像什么。

********这篇小随感刚发布在TTNN,留在这里做个备份。***************

转自:http://johnthu.spaces.live.com/blog/cns!2053CD511E6D5B1E!386.entry

洗衣机,数据挖掘的物理模型相关推荐

  1. 数据挖掘 基础知识 收集

    A Tutorial on Clustering Algorithms-聚类小知识 俗话说:"物以类聚,人以群分",在自然科学和社会科学中,存在着大量的分类问题.所谓类,通俗地说, ...

  2. 戈登贝尔奖获得者张林峰:当AI遇上物理模型,会有怎样的质变? | 智源专访...

    智源社区「源创播客」栏目将持续邀请AI创业不同赛道上崭露头角的新星和资深创业者分享创业实践和创业故事.本期邀请到的对话嘉宾是北京深势科技公司创始人及首席科学家张林峰. 张林峰,北京深势科技公司创始人及 ...

  3. 2013年3月洗衣机类品牌网络知名度排名

    2013年3月洗衣机类品牌网络知名度排名 根据2013年3月开元网络与品牌研究最新研究结果,在洗衣机类品牌网络知名度评估中,海尔的知名度最高,排名第一,其次是小天鹅和西门子,分别位居第二.三名.详细排 ...

  4. matlab wash矩阵产生,洗衣机净衣效能与衣损程度的关系分析

    洗衣机净衣效能与衣损程度的关系分析 洗衣机净衣效能与衣损程度的关系分析 李 浩a, 宋 策a, 陈雪微b (安徽财经大学 a.金融学院; b.统计与应用数学学院, 蚌埠 233030) 摘要:为研究洗 ...

  5. 第14章 数据仓库与数据挖掘

    数据仓库技术所解决的问题是如何更合理和更有效地组织企业的数据体系,以更好地满足企业信息型应用对数据的要求,降低企业的数据管理.数据获取和数据集成的成本,提高数据系统响应速度,提高数据质量和数据的一致性 ...

  6. 大数据变现实践:微博百亿营收背后的数据挖掘技术

    来源:DBAplus社群(dbaplus) 数据猿官网 | www.datayuan.cn 今日头条丨一点资讯丨腾讯丨搜狐丨网易丨凤凰丨阿里UC大鱼丨新浪微博丨新浪看点丨百度百家丨博客中国丨趣头条丨腾 ...

  7. 面向程序员的数据挖掘指南-----第一章:简介

    内容: 寻找事物 本书结构 阅读完本书后你可以做些什么? 为什么数据挖掘很重要?哪些内容可以为我所用? 标题里的"Numerati的古老艺术"是什么意思? 序 如果你每天都能重复做 ...

  8. python数据挖掘要学多久_怎么自学python,大概要多久?

    你需要100天,不以项目为学习目标的都是耍流氓.我曾经长期挣扎在python学习的路上,一直不得其解.我乎推荐得很多课我都看过.能坚持下来给大神跪了,我自学一年竟然还在新手区.我一度想放弃,我是不是不 ...

  9. 《数据仓库与数据挖掘教程》ch02数据仓库原理 章节整理

    数据仓库原理 多数据源问题 多数据源 数据仓库和数据挖掘的数据通常来自多种数据库或计算机应用系统或数据文件.web页面 多数据源在集成的问题 数据不一致:数据的不一致性主要指数据之间的矛盾性和不相容性 ...

最新文章

  1. 元素重叠及position定位的z-index顺序
  2. mybaits二十四:缓存原理示意图
  3. 类的属性、类的方法、类的内置方法
  4. Python学习笔记--科赫雪花的绘制
  5. 200908阶段一C++多态
  6. 美团--最小唯一前缀
  7. 【工具】switchhost
  8. [渝粤教育] 盐城师范学院 光学 参考 资料
  9. 一文看懂哈夫曼树与哈夫曼编码
  10. 图论算法(四)--最小生成树的Kruskal [ 加边 ] 、Prim [ 加点 ] 的解法(JAVA)
  11. 学习笔记:杨辉三角形上莫队(组合数莫队)(LULU胡策)
  12. 史上最优秀的转换工具类网站推荐[唯一保存历史转换记录]
  13. flex java 全局拦截_Flex CSS阻止底层内容
  14. Jfinal3.4+layui2.4.3整合
  15. 西安北邮html5,西安北邮在线菜鸟的IT梦,给我一个支点,我就能撬动地球
  16. 小刘同学的 virtuoso IC 618 版图初学
  17. win10电脑录教学视频的时候有回声或者通话的时候有回声,严重干扰录制效果,解决方式。...
  18. LVDT接口测试工装研究
  19. 每日一书丨这本书献给所有铸就开源世界的人们
  20. 谁来拯救中国的语言文学

热门文章

  1. 【CSDN】Markdown 如何画分界线
  2. DW Question Answer Pro 1.3.4 DWQA问答系统插件
  3. matlab将脚本导出动态库文件.dll,并被python调用
  4. easyexcel根据模板写入_ProxmoxVE 之 创建win10基础镜像模板
  5. Delphi 关键字详解[整理于 橙子 的帖子]
  6. go语言游戏编程初识--`Ebiten`
  7. java中的this什么作用
  8. sort函数——利用函数实现快速排序c++
  9. Android APK反编译详解(附图)(转)
  10. Linux 0.11 实验环境搭建与调试