一、复杂系统

predicting the Unpredictable

1.Math from its birth

最早的数学来自于古埃及土地测量学,中国也出现古老的《九章算术》,逐渐发展成为了物理学、化学等学科的基础,以及我们现在的大数据都是以数学为基础,都是因为数学模型这个对现实抽象的一个工具。真正的数学模型首先起源于古希腊,用圆代替地球运行轨道,球代替地球本身等。
具有代表数学模型(物理学和天文学):
(1)托勒玫提出的托勒玫宇宙模型系统 :非常精确预测每年日历、月历,比日心说的预测都要精确。
(2)开普勒三定律:基于其老师的大量的测量数据。
(3)牛顿力学体系:牛顿三定律、万有引力定律。是推动工业革命的发动机,第一次大规模广泛运用数学模型。
(4)哈密顿分析力学:拉格朗日和哈密顿方程,推广了牛顿力学,使牛顿力学体系运用在除力学以外的其他物理学分支,例如热学、电学、光学、量子力学等。
牛顿力学给人们带来一种希望,只要有大量数据,就可以通过牛顿力学来预测一切事物的变化与发展,例如股市、自然灾害甚至于人类本身的思维等,但是牛顿力学在这些领域被证明是失败的。
2.Compleity ruins predictation
(1)Randomness              随机性:无处不在的随机性使得确定的预测成为一种不可能,对每个事物的影响的因素会有很多,导致事物的不确定性很大。
(2)Chaos                         混沌:初始条件的细微改变,使得结果的影响很大。例如:“三体问题”。
(3)Reflectivity                 反身性:观察者的观察对象的纠缠,导致观察者会影响测量物体。
(4)Nework Effect            网络效应:大量简单的个体行为对整体对系统都会有或多或少的影响。
(5)History Dependency  历史依赖性:此刻的状态取决于之前的状态的集合,预测需要包含无数过去信息。
简单个体的相互作用可以产生复杂的宏观现象,例如:磁性
复杂系统:是一种模块化的系统,普通节点一般只和相连的Hub(中心节点)节点相连接,例如:股票,社交等等
感受:听着网络效应、不确定性、混沌,一个细节的简单改变就会带来结果上很大的改变,就不由自主的想起了小学看过的一个马掌钉的故事 
少了一个铁钉,丢了一个马掌,
少了一个马掌,丢了一匹战马,
丢了一匹战马,败了一场战役,
败了一场战役,失了一个国家。

二.大数据与机器学习

1.人们经常认为只要数据足够多,可以预测一切,但是显然并不是那么简单。
  • 一直增加信息收集,却无法通过越来越多的信息,下定结论。
  • 谷歌流感计划:通过人们在谷歌的大量点击搜索流感的特征的查询,可以预测流感的爆发,然而通过数据显示,显然这个计划并没有他们想象中那么靠谱,信息的天然复杂性和数据噪声的影响中,想要通过数据来预测并不是那么简单。
  • Trump的选举成功:之前的无数次民意调查中很显然,与大众支持率持续很高的希拉里相比,他的选举貌似从开始就是希望不大,但是结果出来的那一天,就突然发生了极大的反转。人们又一次对大数据产生了怀疑,它是否真的有用。
  • 大数据在复杂性面前成为了小数据,多维度的复杂系统下,大数据也不再那么可以继续发挥它应有的作用。
  • 复杂性面前没有大数据。
2.拯救大数据
算法是拯救这一切的一个重要的、非常有效的办法,可以提炼更加有效的信息
效果:剔除噪声,“萃取”有效信息,变化成行动的action,得到反馈,然后改进算法。

三.人工智能的三个阶段

1.符号时代:

可编程:
  • 编为0.1,程序让计算机执行。
  • 但是因为复杂性,新请情况无限,符号无法适用。
2.控制时代:
算法:
出现很多统计模型,自己适应调整:
PCA、Logistic vegrssion、决策树、贝叶斯网络
  • 使用数据改变自身结构,通过实际数据自己学习
  • 模拟人的思维
3.连接时代:
深度学习:深度卷积网,GPU的运算可以更好的训练神经网络。
特征学习、特征工程,因为电脑很长一段时间只能完成线性的“一刀切”的分类,所以就需要寻找新特征。
4.人工智能的应用:
  • document classification 文本分类
  • entertainment 娱乐 例如:Netflix
  • vision 视觉
  • speech recognition 听觉
  • machine translation 翻译 RNN
  • AI designer 设计师,换装展示效果
  • AI business detection  商业
  • financial AI report 金融
  • Agriculture 农业 例如:拖拉机(blue river公司)、卫星(佳格天地)  是很有潜力的领域
  • medicine 医疗                                                                                      核心领域
  • detecting Earthquake 网络协同, 同一地区,很多设备同时检测到震感
  • AlphaGo 
  • 无人驾驶    各个公司多重布局,                                                             革命性领域
感受:人工智能的学习不是简单的从无到有,而是系统的自我改进,重在通过数据学习进行反馈。
人工智能的运用是在需要个性化比较强,注重个体差别的、或是需要大量数据经验来判断特征的领域
复杂性下,大数据既然不够用,就用复杂的神经网络,复杂对抗复杂。

转载于:https://www.cnblogs.com/maccus/p/9328358.html

2018/7/16 初学者相关推荐

  1. 暑期训练日志----2018.8.16

    训练第18天. 过得真快,还有一个多星期暑假就完了,感觉学了不少东西 上午看了看 DP 的资料,下午把之前欠的洛谷的题写了写,明天开始正式搞 DP 了,也不知道假期结束前能不能弄完 这两天有些懈怠了, ...

  2. 香港中文大学深圳(CUHKSZ)数据科学硕士(MSc in Data Science)笔试面试经验(2018/9/16)

    香港中文大学深圳(CUHKSZ)数据科学硕士(MSc in Data Science)笔试面试经验(2018/9/16) 写在前面的前面(2020.5.3) 写在前面(2019.2.19) 关于申请 ...

  3. 机器学习入门的百科全书-2018年“机器学习初学者”公众号文章汇总

    "机器学习初学者"公众号于2018年9月由黄海广博士开设,自开通以来,受到广大机器学习爱好者广泛好评.在2019年的第一个工作日,将2018年发布的所有文章进行归类汇总. 机器学习 ...

  4. 苏嵌//张朋//2018.07.16

    苏嵌                                                                                                   ...

  5. 训练日志 2018.12.16

    前几天准备 4 级一直没怎么看,考完了又去新生赛帮忙,2-SAT 基本弄完了,但跟二分结合的题还没刷,周三前刷出来. 2018.12.9

  6. 【一周头条盘点】中国软件网(2018.11.12~2018.11.16)

    每一个企业级应用的人都置顶了中国软件网 中国软件网为你带来最新鲜的行业干货 一周热点 华为获得全球首个微模块产品PUE测试证书 近日,第四届数据中心基础设施峰会在西安成功召开,会上,TGG(中国)副主 ...

  7. 2018.9.16考试总结

    今天的题是真的沙雕 第一题 [题目描述] Yashem66学长有严重的强迫症!他完全无法忍受那些令他抓狂的东西,比如文具袋里的直尺,比如画得不规范的立方体.他总是自言自语:强人♂所难. 请写出一个程序 ...

  8. 2018.8.16提高B组模拟考试

    永远不要把时间交给一道打表题. T1 题意简述:jzoj4674 Description 科学家温斯顿定义了一个无限重复的数列:1234321234321234321--,并将其称为时钟序列. 他发现 ...

  9. JZOJ 5820. 【NOIP提高A组模拟2018.8.16】 非法输入

    Description 在算法竞赛中,题目一般保证了输入数据的合法性.然而在工程开发中,我们往往不期望程 序得到的输入都是合法的. D 君正忙着向校内 OJ 添加题目,在写了第 233 个 val.c ...

最新文章

  1. python 整合excel_Python将多个excel文件合并为一个文件
  2. C# NameValueCollection集合 (转)
  3. SQL Server 数据库关键知识点详解(优秀经典)
  4. 无法开启计算机,Win7下鼠标右键无法开启计算机属性怎么办?
  5. TCP与UDP的区别(未完成,待补充)
  6. 读图,特征提取——形状
  7. PDB药物综合数据库必备8大类非付费网址80个
  8. python有效的变量名有哪些_python变量名有哪些
  9. 海马玩模拟器连接AndroidStudio
  10. 基于java民航售票管理系统源码(java毕业设计)
  11. 两款开关电源的纹波对比
  12. 基于阻抗控制的工业机器人轨迹跟踪系统 Simulink/Simscape 仿真
  13. 分享20份小升初超实用简历模板,每套都有自己的风格,可选取适合孩子的
  14. python中strip_python中的strip是什么意思
  15. 囚徒困境困境_所以你现在看到了社会困境
  16. 查看 android 设备号,获取Android设备的唯一识别码|设备号|序号|UUID
  17. 计算机新教师培训自我评价,教师个人自我评价(精选多篇)
  18. iOS和tvOS游戏按需加载资源简介
  19. 华众6.5虚拟主机管理系统SQL注入漏…
  20. 付宇泽20190919-1 每周例行报告

热门文章

  1. 即时配送:巨头们新十年的主战场
  2. AUTOMATE THE BORING STUFF WITH PYTHON读书笔记 - 第6章:MANIPULATING STRINGS
  3. ES6-Reflect属性介绍
  4. CAN光纤转换器CAN光端机解决消防火灾报警
  5. 一米智能伴读机器人app下载_呀呀伴读app下载-呀呀伴读 安卓版v1.3.3-PC6安卓网
  6. 巧用这几种文本检索工具,节省 80% 的时间
  7. 【系统集成项目管理工程师】—挣值管理
  8. python语音翻译-Python 神工具包!翻译、文字识别、语音转文字统统搞定
  9. 时间管理之背上的猴子
  10. Pr 处理音频后音画不同步的解决方法