近几年,大数据已广泛应用到互联网舆情、互联网营销、内容分发、互联网金融、人工智能、智慧城市建设等领域。然而,在大数据高速发展的同时,也出现鱼龙混杂、忽悠盛行的不良现象:有些机构和企业根本没有大数据能力、但也为赶时髦而自我标榜为大数据公司;有人神话大数据,认为其无所不能;有人认为大数据只研究相关关系而不研究因果关系;还有人认为只要有数据,就万事大吉。下面就让我们来逐个讨论,反驳上述的片面认识。

真正的大数据公司并不多。纵观世界大数据发展实践,目前的大数据公司主要分为两类:一类是自身就拥有大数据的公司,如阿里巴巴、京东、腾讯、今日头条、新浪微博、北京一卡通公司等,其中绝大多数为互联网公司;另一类则是为大数据挖掘和分析提供工具和能力的公司,如拓尔思、百分点等等。事实上,在业界的实践中,不少公司既没有数据,也没有数据解决能力,仅仅是为了更好的估值和自身的品牌塑造,纷纷给自身披上大数据的外衣,给行业和用户造成混乱和困惑,这从根本上不利于大数据产业和大数据公司的健康发展。

大数据仍处于初级阶段。虽然大数据必将成为整个社会的底层架构和标配,社会和经济的方方面面必将被大数据所重构,且大数据在各行各业的应用正得到深化,但上述活动仍处于进行时或将来时,并非既成事实。在这一爬坡过坎的阶段,尤其需要大数据从业人员求真务实、脚踏实地地推进大数据产业的发展,不能拔苗助长、饮鸩止渴,否则只能给大数据产业的短期发展注入太多泡沫。一旦泡沫破裂,必将会给大数据产业带来很大的破坏作用。

大数据既研究相关关系,也研究因果关系。在大数据领域流行的说法是“大数据只研究相关关系而不研究因果关系”,无疑这是很大的认识误区。从本质上讲,大数据从全新的哲学视角给我们提供了更多认识世界的方法,使我们从之前只能研究因果关系而不能研究相关关系,扩大到既能研究因果关系也能研究相关关系。

不过,如果单纯从相关关系出发,就可能导致谬误百出。例如,一些研究人员希望通过分析北京市中小学生的交通数据与其所在学校的相关性,计算学生家庭住址与学校距离的合理区间。如果仅研究因果关系,就会得出“北京市的学校布局很合理而不需要优化调整”的结论,这无疑与北京市优质教育资源分布不均衡的现状相悖。为什么会出现这样的悖论呢?原因在于,北京市很多家长为让孩子接受更好的教育,纷纷选择在教学质量好的学校周边买小户型房屋或租房居住,而正是这种教育资源的不均衡导致“天价学区房”的频频出现。

大数据尚需要算法和专家观点的支撑。很多人认为,只要有数据就可以解决一切问题,其实如果仅有数据而没有好的算法和专家观点,数据只能成为无用的废料。

在大数据的运用过程中,海量的数据是基础和前提,但算法、模型以及专家观点一样都不能少。否则,即便输入同样的数据,出来的也会是大相径庭的观点。例如,虽然很多“楼市专家”都占有大致相同的数据库,但对房地产市场走势的判断却大为不同。如果一味听信某些“平民经济学家”的理论,很多人可能正在四处漂泊,租房居住。反之,若能预见房价上涨的趋势,您不仅可解决居住问题,还有机会实现财务自由。

总之,大数据的威力将远超我们的想象,但是也需要给它一段时间来完善,更需要警惕一些似是而非的错误观点!

本文出处:畅享网
本文来自云栖社区合作伙伴畅享网,了解相关信息可以关注vsharing.com网站。

郭全中:对大数据的认识该正本清源相关推荐

  1. 清华校友总会AI大数据专委会(筹)第一次理事会顺利召开

    2018年12月11日上午清华校友总会AI大数据专委会(筹)第一次理事会在清华大学顺利召开,校友总会副秘书长崔剑.专委会会长张钹院士.执行会长韩亦舜老师.副会长潘迪学长.秘书长王霞等,专委会顾问委员代 ...

  2. 15家大数据公司被调查,数据行业面临大清洗?

    15家大数据公司被调查,数据行业面临大清洗? 行业急需正本清源,让良币"更有信心,更有动力". 一本财经 · 2017/05/27 16:42评论(0) 收藏(0) 9.4W字体: ...

  3. 大数据和人工智能时代下的运筹学

    首发于[运筹帷幄]大数据和人工智能时代下的运筹学 大话"人工智能.数据科学.机器学习"--综述 1 2 个月前 作者系美国克莱姆森大学运筹学硕士,Ph.D. Candidate,师 ...

  4. 3.7亿条保单数据怎么分析?这个大数据平台有绝招

    到新冠疫情影响,全球经济面临冲击,国内经济已进入复工复产有序发展的新常态阶段,企业想要实现持续增长需另寻突破点,越来越多的企业把视线转向了企业内部,希望通过推进精细化管理来实现降本增效. 在企业精细化 ...

  5. 大数据智能分析的特征和能力

    社会数字化的形成仍需一定的时间,大数据智能分析要达到我们梦想的高度,紧跟大数据技术发展,更应当注重当前数字化背景下,大数据智能分析的特性以及所需具备的能力,从而为大数据智能分析发展注入源源不断的活力, ...

  6. 什么才是真正的大数据征信?

    随着国家推动社会信用体系建设的步伐不断加快,大数据征信的概念得到广泛传播,已被越来越多的公众所认知.大数据征信代表着未来征信业的发展方向,将深刻改变商业交易模式,成为支撑市场经济健康快速发展的基础性产 ...

  7. 人工智能与大数据-2018

    20181225 物联网(NB-IoT)芯片2018评测|PPT 智能摄像头评测--中国移动2018年智能硬件质量报告(第二期) 存储器产业链 AI芯片产业链! 车联网技术.标准与产业发展态势前沿报告 ...

  8. 大数据企业战略规划高级培训课程

    一.课程对象 本课程是大数据高级培训课程,主要面向企业中层及以上管理人员,IT战略规划部门.理论联系实际,就大数据的应用方向,演进路线和企业大数据战略规划,结合完整的大数据项目实施案例,进行讲解.旨在 ...

  9. 企业大数据战略规划高级培训课程

    一.课程对象 本课程是大数据高级培训课程,主要面向企业中层及以上管理人员,IT战略规划部门.理论联系实际,就大数据的应用方向,演进路线和企业大数据战略规划进行探讨,结合完整的大数据项目实施案例,进行讲 ...

最新文章

  1. java教学目标_成为Java高手的25个学习目标
  2. Blender 3.0基础入门学习教程 Introduction to Blender 3.0
  3. SSH框架是个怎么回事?(转)
  4. 反弹和补遗:再论Bjarne Stroustrup的基于对象的含义
  5. AOP实现Controller参数日志
  6. C++学习笔记5[函数]
  7. 《Linux内核设计与实现》读书笔记(十一)- 定时器和时间管理
  8. nagios监控系统搭建!!
  9. 小程序 setData 中的坑,其实好像...
  10. 我的服装DRP之开发感悟
  11. Python下的数据处理和机器学习,对数据在线及本地获取、解析、预处理和训练、预测、交叉验证、可视化
  12. 动画演示 Delphi 2007 IDE 功能[6] - 快速查看 Delphi 所有的核心数据类型
  13. oracle判断日期字符串格式,如何测试日期格式字符串是否为Oracle中的有效日期格式字符串...
  14. winform-Chrome-CefSharp库
  15. 成功安装ML并驱动显卡(gtx460)声卡(alc892)之经验谈
  16. TCP segment of a reassembled PDU
  17. 佐藤ひろ美 - わたしのそらのいろ
  18. 真香啊,推荐 6 个 Python 数据分析神器
  19. python对数据集处理,绘制世界地图
  20. android组件化蘑菇街,蘑菇街 App 的组件化之路·续

热门文章

  1. 用c语言复制程序,怎么用C程序写出一个能复制自己的程序?
  2. BUUCTFweb比赛做题记录
  3. 前端工程师的摸鱼日常(10)
  4. 俄罗斯钓鱼四服务器未响应,俄罗斯钓鱼4《RussianFishing4》sbirolino钓组攻略
  5. html表白程序源码 html生日快乐网站制作 HTML生日快乐代码 表白程序源码html 程序员表白代码html
  6. 从花瓣与堆糖看Pinterest模式在中国的可行性
  7. 【安全算法之SHA1】SHA1摘要运算的C语言源码实现
  8. 自由Android安全研究员陈愉鑫:移动App灰色产业案例分析与防范
  9. 情感日记:想念从未断绝
  10. b树的表示形式_B.Com的完整形式是什么?