人工智能和大数据成为我们每个人对现代科技的新标签,数据分析被应用到了方方面面,今天小安带大家一起了解一下数据分析以及在这个时代我们的真实处境(下方高能,请做好准备)

知道你们不喜欢听理论,所以……小安还是要先普及一下理论知识,
因为知识改变命运。

何为数据分析 ?
数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。这一过程也是质量管理体系的支持过程。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。(简单理解就是:提取相关数据,运用相应算法,得出实用结论)

下面一起来回顾一个小故事
数据分析早期经典案例

啤酒与尿布
"啤酒与尿布"的故事产生于20世纪90年代的美国沃尔玛超市中,沃尔玛的超市管理人员分析销售数据时发现了一个令人难于理解的现象:

在某些特定的情况下,"啤酒"与"尿布"两件看上去毫无关系的商品会经常出现在同一个购物篮中,这种独特的销售现象引起了管理人员的注意,经过后续调查发现,这种现象出现在年轻的父亲身上。

在美国有婴儿的家庭中,一般是母亲在家中照看婴儿,年轻的父亲前去超市购买尿布。父亲在购买尿布的同时,往往会顺便为自己购买啤酒,这样就会出现啤酒与尿布这两件看上去不相干的商品经常会出现在同一个购物篮的现象。

如果这个年轻的父亲在卖场只能买到两件商品之一,则他很有可能会放弃购物而到另一家商店, 直到可以一次同时买到啤酒与尿布为止。沃尔玛发现了这一独特的现象,开始在卖场尝试将啤酒与尿布摆放在相同的区域,让年轻的父亲可以同时找到这两件商品,并很快地完成购物;而沃尔玛超市也可以让这些客户一次购买两件商品、而不是一件,从而获得了很好的商品销售收入,这就是"啤酒与尿布" 故事的由来。

当然"啤酒与尿布"的故事必须具有技术方面的支持。1993年美国学者Agrawal提出通过分析购物篮中的商品集合,从而找出商品之间关联关系的关联算法,并根据商品之间的关系,找出客户的购买行为。艾格拉沃从数学及计算机算法角度提出了商品关联关系的计算方法--Aprior算法。沃尔玛从上个世纪 90 年代尝试将 Aprior 算法引入到 POS机数据分析中,并获得了成功,于是产生了"啤酒与尿布"的故事。

案例分析:
这个最早期的案例,就是今天大数据分析的雏形。今天的数据分析能力已经显著提高,算法更是层出不穷,商家通过数据分析了解消费群体习惯,从而获利,而我们同买尿布的父亲一样,收获到了数据分析为我们带来的便捷,节省了很多选择的时间,与此同时,也承受着数据监控所带来的困扰。

早期的数据分析还是单纯而友好的嘛!今天的数据分析又是神马情况?无止境的接到各类商家电话是每个人都亲身经历过的事情,运气好接到各种销售电话:房子、车子、保险、广告、贷款……运气差的就会收到各式各样的诈骗电话。你会突然发现这个世界上了解你的人突然多了起来?

大数据里的我们拥有异常真实的群体画像,因为我们在面对手机的时候非常诚实,永远对它说真话。

我们知道自己在分享数据,但是大部分人并不知道,自己正在分享些什么,更不知道,这种分享将会意味着什么。

本来我们的规划是:
世界上知道这些秘密的只有你,和机器另一端的数据科学家。在机器语言里,我们不只是一个名字、一个地址、一串设备识别符。它每秒钟监测超过400个变量,记录每一个行为轨迹。

实际上:
我们的数据包在黑市被低价叫卖,那些我们永远不愿意公开的秘密,在一个小小的压缩包中,等待着新买家的光临。

据《财经》此前的报道,国内个人信息泄露数达55.3亿条,平均每个人有四条相关个人信息泄露,这些信息最终在黑市反复倒手,直至被榨干价值。其中,80%的数据泄露来自企业内鬼,黑客仅占20%。在一些私下倒卖个人身份信息的黑市,20块钱买一个人的征信报告,几百块钱就能买高净值人群打包数据。

一部分行业内人员认为:互联网公司收集的都是「浅层信息」,这没关系。目前市场上大部分倒卖的信息被称之为“浅层的信息”,比如仅有电话、姓名、身份证、家庭住址等等,没错,这些我们看来已经很全面的信息在某些行业内只属于浅层信息范畴。

那深层信息又有多恐怖呢?我们一起来了解一下吧!

首先我们要了解:截止2018年第一季度,超过10亿人每月使用微信及WeChat,6.17亿人在淘宝购物,全国搜索引擎用户达6.4亿,他们时刻创造新的海量数据,也在被勾画着异常精准的群体画像,机器在一步步接近一张清晰的人性图景。数据是这个时代最特别的商品,它的产生几乎毫无成本,却造就了无数科技独角兽、日渐强大的上市公司,以及数以亿计的产业利益。

当然,像微信、淘宝这类的大型企业所保护的数据库,我们应该给予足够的信任,至少在数据监管上,相对于一些不知名的APP,我们更愿意相信大品牌。

那么,我们日常使用的诸多APP,都是可以信赖的吗?比如:你想要拥有更优惠的价格去购买一件商品,通常会下载一个优惠券商城APP,这种APP品类丰富,数不胜数。那么从APP下载到手机那一刻起,你的轨迹就逐步被另一端的人们掌握了。

仅仅是安装过程中所抓取的硬件设备信息,APP已经对你有了一个大概印象——如果一台手机一个月内有10次连接同一个星巴克的WiFi,20次连接同一个定位在写字楼的公共区域WiFi,30次连接一个家庭WiFi,再算上这些WiFi的地理位置,以及WiFi名里的关键词,那么,一条几近清晰的生活——工作的路线轨迹,轻松出现。

你每天的路线就这样被你完全不知道的企业或者个人掌握了!

你的账号、密码也作为数据存留在不计其数的数据库中。相信很多人跟小安一样,因为记不住太多复杂的密码,账户密码数量不超过3个!一旦某一网站数据泄露或者被不法分子利用,从而去撞别的数据库,那么就会危及个人财产安全。

日常软件中的定位功能也是大家所忽略的,很多软件会申请获取你的定位,这一功能之前有文章做过分析,在此就不赘述了。详情点击文章标题了解更多:《你在微信不经意点开的链接 可能成为别人追踪你的标靶》
也许你会为目前的处境感到担忧,但是又不得不承认,我们享受着数据分析为我们带来的便捷。它能够了解你的喜好,解决很多生活中的问题,让每个人都有了一个智能小助理。大数据时代最理想的状态就是:在隐私安全得到充分保障的前提下,享有一系列便捷的服务。

为了达到理想状态,保护数据和个人信息安全,许多国家和地区相继出台相关法律、规定予以应对。科技是一把双刃剑,对于数据安全的保护,我们的确还有很长的一段路要走。但是在数据安全方面,除了出台相应的法律、规定外,还需要企业的自律意识、责任意识,以及每位用户的隐私安全意识共同建立,才能形成安全可靠的数据体系,达到大数据时代的理想状态!

原文发布时间为:2018-06-30
本文作者:Diana
本文来自云栖社区合作伙伴“ 安恒信息”,了解相关信息可以关注“ 安恒信息”。

一文让你了解大数据时代,你的真实处境相关推荐

  1. 精华 | 恩墨学院侯圣文:大数据时代下的 DBA 该何去何从?

    嘉宾演讲视频 Guest Video 温馨提示: 本视频时长57分02秒,建议在 WIFI 下观看. 第七届数据技术嘉年华于 2017年11月17日-18日在北京丽都皇冠假日酒店胜利召开,全国各地技术 ...

  2. kindle亚马逊个人文档不显示_4.68亿个人信息泄露,大数据时代裸奔?探悉不落地的文档在线预览...

    近日,江苏淮安警方通报,依法打击了7家涉嫌侵犯公民个人信息犯罪的公司,涉嫌非法缓存公民个人信息1亿多条,将公民个人信息称为"流量",将信息用于公司放贷和非法出售牟利,并公开提供收费 ...

  3. 大数据时代的10个重大变化(长篇神文)

    大数据时代的到来改变了人们的生活方式.思维模式和研究范式,我们可以总结出 10 个重大变化,如图 1 所示. 图 1  大数据时代的 10 个重大变化 对研究范式的新认识:从第三范式到第四范式 200 ...

  4. [数据分析方法论]大数据时代究竟带来了什么?写给普通人看的大数据文

    数据,让一切有迹可循,让一切有源可溯.我们每天都在产生数据,创造大数据和使用大数据,只是,你,仍然浑然不知. 百度知道和知乎问答里一直有小伙伴在问这个问题,比如"大数据时代,生活和思维发生了 ...

  5. 大数据时代下的新生态、新洞察、新趋势 | 神策 2019 数据驱动大会

    10 月 22 日,以"矩•变"为主题的神策 2019 数据驱动大会在北京维景国际大酒店顺利举行,来自全球大数据各大行业的领袖人物聚首北京,融合国际前沿技术与行业实践,深入探讨大数 ...

  6. 大数据时代,如何根据业务选择合适的分布式框架

    内容来源:2018 年 5 月 5 日,小米HBase研发工程师吴国泉在"ACMUG & CRUG 2018 成都站"进行<大数据时代系统体系架构和对比:存储与计算& ...

  7. 原创 | 大数据时代,应让“抗疫”更科学

    今年2月,国家提出"要鼓励运用大数据.人工智能.云计算等数字技术,在疫情监测分析.病毒溯源.防控救治.资源调配等方面更好发挥支撑作用." 从专业角度看,大数据应用本身具有很强的时效 ...

  8. 独家 | Michael I.Jordan:大数据时代下的安全实时决策堆栈与增强学习(视频+精华笔记)

    金秋九月,2017国际大数据产业技术创新高峰论坛暨大数据系统软件国家工程实验室第一次会议盛大开幕,大数据系统软件国家工程实验室作为大数据系统软件技术研发与工程化的国家级创新平台,将通过大数据系统软件技 ...

  9. 《大数据时代》----重要理念摘抄

    作者:维克托·迈尔-舍恩伯格 最近看了一本有历史的书<大数据时代>(拿研究成果来说三年前的已经是老成果了),作者对 我们这个大数据时代产生了很多颇有意思的洞见,为了保持原汁原味,我就直接原 ...

最新文章

  1. 为什么神经网络的激活函数必须使用线性函数?
  2. 好程序员Java教程分享JavaScript面试问题及答案(一)
  3. 解决Mybatis启动报错: Invalid bound statement (not found)
  4. c语言源码转流程图工具_C语言学习路线 (详细)
  5. HTML5学习笔记(三):HTML5的智能提示在VisualStudio2010
  6. 里面怎么使用import引用_谈谈模块化的 require 和 import
  7. javascript的list循环
  8. linux内核字符驱动设备,Linux学习笔记——linux内核字符设备驱动-Go语言中文社区...
  9. JSTARS投稿学习笔记
  10. 光伏机器人最前线_送水、送药、送餐!哈市这些地方率先用上AI配送机器人(视频)...
  11. centos6.5lamp环境搭建
  12. 微信小程序蓝牙打印开发心得
  13. wsyy应用程序中的服务器错误,wsYY的博客
  14. QCC3040---earbudUi module
  15. Android之Scroller详解讲解-真正了解滚动处理
  16. PostgreSQL 收缩膨胀表或索引 - pg_squeeze or pg_repack
  17. 微信支付一直显示服务器异常,商户支付异常告警服务
  18. 计算机无法检测到键盘,电脑无法识别键盘
  19. 终于搞定了stackoverflow的富文本编辑器pagedown
  20. Linux源码编译安装步骤及命令

热门文章

  1. App开发的重要性和意义在哪里?
  2. ppt文件不能打印出来怎么回事?
  3. 3.Glide使用之ListAdapter加载图片篇
  4. 计算机体系结构 公开课,清华大学公开课:操作系统
  5. Excel根据表格月份内容创建1-12月的文件夹?
  6. Android中Glide加载Https图片失败的解决方案(记录)
  7. 计算机二级office考试试题分布,计算机二级MS-OFFICE考试ECEL题型汇总附答案.pdf
  8. 天池工业AI大赛-智能制造质量预测 比赛历程和技术方案总结复赛48名
  9. 8.2-无监督学习-线性降维
  10. 计算机专业指南 专 平时作业,《计算机专业指南》课程作业要求