火爆的大数据被什么拖了后腿.当大数据带给世界更多比特时,实时产生的海量数据就成了一个很难挖掘的矿井。我们都知道,通过这些分段数据,我们可以挖掘出更多的价值,但就目前的总体发展而言,大数据的应用远远达不到预期的效果。其原因有几个:

  1数据的获取难度增加

  从早期PC端各种类型的cookie数据及用户网站浏览、点击、停留等数据,到用户移动端设备相关的型号、位置及应用使用时长、次数、类型等数据,再到应用内的点击、停留、浏览、搜索等数据,数据量虽然越来越大,可获取变得越来越难。

  早期,用户对这些所谓的“不敏感数据”并不了解,或着不太在意。但随着各种类型的数据商业模式兴起,一些数据收集方过度、越线收集用户数据,又有人利用这些数据进行过度营销,严重损害了用户体验和信任度。用户的数据保护意识快速提升,而数据收集方也有保护自身数据资产的需求,这就产生了多方面的矛盾,使得大规模的数据收集和应用变得更加困难。

  为解决这些问题,应该建立全面的机制和标准,使得数据的获取、加工、存储、应用、共享更加规范和有序,打破数据孤岛困境,共同构建生态健康、持续成长的市场。

  2数据应用与个人隐私的问题没有很好的解决

  大数据时代,每个人通过互联网留下了大量的各种类型的数据,综合这些数据信息能够反映出人的行为模式:包括应用兴趣偏好、常去地点、工作及居住地、社交关系、收入水平、消费偏好、品牌偏好等。善用这些数据原本能够更好的为用户服务,比如提供更符合用户偏好的产品及服务,能够有效降低用户的选择时间,甚至规划建设更高效的城市、让生活更便捷。

  但是,一方面频繁的操作系统升级和设备更替让用户更加注重数据的安全问题;同时,某些数据收集行为越过了对个人互联网特征数据的红线,数据是否会造成个人隐私的泄露、是否会带来过度的营销、是否有可能被精准的侵入,给用户造成大量的困扰,甚至是经济损失。

  为解决数据隐私问题,在对已有法律法规继续进行完善的基础上,也应该有行业规范和行业自律要求,双管齐下,促使数据产业链各方参与者共同打造良好的网络数据空间,增加对用户隐私和数据安全的保护,也通过更加人性化的服务产生数据应用的价值。

  3数据加工处理的速度与数据产生的速度不同步

  大数据时代,每人每天产生的数据高达数GB,围绕社交、金融交易、网络购物、生活记录等各种应用,全世界每天能够产生数ZB的数据,这庞大的数据量需要更加庞大的处理能力才能实现有效利用。

  但是以目前的计算方法和计算能力,每秒处理的速度远小于数据产生的速度,只能选择小范围的尝试,像Spark/Hadoop/Flink/Kafka等广泛应用的计算方法均有待提升。同样的,对于所需的硬件基础设施,目前最快的CPU/GPU/NPU其每秒所能提供的计算速度仅达数百MB/s,也无法更快的提升计算能力。这些都限制了数据处理的快速发展。

  鉴于此,应该针对不同类型的数据提供不同的处理算法,比如专门针对常规结构化数据或文本数据、音视频等非结构化数据等的专用计算方法。通过基于各类数据的特点进行并行计算,如结构化数据的小数据、文本数据的数据块数据、音视频的采样压缩数据等,针对每一种数据进行专门的效率提升。同时,在现有计算芯片的基础上增加各种类型的协处理器,有效提升数据计算任务的并行处理能力,提升芯片的利用率。

  4数据应用落地难度增加

  虽然我们处在大数据时代,但能够得到有效应用的数据还不足1/10,而其应用方向大部分仅仅是围绕营销、风控等方面。

  这些主要面向市场的应用虽然帮助企业提升了收入,但是越来越多人对这种缺少选择空间的应用充满怀疑,也导致应用水平的下降。而且,这些只看一时、不看长远的应用方式也有可能导致效果适得其反,用户被教育之后就会明显的进行反抗,将会影响到数据的未来应用。

  数据应用落地目前显然受到了环境发展及数据孤岛等方面的影响,很多好的想法无法付诸实践。但是可以考虑通过新兴的区块链技术实现行业合作、资源互换、消费者互利等,促进各方的信任,以开放心态,在保护数据安全的前提下更多的释放数据价值,打造智慧空间的各种应用。

  5数据价值发掘方向不明确

  大数据的发展离不开各方参与者,其价值的实现也需要各方通力合作。但是目前大量掌握数据的企业圈地自封,而生产数据的用户却成为了被收割的对象。这也引发了围绕数据价值的喋喋不休的争论——到底是为了提升用户体验,还是收割所剩无几的互联网流量红利?

  但是这些都无法阻挡历史前进的车轮。在数据应用领域,诸如快速响应客户各类需求、降低产品设计成本、降低制造及仓储成本、降低运输及配送成本、精准预判投资规划、围绕用户行为的预测快速迭代更新、预测竞品营销策略及市场变化等提升自身竞争力水平的应用,有着巨大的市场空间。

  火爆的大数据被什么拖了后腿.中琛魔方大数据平台表示:相信有远见的公司将能够展望未来,并将积极规划未来的主要轨迹。基于优良行业属性、数据特征和消费场景的各种应用将层出不穷,并将进入一个新的数字世界-即智能空间。

火爆的大数据被什么拖了后腿相关推荐

  1. 养蛙火爆,大数据解读《旅行青蛙》崛起之谜

    来源:腾讯科技 本文共2427字,建议阅读5分钟. 本文为大家用大数据解读旅行青蛙的火爆之谜以及未来前景. 正如猎豹全球智库在上周的<数往知来-2018移动互联网峰会>上对2018年移动互 ...

  2. 大数据如此火爆 如何看待大数据行业发展趋势

    如今的大数据不再是一个流行术语,在大数据行业火热的发展下,大数据几乎涉及到所有行业的发展.国家相继出台的一系列政策更是加快了大数据产业的落地,预计未来几年大数据产业将会蓬勃发展.下面一起看看未来大数据 ...

  3. 从入门到进阶!当下火爆的大数据技术及算法怎么还能不知道 一起来学习互联网巨头的大数据架构实践!

    大数据被称为新时代的黄金和石油,相关技术发展迅猛,所应用的行业也非常广泛,从传统行业如医疗.教育.金融.旅游,到新兴产业如电商.计算广告.可穿戴设备.机器人等.大数据技术更是国家科技发展和智慧城市建设 ...

  4. 跟着阿里大牛捞干货:2019这5本书带你玩转大数据

    导读:2019年,你都立了哪些flag?等一年之后回头看看,这些flag都能拔掉吗?其实新的一年已经过去一周多了,这一周你是怎样过的,有没有一点小小的进步? 为了让你的2019年过得充实,不虚度,数据 ...

  5. 大数据创业的未来到底如何?

    数据分析师.数据挖掘师.数据科学家等大数据时代诞生的岗位让人蠢蠢欲动,越来越多人都开始踏进大数据分析行列.面对大数据时代大数据的火爆,大数据创业这个词汇也开始涌现,很多人学习了大数据分析培训,觉得自己 ...

  6. 大数据创业的未来到底在哪里?

    数据分析师.数据挖掘师.数据科学家等大数据时代诞生的岗位让人蠢蠢欲动,越来越多人都开始踏进大数据分析行列.面对大数据时代大数据的火爆,大数据创业这个词汇也开始涌现,很多人学习了大数据分析培训,觉得自己 ...

  7. FinTech研发报告-之大数据技术

    前序: 手记血泪史:2016年底~2017年是自己技术生涯的元年,所以逼着自己写一般书籍(原打算,后来发现自律性和俗事太多最后没有实现),当时一直关注FinTech个方面的内容,所以决定先写大数据方面 ...

  8. 仅靠志愿者运营,大数据文摘20万粉丝,如何炼成?

    大家好,我是汪德诚,大数据文摘的创办人. 对很多朋友来说,我们没有见过面,但是我们并不陌生,因为我们已经通过文摘"交流"2年多了.从2013年7月25日大数据文摘发了第一篇文章后, ...

  9. 2018年五一小长假全国旅游大数据报告出炉,这些景点太火爆!

    "五一"假日期间全国接待国内游客1.47亿人次,同比增长9.3%,实现国内旅游收入871.6亿元,同比增长10.2%.为进一步盘点五一小长假旅游特征,中国旅游研究院联合携程集团.银 ...

最新文章

  1. Mac上搭建直播服务器Nginx+rtmp
  2. java分析日志文件_java程序如何对监控软件的日志文件进行如下分析?
  3. day10 java的this关键字
  4. DWRUtil未定义的问题
  5. oracle大数据量迁移,分批量导入样例(fetch...bulk collect)以及forall结合使用
  6. OpenStack-Pike(二)
  7. 20190925 On Java8 第二十二章 枚举
  8. dnSpy - 一款 .NET 程序逆向工具
  9. 快速比对源代码的工具_推荐7个代码对比工具
  10. vue uniapp如何实现横向滚动周历,横向滚动一周日历
  11. esp8266应用教程——TFT LCD显示
  12. python numpy 函数_Python 入门教程:关于 numpy 窗函数 Blackman
  13. [2019-7-20]论文模型构建心得
  14. 将加密的pdf转化成word
  15. Python 逐行读取txt文件,批量下载文件
  16. 建筑行业现行相关税收政策及优惠措施汇编
  17. antd菜单使用动态图标
  18. 学习笔记:Bulletproofs Frozen Heart
  19. Android蓝牙打印机功能开发完整Demo
  20. android三星note20.6,三星Note20评测:这支手写笔是最大亮点?

热门文章

  1. UFLDL机器学习 Andrew Ng-Deep Learning课程
  2. tensorflow LSTM:张量变形,5维变4维,4维变5维
  3. HTML中body内常用标签
  4. Python中的变量、引用、拷贝和作用域
  5. map/reduce之间的shuffle,partition,combiner过程的详解
  6. jsp内置对象(三)-----response对象
  7. 第五篇:你“ 看不见 ” 的隐式转换
  8. 【LeetCode】49. Group Anagrams
  9. [SQL入门级] 上篇被移出园子首页,那这篇咱就'薄利多销'
  10. C#调用C++编写的dll库