矿工,应该是这个世界上最辛苦的工人!这让笔者不经联想到,一个月以前,在风风火火的“2016贵阳数博会”上,总理又给中国市场指出了一块新“矿源”——大数据。

大数据“矿工”世界上最艰辛的IT人

“那么问题来了,大数据矿工,你的艰辛别人知道吗?”或许曾今,凑热闹的我们只关注绚丽的数据可视化效果、炫酷的用户画像模型,期待着数据支撑决策后的指点江山……可是,最基础的数据怎么来?城市规划专家曾讲,“我国现阶段城市人口最基础真实的数据,还是需要依靠大规模的人口普查工作,这是支撑一个城市利用大数据等技术进行科学规划的基础”。

换言之,传统的数据采集方法根本不会因为技术的发展而变得简易快捷或者消失,甚至还可能因为数据需求地不断提高,使得采集工作更加艰巨。尤其是对于做传统行业的大数据应用企业来说,他们不仅要做好大数据的分析应用,还要扮演好大数据矿工的角色。于是乎,数据源,不仅是金矿的源头,更是大数据矿工的“拦路虎”。

数据矿工,肯定是这个世界上最艰辛的IT人!中关村大数据产业联盟赵国栋秘书长分析,“传统矿产资源,不管挖不挖,它都在那里;但是传统行业的数据源不一样,你想挖,即使找对矿点,也配备清洗打磨技术,它也不一定有现成的数据。”

的确,面对深耕传统行业的大数据应用企业,在采集传统数据源的过程中会面对三类问题:①没有数据;②基础IT系统并不被重视;③数据标准化程度低。

没有数据

在具备互联网基因的企业里,能应用的海量数据采集工具种类繁多,方式齐全。例如系统日志采集法、网络爬虫、公共API接口、物联网终端采集法、还有对流量进行采集的DPI或DFI等宽带管理技术等。因此,大数据在电商、互联网金融、政府信息化等本身能自产和积累数据的企事业单位,大数据的应用是非常显著且收效见快;然而对于农业、车辆维修等传统行业,是没有数据积累的。制约数据生产和保留的原因各种各样,从业人员数据意识低、同行竞争保护、数据无显性价值论等,这就使得农耕一年年种,但除了作物和收成,没有更多有价值的数据积累;车辆一台台修,除了零件损耗量和维修收入,也没有其他有价值的数据产生。没有可用数据,就成了大数据矿工的第一道“拦路虎”。

责任编辑:黎晋

上一页12下一页

基础IT系统并不被重视

搭建基础IT系统实现信息化是企业做强做大的必经之路,但是实际情况却不竟如人意。

首先,成本问题。佳格天地科技有限公司顾博士分析,“在农业领域,大田产值低,农户生存本身也是靠国家补贴,因此让农户为各种数据采集设备付出额外成本基本等于缘木求鱼。即使国家资助部署传感器,也有可能会被其他人拔掉,甚至拿去换钱。”传统农业没有原始数据积累,又囿于成本和价值产出的限制,像佳格公司这样拥有气象、无人机航拍和卫星等高科技方式采集的数据,也只能给3000亩以上的中大型农场提供农业种植指导、大田气象和病虫害预警、作物监测和产量预测、农机调度等服务。

第二,数据产值问题。“大量的小微汽车维修企业,数据记录极不规范,而且维修数据对于企业经营本身并不产生任何直接价值,相反还会耗费更多人力和时间成本。”所以这些企业没有培养数据记录和分类的意识,更不会考虑企业信息化。泰格斯创始人翟总还说到,“中国车的保有量1.4亿,每年二手车交易量500万台,交易次数可达1400、1500万次。采集每一辆车的各类数据,从中立第三方的角度提供客观的评估,是发展二手车市场不可或缺的一环。采集车辆维修数据的第一手地方就是星罗密布的汽车修理厂,中国从事汽修场的企业和小作坊约有150万家,其中70%~80%没有进行信息化改造,可想而知,要真正了解一辆汽车全部的历史维修数据,对于大数据企业的采集工作要求,是多么艰巨和难行!”

数据标准化程度低

目前,传统行业留存的数据多为手工记录,这些数据的应用水平和标准化程度有限,因此无法直接拿来取用。数据标准化问题不仅出现在不同行业领域之间,对于同一行业,因为企业习惯和知识水平的差异,其数据记录的格式和标准也会不同,这就加大了数据采集后的取义和分析难度。像美国等发达国家,已经完整地经历了工业时代到信息时代的变革,他们各行业内的标准化作业基本形成了固定流程和格式;而中国的工业化还没走全,信息化又变化太快,现在数据化虽然与世界同处一个起跑线,但是远没有夯实的数据基础。顾博士和数据冰雹邓总形象地比喻到,“现在中国农业购买得起最先进的机器,但是用最粗犷的方式去操作,好像用开拖拉机的方式去开奔驰”,“大部分企业BI阶段还没做好,哪能跳起来做大数据!”

我们的呼吁:给大数据矿工减负!

联盟深入产业,发现目前发展大数据两极分化非常严重。一方面,代表大数据高端业态的交易市场在各地方的发展如火如荼,但另一方面,产业末端,尤其是大量的小微企业、农户等,信息化应用处于“零”的水平,遑论什么大数据意识。

综合上述三个问题,就是末端信息化水平低。所以,很多这些试图改造传统行业的大数据创业公司,普遍还要承担教育市场的重任,用最笨拙的方式去挖掘“数据源矿”。

产业末端信息化不足,直接制约产业生态的发展。联盟所倡导的产业升级、产业融合都将成为镜中月、水中花。

联盟呼吁,要给他们减负

一是,建议国家各相关行政监管部门统一协调工作,从金融财政、工商管理、质量监测等多路径,共同制定传统行业的基础信息化建设政策,推动信息红利的释放,激发数据活力,强化民众大数据意识。

二是,建议国家积极引导和扶持农户、个体户、小微企业等传统行业末端群体的信息化改造工程,出台相关具体措施。

三是,建议依靠政府发挥顶层规划和资源配置作用,制定阶梯式信息化工作目标,对传统行业末端群体逐级实现信息化改造目标。
本文转自d1net(转载)

大数据“矿工” 世界上最艰辛的IT人相关推荐

  1. 《大数据》第1期“动态”——站在大数据的风口上

    站在大数据的风口上 Momentum of Big Data 每个人都渴望成功,而通向成功道路最重要的一条就是创新创业,创新创业的源泉是新的思想.最近,由中信出版集团出版.大数据战略重点实验室推出的一 ...

  2. eBay数据科学家李睿:自然语言处理在eBay的技术实践 数据 网络 类别 技术 分类器 阅读1593 近日,在飞马网主办的“FMI人工智能大数据高峰论坛”上,来自eBay的数据科学家李睿

    eBay数据科学家李睿:自然语言处理在eBay的技术实践 数据 网络 类别 技术 分类器 阅读1593  近日,在飞马网主办的"FMI人工智能&大数据高峰论坛"上,来自eB ...

  3. 混合云存储:大数据应用的上云之道

    企业数字化转型过程中,数据价值被显著放大,大数据应用成为不少企业探索的重点. 从技术上看,大数据业务由于数据体量大,且数据量很多时候呈急速膨胀状态:在进行大数据计算分析时,对资源的需求呈现浪涌式特征, ...

  4. 就业培训 | 2020第一期重庆高校毕业生大数据职业技能线上特训营开课啦

    "大数据特训营开课啦!""芝诺数据的老师太'可'了~"这几天,同学们的朋友圈被刷屏了,原来,是2020第一期重庆高校毕业生大数据职业技能线上特训营开讲了! &q ...

  5. 计算机一分钟最快打多少字,世界上打字最快的人 马特斯科娃一分钟打多少字...

    世界上打字最快的人是马特斯科娃,来自于杰克.马特斯科娃已经创下了吉尼斯世界纪录,因为她的打字速度特别快,并且能够保证每一个字都准确无误.这里所指的打字速度快是按一分钟的标准,每一分钟所打出的字数. 一 ...

  6. 今天的真实业态:90%的大数据产品是伪需求,所以没人买单

    文 | 江颖 我们看似已经进入大数据时代,到处都是各种各样的大数据产品.但我可以负责任的讲,90%的大数据产品-- 要么,是闭门造车.臆想出来的"伪需求",没有真正解决客户的需求和 ...

  7. 转:瑞·达利欧:世界上最懂选择的人,怎么做决定?

    个人理解:关注重要因素,发现真正的问题. 明白自己的障碍在哪里,理解你的自我意识障碍,理解你的思维盲点障碍,头脑极度开放:把了解做好,准确分析,综合考虑,尝试考虑 知道最好的决策是什么:有勇气做出最好 ...

  8. 这世界上你最在乎的人

    这世界上你最在乎的人 结婚那天,妈问我:坐在角落里象两个要饭模样的人是谁? 我看过去的时候,有个老头正盯着我,旁边还有个老太太,发现我看着他们时赶忙低下头.我不认识他们但也不象要饭的,衣服是新的连折印 ...

  9. 超轻型飞机 - 蟋蟀,世界上最小的双引擎载人飞机!

    超轻型飞机-蟋蟀,世界上最小的双引擎载人飞机! Cri-Cri超轻型飞机,这是由法国人设计的小飞机,单座双发, 仅有4.9m翼展.3.9m机长,是世界上最小的单人双引擎飞机. 设计者的初衷是便宜简单且 ...

最新文章

  1. java静态代理与动态代理简单分析
  2. Excel 如何根据单元格中的值设立不同的颜色(或渐变)?(222)
  3. java epoll select_春招|Java开发实习面经(口头offer),感谢快手给我这个双非一次机会!...
  4. HierarchicalBeanFactory
  5. P4550-收集邮票【期望dp】
  6. 碧蓝航线8.20服务器维护,碧蓝航线半人马来袭 8.20更新公告
  7. python查看各列数据类型_pandas中查看数据类型的几种方式
  8. django的models常用字段、属性
  9. 位置模拟服务器超时,调用别人提供的服务的时候没有设置超时程序被卡住了怎么办?,如何模拟超时的情况?...
  10. (2)存储过程中可以调用其他存储过程吗?_详解Oracle创建存储过程、创建函数、创建包及实例演示...
  11. node.js第十课(HTTPserver)
  12. 异常org.hibernate.proxy.HibernateProxy.Forgot to register a type adapter
  13. python解析页面DOM树形成xpath列表,并计算DOM树的最大深度
  14. 2021最新关于点云配准的全面综述
  15. java实现中文大写金额转小写数字
  16. ubuntu下类似IP Scan扫描同一局域网的IP
  17. 基于微信小程序的资产管理平台的设计与实现
  18. 方法:判断一个点是否在一个立方体中
  19. Today is a special day
  20. .sh脚本文件shebang行引发的syntax error:“(“ unexpected

热门文章

  1. cdn搭建原理_直播平台搭建并不难,最难的是这两点
  2. CSS 总结我对3D效果的一些误解
  3. 说一下你对多态的理解?_如何去理解java中的多态?从jvm角度分析也许让你更清晰...
  4. JavaScript 常用Array、String方法
  5. vscode使用Git Graph提交成功,但是仓库没有更新
  6. openresty模板html页面,单页面部署去Html缓存 nginx/openresty
  7. java filechooser_Java—FileChooser(示例代码)
  8. c++语言定义排序函数,关于C++中定义比较函数的三种方法小结
  9. debian vbox设置_在Debian 9 Stretch系统上安装VirtualBox的两种方法
  10. mysql mvcc undo_Mysql Innodb中undo-log和MVCC多版本一致性读 的实现