进入二月下旬,北京迎来一轮漫长的雾霾天气,京东上许多空气净化器脱销,淘宝上3M口罩涨价不少,微博、微信上也流传着各种应对PM2.5的偏方。在未来的日子,我们不得不继续PM2.5问题。2013年,姜小凡和他的团队开发了一款成本200多元的PM2.5检测设备——PAM(便携式个人空气质量监测仪)。PAM最大的特点是成本低。同时,PAM考虑了地理信息、气候因素,并且通过机器学习的方式处理这些数据,建立模型,模型进一步修正数据,保证数据精确性。

\

在QCon北京2014大会上,姜小凡将就《PM2.5的大数据分析》为题分享,详解如何将廉价的传感器与云端数据结合实现PM2.5分析的。日前,InfoQ对姜小凡进行了专访,以下为采访内容:

\

InfoQ:姜小凡你好,向InfoQ的读者和QCon的参会者介绍下自己吧。

\

\

姜小凡:我是Intel物联技术研究院的首席构架师,也是Intel研究院的主任研究员。最早我在伯克利读本科和博士,期间开始接触物联网这个方向,做了一些无线传感器网络和楼宇能源监测及管理的项目。在博士期间我也做了一些能源控制的startup,并也在美国的Google做了一些MIMO通信的研究。毕业之后我加入了微软亚洲研究院,那时候我主要研究移动互联网、室内定位等。2012年底我再次加入了Intel,为什么说我再次加入呢,是因为我本科毕业的时候,在加州那边的英特尔也工作过一段时间。自2012年底到现在,我们对很多领域的技术进行了探讨,并对其中一些进行了深入研究。其中一个项目是利用物联网和大数据手段做空气质量检测,如PM2.5和雾霾。

\

\

InfoQ:目前你关注的重点是什么?

\

\

姜小凡:把物联网技术真正应用到生活中,把技术真正推向市场并解决一些问题,是我们研究院所有人共同的目标,也是我们关注的重点。对于我个人来说,刚刚说的PM2.5和雾霾问题是我目前一个很重要的关注点。现在有各种手段做PM2.5监测,但是这些方式要么非常昂贵,要么很不精确。而我们利用比较廉价的传感器网络能实时的把颗粒物的数据传到云端,同时收集了不同维度的其他数据,包括气象数据,人的位置数据等,将这些数据融合在一起。最后用机器学习的方式处理这些数据,找到他们之间的关系,学习出不同维度数据互相的影响。通过这种方式,在云端做了空气模型,再通过这个模型增加数据的精确性。我认为这是一个非常经典的物联网和大数据的结合的项目,也希望能够向QCon的听众介绍这个项目。

\

当然我们不仅仅有空气质量方向的研究,我们也做一些可以快速应用的项目,我可以列举几个。如手机验真。现在国内的手机是有很多是仿品,怎么用数据和众包的方式自动检测到手机的真伪?这就涉及到手机硬软件的“指纹”收集,我们在云端建立了一个比较大的数据库,能收集到很多款Android手机的指纹。不同的操作系统,不同的软件版本会生成不同的指纹,通过指纹的方式非常简单的告诉消费者,你买的手机是正品还是仿品。

\

在室内定位方面,我们和海龙大厦合作,通过无线信号指纹的手段定位。这样,我们知道某个消费者时时的精确位置。基于位置信息,可以给消费者提供一些帮助,比如说室内导航,广告的推送。

\

此外还有一些其他的项目,包括我们在公交车做了人流的监测和预测,希望解决交通拥堵的问题。基本上我们现在都是比较实际的问题,希望用大数据、云计算的手段去解决这些问题,而不是花更多的钱去买一个更精确的传感器。我认为这是一个正确的方向。

\

\

InfoQ:海龙大厦室内定位是通过WiFi信号实现的吗?

\

\

姜小凡:是通过WiFi,这个技术在学术界已经有不少论文,但我们还没有看到很多真正的商业应用。我们这里要做的,不是去发论文讨论如何实现,或是如何添加一个什么创意来改进,而是真正将WiFi室内定位推进到应用的层面,我们知道任何一个实验室技术和真正实用化相比还有很大差距的,面对的问题也有很大区别。实验室关注的是可行性,可以对很多条件进行限定;但实际上很多条件是不可预知的,实际应用有太多的细节和技术难关需要解决。

\

\

InfoQ:在过去一年当中,你观察到数据行业有哪些变化?

\

\

姜小凡:开始的时候,大家都觉得大数据要像亚马逊、沃尔玛、Google这些公司那样收集了很多信息,然后通过模型或分析找到可利用的信息。很多人把大数据和Hadoop之类的技术划上等号,拿数据量来标榜大数据。而我的看法却不同,我认为大家越来越关注小数据的集合,为什么呢?之前一般直接从互联网提取数据,但是近一两年,看到的是很多物理世界的数据,比如手机里的加速度传感器的数据,GPS数据,PM2.5数据。这些和物理世界相关的数据越来越多,而且越来越有价值。我认为我们会渐渐把大数据的概念扩展,把空间信息、地理位置信息等meta data都加入进去。而我们更关注的不是数据本身,而是数据之间的关系和它们的相互作用。建立数据之间的关系是有难度的,处理起来也更加复杂。如在实时系统中,留给数据分析和反馈至前端的时间也许只有10毫秒,如何利用流处理和系统优化来达到,这是我们需要深入研究的。

\

\

InfoQ:你怎么理解大数据处理与大数据应用?

\

\

姜小凡:大数据处理方面,大家都认为大数据应该在云端做,但我觉得数据的处理应该是分布式的,我指的不仅是数据中心分散计算能力,而是数据应该在最利于处理的地方处理。比如,如果需要把所有数据以原始的状态发送到云端处理,对网络的压力是非常大的。所以我认为大数据处理,可以在例如手表之类的地方处理再发送到云端,比如视频数据会在摄像头内做一些特征提取,然后再把特征发送到云端。

\

大数据应用有一些经典的例子,比如通过数据分析知道用户在某一时间点喜欢购买的商品,超市可以通过预测来提前订货。在移动应用方面,刚才提到了在海龙大厦的室内定位就是其中之一。

\

\

InfoQ:您曾经说过,希望把PAM传感器的价格降到两三百元人民币,这个目标还需要多久才能实现?

\

\

姜小凡:这个目标在有一定生产量的前提下已经实现了。具体生产量是多少,我们还在进行核算,不过这个量应该不是很大。

\

\

InfoQ:通过大量廉价的传感器搜集数据是未来实现大数据应用的有效手段吗?这其中的难点在哪儿?

\

\

姜小凡:这里的挑战包括数据的可用性,精确性,以及把数据提取到云端的过程耗费的系统资源。以WiFi定位为例,原理上大家都理解,通过收集某一点的3个AP的信号强度,用三角定位实现。但在真实环境,无线信号波动非常大,遮挡物会改变信号强度,信号可能被反射和散射 ,造成信号强度衰减或者增递。物理世界的传感器数据,并没有互联网数据那么干净,需要大量的处理把传感器数据变成可用的数据。

\

姜小凡:物理世界的数据越来越有价值相关推荐

  1. 智能工厂4.0:数字世界和物理世界的融合【附下载】

    来源:专知 概要:自动化与控制发展至今,智能工厂逐渐获得关注,并成为制造企业追求的目标. 自动化与控制发展至今,智能工厂逐渐获得关注,并成为制造企业追求的目标.何为智能工厂?它应该是一个柔性系统,能够 ...

  2. 超越传感器和相机 - 将物联网从云端迁移到物理世界

    在早期,物联网(IoT)在很大程度上充当了基于云的服务的"眼睛和耳朵",从传感器,摄像机和居住在物理世界的其他输入设备收集数据,而不太强调操纵或控制它监控的事情.支持物联网的自动化 ...

  3. 人眼感知到的颜色与真实物理世界的颜色有什么区别?

    ===========2014.08.17补充========== 1.人眼看到的颜色与可见光谱上的频率是怎样对应的?混和颜色可以代替单一颜色(频率的光)吗? 2.如何判断不同人眼中的同一颜色(频率的 ...

  4. 从技法到兵法:今天为何必须关注物理世界的企业智能?

    军事史上有个世纪疑问:火炮这东西最早是中国发明的,但我们的祖先却没有把它发扬光大.欧洲的火炮却很快超越了中国,明朝时期已经需要向西方商人购买"红夷大炮". 这个奇怪的现象当然有很多 ...

  5. 从物理世界到数字世界,陶闯的边界与跨界

    编者按: 东海之滨,浦江之畔,一代代浦东科技先锋人物为中国科技产业做出了杰出的贡献.他们或是行业引领者,或在细分领域中独占鳌头,且都以创新服务社会.促进经济发展为己任.他们的故事就是中国科创的缩影.为 ...

  6. 陶闯博士超级对话:互联网的终极进化——从物理世界到数实世界

    陶闯博士,维智科技创始人兼董事长,PGVerse 维享时空创始人,前微软虚拟地球部全球负责人,前加拿大空间信息国家首席研究教授,PPTV聚力传媒集团合伙人兼前CEO,GeoTango 地图公司创始人兼 ...

  7. 张亚勤:新范式、新架构和新模态突破传统算力,推动物理世界走向数字化

    本文转自联想创投 近日,在联想创投2020 CEO年会上,清华大学讲席教授.智能产业研究院院长.美国艺术与科学院院士.百度前总裁张亚勤先生带来了<未来科技趋势展望>. 张亚勤表示,数字化的 ...

  8. cocos2d-x游戏开发 跑酷(四) 关联与物理世界

    原创.转载注明出处http://blog.csdn.net/dawn_moon/article/details/21451077 前面一节尽管实现了一个跑动的人物,可是他只不过一个精灵在运行一个跑动的 ...

  9. 从行业应用到智慧城市,升哲科技Alpha协议如何保障物理世界的数据传输

    随着国家<"十四五"信息通信行业发展规划>和<物联网新型基础设施建设三年行动计划(2021-2023年)>的政策出台,物联网的产业发展迎来了新一波浪潮.在农 ...

  10. 如何打造智能世界的数据底座?深耕华为云大数据,畅享价值最大化

    随着信息的快速传递,掌控流量和数据成为企业进步的秘诀,想要获得更好的业务发展,当然需要及时掌握信息数据的核心.对于企业而言,如何才能够提升日常报表的处理效率,快速解决各种繁杂的数据呢?华为云大数据的出 ...

最新文章

  1. monty python life of brian-电影Life of Brian 万世魔星
  2. hdu oj1096题解
  3. ubuntu16.04安装UR3/UR5/UR10机械臂的ROS驱动并实现gazebo下Moveit运动规划仿真以及真实UR3机械臂的运动控制(2)
  4. 关于Fragment、Tabhost和FragmentPagerAdapter来实现导航栏的效果
  5. Pandas之:深入理解Pandas的数据结构
  6. python time模块
  7. python 出现 Handler': No module named win32api
  8. Anaconda安装过程中出现InvalidArchiveError
  9. UVA 1329 Corporative Network(并查集:路径压缩)
  10. 将excel转换为Xml
  11. gps天线拆解图片_GPS天线原理
  12. JAVA(jar)软件_Autojar - 打包工具 - 开发工具 - JAVA开源项目 - 开源吧
  13. text 热敏打印机_便携热敏打印机API参考手册.pdf
  14. 颜色的RGB数字表示方法
  15. 计算机之父图灵获英女王赦免
  16. pci规划的三个原则_PCI规划应遵循什么原则? - 51学通信网络课堂 - 通信人值得信赖的在线交流学习平台 - Powered By EduSoho...
  17. Netty案例(二)之耗时任务的处理
  18. 两化融合的定义和两化融合如何认定
  19. Java实现 LeetCode 377 组合总和 Ⅳ
  20. 基于matlab系统辨识工具箱,基于matlab的识别系统

热门文章

  1. 飞客蠕虫病毒?分析、定位、处理
  2. linux保密检查工具,linux使用lynis检查系统安全
  3. SSCOM的模拟连接测试及服务器连接
  4. 如何开好一个软件类周会和周报
  5. 电脑修改服务器时间怎么改,修改服务器时间_如何修改服务器时间 做到同步?...
  6. 克服移动应用开发的挑战
  7. 基于slicer开发(简化功能与插件开发)
  8. 【181202】VC 屏幕画笔程序源码源代码
  9. Smart3D中空三的设置
  10. RF-实现接口自动化