本节书摘来自华章计算机《数据科学R语言实践:面向计算推理与问题求解的案例研究法》一书中的第1章,第1.1节,作者:[美] 德博拉·诺兰(Deborah Nolan)  邓肯·坦普·朗(Duncan Temple Lang)  更多章节内容可以访问云栖社区“华章计算机”公众号查看。

1.1 引言

无线网络的发展激发了人们在利用统计学方法来可靠地追踪人和物品方面的商业兴趣与研究兴趣,无论这些人和物品是处于商店、医院、仓库还是工厂等场所的内部。全球定位系统(GPS)在建筑物内不能可靠地工作,但随着无线局域网(LAN)的盛行,室内定位系统(IPS)可担此重任。它利用从网络接入点检测到的WiFi信号,可以回答如下问题:医院里的某件设备在哪里?我在何处?我的邻居是谁?等等。理想情况下,通过很少量的训练、校准和设备,就可以几乎实时地准确回答上述这些问题。
要想建立一个室内定位系统,首先要求有一个参照数据集,它包含在整个建筑物的给定位置上,一部诸如手机或笔记本电脑这类的手持设备与路由器这类固定接入点之间的信号强度的测量值。利用这些测量值作为训练数据,就可以建立一个关于设备位置的预测模型,即设备与每个接入点之间信号强度的函数。这样,根据从一个新设备检测到的信号值,就可以用该模型预测这个新设备的位置。在本章,我们将检测大约100万个信号强度测量值,并开发一个统计型IPS。这些数据是从德国曼海姆大学的一座大楼里的6个固定WiFi接入点(路由器)上记录的。
这个过程的第一步是了解如何采集数据并对其格式化。为此,在1.2节,我们先阅读由记录这些数据的研究者所提供的文档,并对其特性进行调研。当我们对这些数据有了认识之后,将其组织成适合于分析的结构。然后,1.3节介绍如何清洗数据。在建模之前,我们需要更深入地检阅信号强度数据,以更好地理解其统计特性(1.4节)。最后,在1.5节,我们通过执行最近邻方法进行位置预测,并在曼海姆大学研究者提供的第二个数据集上对该方法进行测试。
计算方面的主题
本章涉及的计算方面的主题如下:
字符串操作。
数据的结构和表示,包括可变长度的观测值。
对参差数组中的数据进行聚合计算。
探索性数据分析和可视化。
模态函数。
程序调试。
最近邻方法。
参数选择的交叉验证。

《数据科学R语言实践:面向计算推理与问题求解的案例研究法》一一 1.1 引言...相关推荐

  1. 《数据科学R语言实践:面向计算推理与问题求解的案例研究法》一一2.1 引言...

    本节书摘来自华章计算机<数据科学R语言实践:面向计算推理与问题求解的案例研究法>一书中的第2章,第2.1节,作者:[美] 德博拉·诺兰(Deborah Nolan) 邓肯·坦普·朗(Dun ...

  2. 《数据科学R语言实践:面向计算推理与问题求解的案例研究法》一一2.3 数据清洗和变量格式化...

    本节书摘来自华章计算机<数据科学R语言实践:面向计算推理与问题求解的案例研究法>一书中的第2章,第2.3节,作者:[美] 德博拉·诺兰(Deborah Nolan) 邓肯·坦普·朗(Dun ...

  3. 《数据科学R语言实践:面向计算推理与问题求解的案例研究法》一一2.5 为跨年度的个人参赛选手构造记录...

    本节书摘来自华章计算机<数据科学R语言实践:面向计算推理与问题求解的案例研究法>一书中的第2章,第2.5节,作者:[美] 德博拉·诺兰(Deborah Nolan) 邓肯·坦普·朗(Dun ...

  4. 《数据科学R语言实践:面向计算推理与问题求解的案例研究法》一一2.4 探索所有男选手的跑步时间...

    本节书摘来自华章计算机<数据科学R语言实践:面向计算推理与问题求解的案例研究法>一书中的第2章,第2.4节,作者:[美] 德博拉·诺兰(Deborah Nolan) 邓肯·坦普·朗(Dun ...

  5. 《数据科学R语言实践:面向计算推理与问题求解的案例研究法》一一2.6 对个人跑步时间的变化进行建模...

    本节书摘来自华章计算机<数据科学R语言实践:面向计算推理与问题求解的案例研究法>一书中的第2章,第2.6节,作者:[美] 德博拉·诺兰(Deborah Nolan) 邓肯·坦普·朗(Dun ...

  6. 数据科学r语言_您应该为数据科学学习哪些语言?

    数据科学r语言 Data science is an exciting field to work in, combining advanced statistical and quantitativ ...

  7. 数据可视化——R语言ggplot2包绘制精美的小提琴图(并箱线图或误差条图组合)

    数据可视化--R语言ggplot2包绘制精美的小提琴图(并箱线图或误差条图组合) 概述:R语言使用ggplot2工具包绘制小提琴图.为了使数据表达更加丰富,同时将小提琴图与箱线图和误差条图相结合.另外 ...

  8. 大数据之R语言速成与实战

    什么是R语言? R语言由新西兰奥克兰大学的Ross Ihaka和Robert Gentleman两人共同发明.其词法和语法分别源自Scheme和S语言. R定义:一个能够自有有效的用于统计计算和绘图的 ...

  9. R语言︱H2o深度学习的一些R语言实践——H2o包

    每每以为攀得众山小,可.每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~ --------------------------- R语言H2o包的几个应用案例 笔者寄语:受启发 ...

最新文章

  1. 专属个人的聊天机器人的实现——图灵机器人
  2. PDF.NET数据开发框架操作MySQL实体类操作实例
  3. js学习笔记(执行上下文、闭包、this部分)
  4. War包与配置文件分离
  5. TF之DNN:利用DNN【784→500→10】对MNIST手写数字图片识别数据集(TF自带函数下载)预测(98%)+案例理解DNN过程
  6. 重磅!PyTorch 中文手册已开源!理论、实践、应用都有了!
  7. oracle中用户连接相关
  8. Linux 安装Python37
  9. Eclipce Luna 离线安装ADT23
  10. 运用Logistic模型检验影响企业现金分红的主要因素
  11. jxta java_JXTA-JavaP2P JXT
  12. ros自带到期通知_iPhone自带的8个App,没想到这么好用!
  13. 数据工程师岗位职责解析
  14. MT6573芯片资料集锦芯片MTK6573_环境搭建
  15. Unity 使用Excel 读取文件 所碰到的坑 使用Excel.dll读取
  16. Linux驱动之TTY(一):概念
  17. 如何在微信中使用企业邮箱,企业微信邮箱密码是什么?
  18. arcgis数据量大显示慢_百万量级矢量数据加载对比实验,Arcgis VS LSV专业版
  19. .Net Micro Framework 嵌入式开发
  20. 发版名词介绍(alpha,beta,RC,Release)

热门文章

  1. 从2016年的11月1日开始
  2. 1.11 Xcode右侧界面介绍 [原创iOS开发-Xcode教程]
  3. 进度条上的起伏_进度条(ProgressBar)的功能与用法
  4. Android10 高通平台 softap热点基本流程1
  5. 谁是中国元宇宙第一城?
  6. 计算机音频服务无法启动,win10系统audioendpointbuilder音频服务无法启动的解决办法...
  7. Android 蓝牙电话联系人同步之蓝牙状态检测
  8. 碳中和城市建筑能源系统(1):能源篇(龙惟定)2022
  9. html随机背景图,网页的随机背景图
  10. 网页视频加速,chrome亲测有效