在 7.10 中,新用户,经验丰富的用户和地理空间分析师可以为之高兴! 它增强了文件摄取过程,以便自动为你映射文件中的经/纬度字段并分配正确的数据类型。 这是什么意思? 使用机器学习应用程序中 CSV 数据的文件上传界面,当数据集包含名为 latitude 和 longitude 的字段时,提取过程会自动将这些字段合并为 geo_point 位置字段。 如果你的字段具有无法识别的名称,则无需担心-你可以使用简单的界面自己添加新字段。 无需手动输入 JSON。

下面,我将以极易简单的例子来进行展示。我将使用 Elastic Stack 7.10 来进行展示。

首先,我们参照之前的文章 “Logstash:导入 zipcode CSV 文件和 Geo Search 体验” 下载 zipcode 的 CSV 文件:

git clone https://github.com/liu-xiao-guo/elasticzipcodes

这个 CSV 文件的格式如下:

从上面的表格中,我们可以看出来有两个字段:Longtitude 以及 Latitude 字段。我们可以使用如下的功能来把数据进行导入:

在上面我们可以清楚地看到:Latitude 以及 Logitude 被自动组合成为一个新的 geo_point 的数据类型。这个在之前的版本中是没有这个功能的。我们点击 Advanced:

在有些情况下,也许你的字段名称并不是标准的 Logititude 以及 Latitude。你可能是 Lat 及 Lon,那么机器学习可能并不能辨识你的这些字段。在这种情况下,我们可以点击 Add combined field 来创建一个字段:

如上所示,我们可以选择需要的字段,比如 Lat 及 Log。当然针对我们的情况,我们还是做如上所示的选择,因为这些都是仅有的选项。点击 Add 按钮:

如上图所示,经过我们的这番操作,我们可以看到有两个位置信息字段 location 已经 my_location。当然这个是为了说明问题,在实际的使用中,我们只需要一个位置信息字段即可。我们点击 Import 按钮。这样就完成了数据的导入。

我们可以在 Kibana 的 console 中通过如下的方式来查看 zipcodes 的 mapping:

GET zipcodes/_mapping

上面的命令显示:

{"zipcodes" : {"mappings" : {"_meta" : {"created_by" : "ml-file-data-visualizer"},"properties" : {"AreaCode" : {"type" : "long"},"Code" : {"type" : "long"},"Disabled" : {"type" : "boolean"},"Id" : {"type" : "long"},"Latitude" : {"type" : "double"},"Longitude" : {"type" : "double"},"Name" : {"type" : "keyword"},"ShortName" : {"type" : "keyword"},"Sort" : {"type" : "long"},"location" : {"type" : "geo_point"},"my_location" : {"type" : "geo_point"}}}}
}

我们可以看到之前定义的两个位置信息字段 location 以及 my_location。它们都是 geo_point 的数据类型。

Kibana:改善地理位置数据摄入 - 7.10相关推荐

  1. 【安全头条】美国政府起诉 Kochava 出售敏感的地理位置数据

    1.美国政府起诉 Kochava 出售敏感的地理位置数据 8月29日报道,美国联邦贸易委员会 (FTC) 宣布对总部位于爱达荷州的Kochava 提起诉讼,指控其出售从数亿移动设备收集的敏感且精确的地 ...

  2. 推荐!关于学习数据科学的10件事

    ↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习,不错过 Datawhale干货 编译:张峰,Datawhale成员 我经常在我的YouTube频道Da ...

  3. 极客日报:小鹏汽车回应非法收集人脸数据被罚10万;OPPO发布首颗自研芯片马里亚纳X;AMD 3DNow指令集被Linux淘汰

    一分钟速览新闻点! 阿里巴巴推出暖心计划:新增共27天时长带薪假 程序员编码自动给自己微信转账553笔 超21万元 OPPO发布首颗自研芯片马里亚纳X 挂机外挂软件破坏QQ正常运行,腾讯一审获赔52万 ...

  4. python与excel做数据可视化-用Python进行数据可视化的10种方法

    原标题:用Python进行数据可视化的10种方法 2015-11-19 关于转载授权 大数据文摘作品,欢迎个人转发朋友圈,自媒体.媒体.机构转载务必申请授权,后台留言"机构名称+转载&quo ...

  5. qtextbrowser 大量数据卡顿_800万行的数据,Excel 10秒钟就能完成统计?这个工具太良心了!...

    作为财务会计人员,让人非常头痛的工作之一,莫过于核对数据了,比如:在上千的Excel表格中,找出不同列中数据不同的那一行:在上万个数据中,找出同一列中重复的数值.每天这样核对数据,看得眼睛都快瞎了! ...

  6. flink读取不到文件_日处理数据量超10亿:友信金服基于Flink构建实时用户画像系统的实践...

    简介: 友信金服公司推行全域的数据体系战略,通过打通和整合集团各个业务线数据,利用大数据.人工智能等技术构建统一的数据资产,如 ID-Mapping.用户标签等.友信金服用户画像项目正是以此为背景成立 ...

  7. [html] 如何优化大数据列表(10万+)的性能?说说你的方案

    [html] 如何优化大数据列表(10万+)的性能?说说你的方案 定时器批量绘制, 过滤,查询使用serviceWorker ? 个人简介 我是歌谣,欢迎和大家一起交流前后端知识.放弃很容易, 但坚持 ...

  8. 广西行政村数据shp_广西自治区乡镇行政区划数据 精度1:10万

    原标题:广西自治区乡镇行政区划数据 精度1:10万 数据简介 行政区划是国家为了进行分级管理而实行的区域划分.中国现行六级行政区,即省级.地级.县级.乡级.村级.组级,其中省.县.乡三级为基本行政区. ...

  9. android读取运动数据权限_Android 10 中身体活动数据的隐私保护

    Google Fit是我们在 2015 年推出的一个开放式平台.通过调用平台内置的 Google Fit API,开发者可以为应用添加丰富多样的追踪功能,随时随地记录用户的健康和运动状况.这几年来,越 ...

最新文章

  1. 可构建AI的「AI」诞生:几分之一秒内,就能预测新网络的参数
  2. 【USACO training】Chapter 1 入门
  3. 【iOS报错】“this class is not key value coding-compliant for the key userPhoneNum”给字典设置键值对的时候报错...
  4. Jmeter CSV 参数化/检查点/断言
  5. 概率统计概念复习:MAPMLE
  6. 在最美好的年华里,不要辜负最美的自己
  7. jenkins部署_Jenkins:部署JEE工件
  8. linux添加video驱动,linux下video驱动源码位置
  9. IT项目管理-----给年轻工程师的十大忠告
  10. 2020-09-30
  11. matlab里的timer,关于Matlab中用timer来实现多线程机制
  12. 人脸识别考勤机选型验收标准
  13. [CTSC2010]珠宝商(点分治+根号分治+后缀自动机)
  14. 华为服务器克隆linux,华为RH2288H V3服务器磁盘阵列配置RAID
  15. Redis 进阶笔记
  16. 超实用的 IPTV 管理工具,xTeVe 助你定制专属电视频道。
  17. Android 11.0 12.0TvSettings系统设置遥控器home键退不出主页面功能的修复
  18. java学习视频网课收集
  19. 二维数组的初始化(二维数组的赋值)
  20. google APP 说明

热门文章

  1. adb运行以及adb常用命令
  2. Openlayers 6 零基础教程
  3. Android ninja介绍
  4. 分布式系统-共识协议
  5. Ubuntu中docker的安装和使用
  6. unity支持的模型数据格式,unity3d模型制作规范
  7. 《生物信息学:导论与方法》--本体论、分子通路鉴定--听课笔记(二十)
  8. JavaScript实现五种排序算法
  9. 苹果端手机微信页面长按图片无法保存的解决方案
  10. 大数据和位置智能:助力企业数字化战略落地