11 月 28 日,身负 7 条人命,潜逃 23 年的“蛇蝎女魔”劳某枝在厦门自己工作的商场被捕。 11 月 27 日,厦门警方通过大数据研判发现,一名疑似潜逃人员劳某的女子出现在厦门某商场附近。警方将抓取到的嫌疑人照片与逃犯 20 年前的面部图片面部进行特征匹配,相似度高达 97.33% 。此结果促使警方快速展开伏击行动,于 28 日正式将嫌疑人逮捕。

大数据抓逃犯的新闻近几年已屡见不鲜,最知名的当属张学友演唱会上陆续抓捕 60 人的神记录。公安大数据能够屡立战功的主要原因是其汇集多个行业社会数据,将 “ 人、车、场、住、行 ” 五大感知要素以及网络实名应用等多种实时监测数据,将警情分析、治安质态、人口数据、重点人员追踪等信息灵活展示出来,提供实时、直观、整合的信息,为快速、精准制定决策提供支持。


支撑这类庞大的大数据架构能够快速做出结果研判的基础是一个典型的分布式对象存储架构。当我们在交管所、银行等营业厅办理业务,酒店办理住宿、上网信息登记时,为了鉴别身份及遵从行业法规要求,业务系统会将我们的头像特征和笔记签名等信息以图片和视频的形式保存在后台存储系统中,同时在公共区域的安防监控设备数量也在大量增加,抓拍、录制的图片、视频也需要根据需求上传到公安大数据系统。伴随着人口的快速增长、数据采集终端数量的增加、图片 / 视频等对象文件的清晰度越来越高、法规要求保留年限更长,业务后台存储系统所需要存储的容量从 TB 到 PB 级、数量从百万到百亿级,呈现爆炸式增长,传统存储架构扩展性差,已经很难应对这样的趋势,这对需要在任一地点实时调取相关影像资料的业务系统来说是巨大的挑战,因此能够实现容量和性能弹性扩展,区域与中央互备,快速检索分类影像文件的分布式对象存储(软件定义存储)系统成为当前形势下的刚需。

对于侦破案件,每一分钟都非常重要,如果因为非结构化数据(图片、视频等)处理性能不足造成研判结果经过几个小时才能得出,很有可能错过了抓捕嫌疑人的最佳时间。分布式存储架构的好处就在于:

第一, 各行业系统的数据分别独立于本地或云端存储,并定期与公安大数据平台数据同步,实现了数据的多中心容灾,数据可就近访问;

第二, 对于容量从 TB 到 PB 级、数量从百万到百亿级的存储变化趋势,分布式存储基于通用 X86 服务器硬件构建,可以充分利旧、弹性扩容、动态增减;

第三, 分布式存储利用哈希计算,即使上亿级文件也可以实现快速的检索访问,有效帮助大数据应用对底层存储数据的调用和分析。

不仅如此,国内一些软件定义存储厂商也在对象存储方案的基础上不断优化数据处理的效率,提升数据价值。以杉岩数据为例 ,作为国内领先的软件定义存储厂商,在其海量对象存储产品( MOS )的最新版本中提供了 AI 服务后处理框架支持,可以轻松应用各类 AI 服务能力到客户的业务系统,如人脸智能识别技术,可以自动地将存入业务系统的人脸图片中的面部特征提取出来,并分类打上标签,提高人脸检索的效率。这一功能目前可广泛应用到交通管理、公安治理、金融服务等诸多场景。

伴随着信息技术的发展,各行各业的业务处理效率得到大幅提升。存储作为数字信息化转型的基础,值得各行业 IT 运维人员以及管理者的重视,只有打好基础,才能更快发展。

杀人女魔被捕大数据立功,数据存储架构决定研判效率相关推荐

  1. 【观察】西部数据持续创新存储架构,引领存储迈入精细化运营时代

    申耀的科技观察 读懂科技,赢取未来! 毫无疑问,作为推动数字经济发展的核心基础设施和重要支撑,数据中心承担了数据存储.数据价值挖掘的关键作用,特别是5G.云计算.大数据.移动互联网.人工智能等新技术. ...

  2. 镭速联合Azure Blob 存储,重塑大文件传输平台存储架构

    Azure Blob 存储是Microsoft 提供的适用于云原生工作负载.存档.数据湖.高性能计算和机器学习的可大规模缩放且安全的对象存储,是目前市场上唯一一种可为低延时和交互式方案提供基于SSD的 ...

  3. 连载:阿里巴巴大数据实践—数据建模综述

    简介:数据模型就是数据组织和存储方法,它强调从业务.数据存取和使用角度合理存储数据. 前言: -更多关于数智化转型.数据中台内容请加入阿里云数据中台交流群-数智俱乐部 和关注官方微信公总号(文末扫描二 ...

  4. Shopee ClickHouse 冷热数据分离存储架构与实践

    本文首发于微信公众号"Shopee技术团队". 摘要 Shopee ClickHouse 是一款基于开源数据库 ClickHouse 做二次开发.架构演进的高可用分布式分析型数据库 ...

  5. 作者:吴力波(1974-),女,复旦大学大数据学院教授、副院长、博士生导师...

    吴力波(1974-),女,复旦大学大数据学院教授.副院长.博士生导师,国家社科重大项目"基于大数据的宏观经济现时预测理论与方法研究"首席科学家,主要研究方向为能源大数据分析.宏观经 ...

  6. 2015年《大数据》高被引论文Top10文章No.9——大数据是数据、技术,还是应用

    2015年<大数据>高被引论文Top10文章展示 [编者按]本刊将陆续发布2015年<大数据>高被引论文Top10的文章,欢迎大家关注!本文为高被引Top10论文的No.9,刊 ...

  7. 数据元、元数据、主数据、交易数据、主题数据、数据资源、大数据、数据湖等数据相关概念理解和总结

    1.数据元 1.1 标准定义 [GB/T 18391.1-2002,定义3.14] ,用一组属性描述定义.标识.表示和允许值的数据单元,数据元由三部分组成:对象.特性.表示. 1.2 我的理解 数据元 ...

  8. 大数据-平台-解决方案-基础架构一览

    1.talkingdata  (数据平台) 2.明略数据(解决方案) 3.百融金服(金融大数据) 4.国双科技(营销大数据) 5.国信优易(媒体大数据) 6.百分点(营销大数据) 7.华院集团(解决方 ...

  9. 大数据解决方案背后——开放架构才是未来

    摘要:大数据的浪潮有多迅猛?IDC在2006年估计全世界产生的数据量是0.18ZB(1ZB=100万PB),而今年这个数字已经提升了一个数量级,达到1.8ZB,差不多对应全世界每个人一块100多GB的 ...

最新文章

  1. $@ 与 $* 差在哪?
  2. mysql数据库的打开失败_MySQL数据库启动失败解决
  3. 谈谈对Canal(增量数据订阅与消费)的理解
  4. java设计单词英译汉小助手_拣单词|第八期第3天:第521528个单词宝藏
  5. 用什么代码可以改变键盘_为什么我改变了对代码质量的看法
  6. 前端学习(3329):闭包的形式5
  7. android 获取通讯录全选反选_Xamarin.Forms读取并展示Android和iOS通讯录 TerminalMACS客户端...
  8. 2.2基本算法之递归和自调用函数_7592 求最大公约数问题
  9. PHP的php://input和$HTTP_RAW_POST_DATA 和$_POST的关系
  10. java多线程和长连接,三方转换通信的实践(2)——数据库端服务程序
  11. android4.4.2 以太网代理,Android2.3.4系统添加Ethernet框架支持
  12. 深度剖析 C++ 对象池自动回收技术实现
  13. 【LeetCode】贪心算法:常见典例
  14. C语言之迷宫小游戏2.0版(随机生成地图,可变颜色,优化游戏体验)
  15. 普通用户登录出现“sorry, that didn‘t work please try again”
  16. 解读PureMVC框架
  17. 科研成果 | 信道模型 | 原理及随机数仿真 | 均匀、正态、双高斯、瑞利、莱斯、对数正态、nakagami、Suzuki分布的随机数仿真(matlab)
  18. php头像获取,php获取QQ头像并显示的方法
  19. 热爱工作,拥抱明天——读《干法》有感2800字
  20. 常见问题 | Influx 产品常见问题及使用技巧(1)

热门文章

  1. 基于php的汽车俱乐部会员管理系统——计算机毕业设计
  2. 关于科目二的训练期间以及考试完后的一些感受
  3. Citrix:一直被模仿,从未被超越。评Liquidware Labs Inc发布适用于View的个性化磁盘产品...
  4. Kotlin Jetpack 实战: 图解协程原理 | 开发者说·DTalk
  5. Avro下载及使用(序列化,反序列化)
  6. 怎么将IDEA从中文调回英文
  7. 如何玩转私域流量运营?
  8. 生产用计算机打印机管理,办公电脑及打印机是否按电子设备计提折旧?
  9. 使用matlab文件绘制匀变速直线规律研究中的两种图像
  10. Bezier曲线的构建