地震波形自动分类及识别(构想)
地震波形自动分类及识别
- 一、任务背景
- 二、数据格式
- 三、拟采用方法及理由
- 3.1、提高计算速度
- 1、减少噪声
- 2、算法优化
- 3.2、提高泛化性
- 1、提高地域相关泛化性
- 2、提高学习效率
- 3、数据增强
- 3.3、实验与检测
一、任务背景
随着地震仪在全球范围的大规模部署,人类已经进入地震大数据时代.如何处理地震网络每天收集的大量数据,特别是从质量参差不齐的连续波形记录中分离出地震和噪声是一个非常棘手的问题.大地震发生之后,抗震救灾与应急救援需要对余震序列进行动态的监测与快速定位,地震编目,地球内部速度结构研究如层析成像等都是以大量地震事件的挑选与到时拾取作为基础,而目前这些工作仍主要靠低效的人工完成。
发展高效、高精度、普适性强的自动波形拾取算法在地震大数据时代背景下显得越来越重要.波形自动拾取算法的主要挑战来自如何适应不同区域的不同类型地震事件的分类与筛选。
与基于单一或多个特征函数的传统方法相比,CNN 网络的精度和召回率(误检和漏检率)相比传统算法有非常明显的提升(降低),并且训练好的模型具有非常稳定的输出能力,不需要根据不同信噪比水平的数据频繁调整阈值.与模板匹配、FAST 等严格基于波形相似性的方法不同,CNN 神经网络从训练数据中提取的是抽象特征,这意味着模型具有更强的泛化能力,能够与更多样的波形特 征 相 匹 配,所 以 CNN 往往能够检测到新的地震类型,这也是深度学习方法的主要优势所在。
二、数据格式
以汶川地震之后四川及邻区14个台站7~8月期间手动挑选的 13839 条和 8900 条地震事件波形分别构建训练数据集和测试集,搭建深度卷积神经网络进行模型训练和测试。
数据集包括:
1.stlist.txt:列出数据来自的站点。
2.wenchuan_aftershocks_picks_2008_6_to_9.csv:汶川余震的25000个P和S拾取的UTC时间戳(高度可信),您可以使用它为CNN数据集或U-net数据集构建正样本。如果您仍然不知道如何操作,第1和第2页将为您提供有关操作方法的说明。有关CNN数据集,您也可以参考https://github.com/mingzhaochina/ConvNetQuake。
3.wenchuan_bold_catalog.csv:用于构建CNN的负样本(噪声)。您需要在连续数据中避免这些时间戳处于某 个范围内,例如[-60s,+ 60s]。
三、拟采用方法及理由
多个地震事件建立数据集并训练 CNN 模型,其得到的模型具有较强的泛化能力,即使对与训练数据所属区域构造不同的地区,也能有效检测。
3.1、提高计算速度
1、减少噪声
尽可能减少事件人工标注和噪声随机筛选带来的误差,我们手动对数据集进行了清洗,更正较为明显的标注错误
应用长短窗方法,根据各地台站的信噪比
条件选择合适的阈值做初步筛选,这样做是为了提高算法效率,过滤掉大部分环境噪声。
2、算法优化
使用L2正则化以及随机梯度下降算法来最小化交叉熵损失函数,并用 ADAM 优化算法以及可变时间步长,进一步提高了计算效率,在保证精度的同时有效提升计算速度。
3.2、提高泛化性
核心思想:理想的数据集的每一类别都需要充分的样本数量,并且能够覆盖地震波形所具有的各种复杂特征。
1、提高地域相关泛化性
由于不同的区域具有不同地质构造背景,其事件波形也各不相同,因此我们参考历史地震活动性区域划分按照地震震中之间 的 欧 几 里 得 距 离 进 行 了 K-Means 聚 类 算法划分,增强 CNN 算法性能与地域的相关性。
2、提高学习效率
过多重复的数据需要设置合适的阈值,清洗掉部分数据,保证在维持低水平误差率的情况下避免过拟合。
3、数据增强
为了防止数据量过小可能导致的泛化性差,我们还对清洗后的数据集进行了数据增强操作。由于地震三分量波形可以看作一维三通道图像数据,可参照图像识别,采用了如下几种常用的数据增强方式:平移、加噪(模糊处理)、滤波。
同时 CNN 方法还可以通过将误分类波形代入数据集重新训练,从而获得越来越 好的实际分类效果。
3.3、实验与检测
1、使用精确率与召回率方法去验证训练效果。
2、与传统方法的对比:对 CNN 网络识别为地震的波形片段,
可采 用dbshear震相自动识别程序进行挑取处理,将拾取到的 P、S到时与中国地震台网发布的参考地震目录进行关联对比,分析实际效果。
地震波形自动分类及识别(构想)相关推荐
- 用时序数据库 DolphinDB 实现地震波形的分析预警
1. 绪论 波形数据的存储与实时流处理是地震预警.地震速报.地震烈度速报.震源机制解等数字地震台网综合处理系统的前提,合理的存储方案与高效的实时流处理架构能极大地节约存储成本.降低响应延时.方便震源分 ...
- python处理地震sac数据_试用python读取地震波形的二进制SAC文件
sac文件比较简单,不过有些设置没有处理,只是单纯的读取并绘图. 代码: import struct import pylab class sacfile_wave: def read(self,sF ...
- 进行三万多次地震训练后,他们发现了快速预测震动强度的新方法
点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 来源:大数据文摘本文约1000字,建议阅读5分钟DeepShake能 ...
- Kaggle鱼品种识别
Kaggle比赛官网:https://www.kaggle.com/c/the-nature-conservancy-fisheries-monitoring 代码:https://github.co ...
- 地震勘探基础(十三)之地震资料解释
地震资料解释 地震资料解释(seismic interpretation)就是把经过采集和计算机处理后的地震数据转变为地质信息的过程.也就是由已知实际观测的地震数据反演地下地质特征的过程,因此地震资料 ...
- 图像识别和计算机视觉:如何应用人工智能技术实现自动化检测和识别
章节一:引言 在数字化时代,图像数据成为了我们日常生活中不可或缺的一部分.然而,随着图像数据的急剧增加,传统的手动处理和分析方法已经无法满足我们的需求.这就引出了图像识别和计算机视觉技术的重要性.本文 ...
- 【回顾】云创大数据地震事业部成立
2016年12月5日,云创大数据地震事业部宣布正式成立.此后,地震事业部将依托地震数据管理与服务平台,基于地震的现存数据.历史数据.实时增量数据,进行地震监测与预警:平台不仅提供有效存储和管理的基础技 ...
- 信号波峰波谷二阶差分识别算法
1.聊一聊 其实每个人在无助的时候都需要一句"Cry On My Shoulder!" 今天跟大家介绍一种波峰波谷的检测方法,不是很难,不过能够凸显数学在编程算法中的重要作用. 2 ...
- Kaggle_NCFM鱼品种识别
Kaggle比赛官网:https://www.kaggle.com/c/the-nature-conservancy-fisheries-monitoring 代码:https://github.co ...
- 【数字信号调制】无线电信号调制识别matlab源码
1 简介 通信信号具有多种调制方式,其主要任务是在信号诸多的环境下确定接收信号的调制方式和其他信号参数,从而确保无线电信号的准确性和真实性,以便于技术人员对信号进行更深一步的分析和处理.通信信号的调制 ...
最新文章
- Java注释 link_开源代码中注释中的那些a link p @ 是给什么编辑器用的????
- IIS下的FTP使用
- 使用SAP Spartacus的route给标准页面维护alias入口
- html5 支持音频格式,html5中audio支持音频格式
- UNIX(多线程):23---线程池注意事项和常见问题
- poj 3279 poj 1753
- 设计师和程序员-拓展知识关系网
- 凸优化第五章对偶 作业题
- 科来数据包生成器找不到网卡适配器
- 计算机打印机无法打印,电脑打印机无法打印怎么办 打印机不能打印解决办法...
- 怎么电脑计算机管理员去掉,电脑每次运行程序都要管理员身份怎么办?
- 力软工作流:协同OA精准化采购平台自主搭建
- 华为5g cpe 虚拟服务器,购买华为5G CPE Pro 2之前你需要知道这些
- 管理者如何正确激励员工、调动其工作积极性?
- 李航 统计学习方法 中的adaboost案例详解
- stata蒙特卡罗模拟(二)模拟中心极限定理
- 华为鸿蒙8g运存够用吗,华为是最强的国产安卓手机,6G和8G运存的区别是什么?...
- 2022年食盐市场现状
- 酷科技 | 智能戒指 ——将科技武装到手指
- 纯干货!Java后端开发十二条经验分享!
热门文章
- 《甄嬛传》计谋汇总, 本文忠实于《后宫 甄嬛传》第1本~第7本+番外原文,而非电视剧。
- 我与计算机1000字大学,计算机系大学生助学金申请书(1000字)
- Win10怎么添加开机启动项?Win10添加开机自动运行软件三种方法
- 教你win7去除快捷方式小箭头方法
- 阿里聚石塔2.0部署前后端分离项目
- 上市公司9月23日晚间公告速递
- 《宗教与科学》——罗素 读书笔记
- java报错NoClassDefFoundError: Could not initialize class
- 恶意点击软件测试简历,亲测百度竞价的恶意点击:60%广告费浪费
- 织梦建站教程dedecms标签调用大全【经典教程】