空间范围: 中国大陆及邻区(15°-50°N, 65°-140°E)
时间范围: 2020.03-2023.02
简介:
面对未来海量的地震监测数据,智能化的数据处理、分析和解释,离不开高质量、规范化的专业数据集,谛听地震学数据集在1.0版本基础上,进一步升级和迭代完成了2.0版本的研发, 服务地震学人工智能和大数据研究分析。
谛听数据集2.0收集了中国地震台网2020.3~2023.2年间的震相观测报告和国家测震台网数据备份中心的事件波形,包括来自264,298个中国大陆及邻区天然地震事件的1089920条三分量波形,以及958076个Pg、780603个Sg、152752个Pn、25956个Sn震相到时标签,此外还有249477个Pg波、41610个Pn初动极性标签。数据集中,地震事件的震级范围为0~8.2级,震中距范围为0~1000 km, 台站方位角分布为0~360度,均与波形对应进行了标注。
本次谛听数据集2.0增加了非天然地震数据类型,一共收录了2009年至2023年2月1496个事件共计15375条波形,主要事件类型为爆破(ep,占36.5%)、疑爆(sp,8.7%)、塌陷(ss,34.5%)、其他(ot,18.9%)等。
此外,本次谛听数据集2.0还专门制作了单独的噪声数据集,旨在提升人工智能模型在实际应用中的抗噪能力。噪声数据取自使用人工智能算法对全国台网2021.6-2023.2期间连续波形记录进行检测所产生的典型干扰信号,总共~13万,共由四个小组分工复核完成,主要噪声种类包括:(1)实时流数据传输故障引起的波形间断或畸变;(2)仪器故障产生的异常波形;(3)工业活动等非天然地震事件;(4)存在振幅和频率特征变化的噪声等。