国家地震科学数据中心

中国测震站网完备数据集(CSNCD)

站内咨询
  • 2024-04-24
    最新更新时间
  • 1.6TB 45000000条
    数据量
  • 10317
    数据访问量
  • 数据共享方式
    离线获取

数据基本信息

所属分类: 测震数据 ( D11000 )
数据标识: DOI:10.12080/nedc.11.ds.2023.0001
CSTR:CSTR:12166.11.ds.2023.0001
时间范围: 2009.01-2022.12
空间范围: 全球范围

数据集制作者信息

制作者: 安艳茹,张莹莹,苗春兰等
邮   箱: anyanru@seis.ac.cn
单   位: 中国地震台网中心

数据摘要

中国地震台网中心(CENC)是中国防震减灾工作的重要业务枢纽、核心技术平台和国际交流的重要窗口。作为全国地震编目业务的牵头单位,CENC负责中国测震站网观测产品的产出和质量控制,其中统一编目正式报(地震目录和观测报告)被视为中国测震站网的权威观测产品,长期为地震业务和科学研究提供着重要的数据支撑。近期,依托中国地震局测震学科技术管理组观测产品部,中国地震台网中心联合31个省(直辖市、自治区)地震局联合制作了中国测震站网完备数据集(CSNCD:A Comprehensive Dataset of Chinese Seismic Network),是由中国地震台网中心首次发布的地震学大型综合数据集。该数据集纳入了中国地震统一编目正式报中的所有事件和标注信息,相关标注由全国站网编目人员人工标注,数据可信度高,可作为众多数据驱动研究的重要参考数据。迄今为止,CSNCD数据集是中国范围内发布的时间跨度最长(2009-2022年),事件个数最多(130余万个),标注数量最大(4500余万条),震中距范围最广(0-180°),震相类型最丰富(50余种),震级跨度最大(-2.0 ~ 9.0级),事件类型最全面(7种)的地震权威数据集。CSNCD数据集会每年进行更新,可为深度学习算法提供海量的标注完备的高质量学习样本,构建高精度的机器学习模型。该数据集也可以为蓬勃发展的数据驱动的地学研究提供关键核心资料,催生地学研究中新的人工智能算法,并为各类算法评估提供高可信度的标注参考,助力大数据和人工智能时代的地学研究。

数据产生或加工方法

为方便数据分享和使用,我们按年份构建了HDF5文件存储地震波形以及标注数据。每年的HDF5文件大小约为120GB,含有全部波形和标注信息。为服务多种科研用途,同时提供了独立的JSON标注信息文件。为了方便针对近震、远震、极远震的研究,分别提供不同时长的数据。相关标注的波形起始为初至震相前100秒,结束时间依据震中距、震级等综合因素决定。波形长度最小时长为200s,最大时长为3000s,数据采样率均为50Hz。数据集以地震事件为基本条目组织,每个地震条目下包含对应台站的波形以及标注,全部地震事件和台站依据数据共享政策编号。为方便用户使用,提供了数据集的读取工具程序,并提供了基于此数据集的开源模型,可进行2000公里之内的Pg/Sg/Pn/Sn震相检测、地震初动判断等。相应工具可为开发多样化的深度学习模型以及直接应用模型开展研究工作提供参考。

数据质量说明

(1)CSNCD数据集的全部标注均由中国测震站网的编目人员人工标注,是严格按照编目技术规范执行的,坚持宁缺毋滥的原则,只标注清晰明确的震相和初动信息。基于人工标注的震相绘制的走时曲线符合各类震相的走时特征,证明了标注具有很高的可信度。(2)测震学科技术管理组观测产品部,通过全国地震编目培训保证编目人员的业务水平;通过年度编目资料评比对地震编目结果进行质量控制。同时,定期开展全国编目大检查专项工作,对历史地震编目结果进行再审查;以上严格的业务管理措施,有力的保障了该数据集较高的质量。(3)数据从初至震相前100s开始截取,有效的纳入了噪声信息,数据在最后一个震相后100s截止,因此数据波形完整。

数据生产者

安艳茹,张莹莹,苗春兰,任克新,陈经纶,张立文,王兴梅,韩雪君,马延路,代光辉,黄志斌,刘杰(中国地震台网中心),苏金蓉,黄春梅,唐淋,庞瑶,傅莺,董立杰(四川省地震局),史勇军,冉慧敏,赵娜,李晓东(新疆维吾尔自治区地震局),苏有锦,杨晶琼,秦敏,缪素秋 (云南省地震局),王力伟,康英,吴国瑞(广东省地震局),李冬梅,董春丽(山西省地震局),高景春,李小军,蔡玲玲(河北省地震局),杨晓鹏,蒲举,陈建军(甘肃省地震局),白占孝,马建新,马丽(青海省地震局),李军,陈惠芳,段刚(福建省地震局),李恩来,李子昊,王九洋(辽宁省地震局),高锦瑞,索朗南杰,(西藏自治区地震局),曲均浩,苗庆杰,董腾超,曲保安(山东省地震局),张晖,王鑫,翟浩,贾昕晔(内蒙古自治区地震局),李俊,于俊谊,陈依伲(浙江省地震局),孙学军,龙政强(广西壮族自治区地震局),韩小飞,赵韬,关昕(陕西省地震局),林向东,司政亚(北京市地震局),王同军,姜维松(重庆市地震局),刘泽民,夏仕安,金艳(安徽省地震局),曾宪伟,袁媛(宁夏回族自治区地震局),贾漯昭,郑培玲(河南省地震局),郑江蓉,张金川,陈飞,殷翔(江苏省地震局),李德前,申学林(湖北省地震局),卞真付,郭巍(天津市地震局),张永刚,李俊秋(黑龙江省地震局),陈俊杰,张洪艳(吉林省地震局),孔军,任华育(贵州省地震局),肖健,许杰(江西省地震局),李冬雅,彭利媚(海南省地震局),刘洋君,常玉龙(湖南省地震局),袁媛,毕波(上海市地震局)

数据来源

本数据集使用中国地震台网中心产出2009-2022年的的统一编目正式报(地震目录和观测报告)和波形数据。

数据集读取程序、开源模型由中国地震局地球物理研究所地球物理先导技术研究室提供,下载地址https://gitee.com/cangyeone/seismological-ai-tools

数据引用方式

数据集引用:

安艳茹,张莹莹,苗春兰等,2023.中国测震站网完备数据集(CSNCD)[EB/OL]. https://data.earthquake.cn,2023.DOI:10.12080/nedc.11.ds.2023.0001 or CSTR:12166.11.ds.2023.0001.

An, Y.R., Zhang, Y.Y., Miao, C.L., et al., 2023. CSNCD: A Comprehensive Dataset of Chinese Seismic Network [EB/OL].  https://data.earthquake.cn,2023.DOI:10.12080/nedc.11.ds.2023.0001 or CSTR:12166.11.ds.2023.0001.

论文引用:

An, Y.R., 2023. Introduction to a recently released dataset entitled CSNCD: A Comprehensive Dataset of Chinese Seismic Network[J]. Earthquake Research Advances, Doi: https://doi.org/10.1016/j.eqrea.2023.100255

Dai, G., & An, Y., 2020. China Earthquake Administration: Chinese Seismic Network. Summary of the Bulletin of the International Seismological Centre. 54(II), 28 - 40. https://doi.org/10.31905/XWIVRBRI

成果反馈

为更好地了解数据的应用情况,请及时反馈成果信息