滑坡地质灾害语料库构建与命名实体识别
DOI:
作者:
作者单位:

1.南京信息工程大学;2.北京市地质灾害防治研究所;3.南京信息工程大学遥感与测绘工程学院;4.南京信息工程大学地理科学学院;5.安徽理工大学;6.南京师范大学

作者简介:

通讯作者:

中图分类号:

基金项目:

国家自然科学(42301478);江苏高校哲学社会科学研究一般项目(2023SJYB0179)


Corpus construction and named entity recognition for landslide geological hazards
Author:
Affiliation:

1.School of Remote Sensing and Geomatics Engineering,Nanjing University of Information Science and Technology;2.Beijing Harzard of Geological Disaster Prevention;3.School of Geographical Sciences,Nanjing University of Information Science and Technology,Nanjing,China;4.Anhui University Of Science and Technology;5.School of Geography,Nanjing Normal University,Nanjing

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    从海量描述滑坡地质灾害文本中抽取有价值的滑坡地质灾害实体是构建滑坡地质灾害知识图谱的基础。该文基于滑坡地质灾害勘查报告文献等相关非结构化文本数据,依据滑坡灾害机理分析滑坡地质灾害文本语言描述特点,制定了滑坡地质灾害语义信息的标注体系与标注规范,构建了面向滑坡地质灾害领域的语料库。同时,基于该语料库的实体识别实验表明,命名实体识别模型的准确率、回召率和精确率均达到90%以上,验证了该语料库的适用性,为后续滑坡地质知识图谱的研究工作提供有力的数据支撑。

    Abstract:

    Extracting valuable landslide geohazard entities from massive texts describing landslide geological hazards is the basis for constructing a landslide geohazard knowledge graph. Based on relevant unstructured text data such as landslide geological hazard exploration report documents, this paper analyzes the text language description characteristics of landslide geological hazards based on the mechanism of landslide geological hazards, formulates an annotation system and annotation specifications for semantic information of landslide geological hazards, and constructs a corpus for the field of landslide geological hazards. Meanwhile, the entity recognition experiments based on the corpus show that the accuracy, recall and precision of the named entity recognition model reach more than 90%, which verifies the applicability of the corpus and provides strong data support for the subsequent research work of landslide geology knowledge mapping.

    参考文献
    相似文献
    引证文献
引用本文

李秋荣,刘晓晓,王波,代文,崔雅婷,尚丹丹,刘元民.滑坡地质灾害语料库构建与命名实体识别[J].南京信息工程大学学报,,():

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2024-04-29
  • 最后修改日期:2024-05-21
  • 录用日期:2024-05-27
  • 在线发布日期:
  • 出版日期:

地址:江苏省南京市宁六路219号    邮编:210044

联系电话:025-58731025    E-mail:nxdxb@nuist.edu.cn

南京信息工程大学学报 ® 2024 版权所有  技术支持:北京勤云科技发展有限公司