一种基于多特征融合的锂矿命名实体识别方法及系统

授权发明 CN202410161560.9

张楠楠

中国科学院新疆生态与地理研究所

2024-02-05  [申请日期]     |    2024-04-30  [公开日期]     |    null  [授权日期]

本发明属于地质文本识别技术领域,公开了一种基于多特征融合的锂矿命名实体识别方法及系统。该方法包括:获取锂矿相关的中文文献和地质报告,对所获取文档数据进行预处理,得到锂矿文本数据集;定义22种锂矿找矿实体类别;对所述锂矿文本数据集进行标注,构建锂矿命名实体数据集;构建多特征融合的锂矿命名实体识别模型,获取待识别文本数据。本发明获取锂矿文本数据,定义22种锂矿找矿实体类别,涵盖地质学、矿床学、地球化学、地球物理学和遥感学等多个地质找矿领域,构建锂矿命名实体数据集并在数据集上进行训练测试,本发明可用于从地质文本数据中快速提取找矿信息、挖掘找矿知识,为后续智能成矿预测提供新思路和新技术。