The construction of geological data ontology and its application to data retrieval
-
摘要:
针对传统以关键词、主题词等字符串匹配为核心的地质数据检索方法存在的查不全、查不准的问题,给出了基于地质数据本体的语义级检索解决方案。通过对地质数据的概念、属性、关系、规则及相应实例的详细表达,构建了地质数据本体(矿产资源预测部分),搭建数据检索系统并开展了应用实践。实验表明,引入地质数据本体后,检索结果在数据的查全率和查准率方面显著提高,并能智能推送相关联的数据信息。开发的地质大数据专题检索系统,实现了对局域网中多源异构地质数据的获取、半自动化标注和语义关联检索,满足地质大数据应用服务的需求,对于大数据时代背景下地质数据的精确发现、深层挖掘及共享有重要意义。
Abstract:In view of the problem that the data retrieval by traditional searching methods based on keywords and topic words cannot satisfy the real needs that emerge in the geological data research, this study provides a solution for semantic level retrieval. A geological data ontology model related to mineral resource predication is built through a detailed expression of the concepts, characteristics, relationship and instances. The geological data linked retrieval system is established. By associating the geological data ontology, the experiment in this research proves that the proposed ontology shows a significant improvement in data discovery. The linked retrieval system could obtain the geological data in local area network and research relatively in semantic level to meet the requirement of big data application service. The application of geological data ontology in this paper will have an important significance for the accurate data discovery, data tapping and data sharing in the era of geological big data.
-
Keywords:
- geological data /
- ontology /
- retrieval system
-
致谢: 感谢成文过程中中国地质科学院矿产资源研究所肖克炎研究员的帮助。
-
表 1 基于关键词和地质数据本体检索结果
Table 1 The table of retrieval results based on keywords and geological data ontology
序号 检索词汇 数据源中关联数据 关键词检索 地质数据本体检索 检索结果总数 检索结果相关数 查全率/% 查准率/% 检索结果总数 检索结果相关数 查全率/% 查准率/% 1 铜陵铜矿 19 16 11 57.9 68.7 26 19 100 73 2 内蒙古稀土 7 5 2 28.6 40 10 7 100 70 3 城门山矿床 28 14 12 42.9 85.7 34 28 100 82.4 4 三道沟式 5 6 3 60 50 8 5 100 62.5 5 矽卡岩型铅矿 16 14 10 62.5 71.4 20 15 93.6 75 -
陈建平, 李婧, 崔宁, 等.大数据背景下地质云的构建与应用[J].地质通报, 2015, 34(7):1260-1265. http://dzhtb.cgs.cn/ch/reader/view_abstract.aspx?file_no=20150702&flag=1 赵鹏大.数学地质与矿产资源评价[J].地质学刊, 2012, 3:225-228. doi: 10.3969/j.issn.1674-3636.2012.03.225 李婧, 陈建平, 王翔.地质大数据存储技术[J].地质通报, 2015, 34(8):1589-1594. http://dzhtb.cgs.cn/ch/reader/view_abstract.aspx?file_no=20150818&flag=1 Manegold S, Kersten M. Big Data[J]. ERCIM News, 2012, 89:33-36.
赵国栋, 易欢欢, 糜万军, 等.大数据时代的历史机遇[M].北京:清华大学出版社, 2013. Gruber T R. Toward principles for the design of ontologies used for knowledge sharing[J]. International Journal of Human and Computer Studies, 1995, 43(5):907-928. https://www.sciencedirect.com/science/article/pii/S1071581985710816
Navigli R, Velardi P. Learning domain ontologies from document warehouses and dedicated web sites[J]. Association for Computational Linguistics, 2004, (2):151-179. https://dl.acm.org/citation.cfm?id=1105712
Liu B S, Gao J. General ontology learning framework[J]. Journal of Southeast University, 2006, 22(3):381-384. https://www.researchgate.net/profile/Hele-mai_Haav/publication/221014133_An_Ontology_Learning_and_Reasoning_Framework/links/54ae9c720cf21670b35861c6.pdf
周树理, 严建文, 包红林, 等.石油勘探开发领域本体构建及应用[J].计算机系统应用, 2015, 24(5):172-176. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=jsjxtyy201505030 张莹, 陈衡军, 张智.地理本体研究综述——构建方法与技术[J].测绘标准化, 2015, 31(1):21-24. http://www.cnki.com.cn/Article/CJFDTotal-CHBC201501009.htm 李媛媛, 陈长胜.基于井位部署业务的勘探开发领域业务过程本体构建[J].东北石油大学学报, 2016, 40(2):64-70. http://industry.wanfangdata.com.cn/yj/Magazine?magazineId=dqsyxyxb&yearIssue=2016_2 王东旭, 诸云强, 潘鹏, 等.地理数据空间本体构建及其在数据检索中的应用[J].地球信息科学学报, 2016, 18(4):443-452. doi: 10.3724/SP.J.1047.2016.00443 杨月华, 杜军平, 平源.基于本体的智能信息检索系统[J].软件学报, 2015, 26(7):1675-1687. http://www.wanfangdata.com.cn/details/detail.do?_type=degree&id=Y939273 杜小勇, 李曼, 王珊.本体学习研究综述[J].软件学报, 2006, 17(9):1837-1847. http://www.cnki.com.cn/Article/CJFDTotal-RJXB200609004.htm 陈建军, 周成虎, 王敬贵.地理本体的研究进展与分析[J].地学前缘, 2006, 13(3):81-90. http://mall.cnki.net/magazine/Article/DXQY200603010.htm 王洪伟, 吴家春, 蒋馥.基于描述逻辑的本体模型研究[J].系统工程, 2003, 21(3):101-106. http://www.cnki.com.cn/Article/CJFDTOTAL-GCXT200303020.htm 贾黎莉. Ontology构建中概念间关系的研究[D]. 中国农业科学院硕士学位论文, 2007. http://cdmd.cnki.com.cn/article/cdmd-82101-2007156188.htm 孙凯, 诸云强, 潘鹏, 等.形态本体及其在地理空间数据发现中的应用研究[J].地球信息科学学报, 2016, 18(8):1011-1021. doi: 10.3724/SP.J.1047.2016.01011 廖述梅.基于本体的语义标注原型评述[J].计算机工程与科学, 2006, 28(9):123-125. http://mall.cnki.net/magazine/Article/JSJK200609040.htm 颜端武, 丁晟春, 李岳蒙, 等.基于语义Web和Jena插件的语义检索系统实验研究[J].情报理论与实践, 2006, 29(3):349-352. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=qbllysj200603027 田宏, 马朋云.基于Jena的城市交通领域本体推理和查询方法[J].计算机应用与软件, 2011, 28(8):57-59. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=jsjyyyrj201108017 向杰, 陈建平, 胡桥, 等.基于矿床成矿系列的三维成矿预测——以安徽铜陵矿集区为例[J].现代地质, 2016, 30(1):230-237. https://www.researchgate.net/profile/Jie_Xiang9/publication/309207921_jiyusanweidezhi-deqiuwulimoxingdesanweichengkuangyuce/links/580591b408ae98cb6f2a790d.pdf?origin=publication_list