Construction and prediction of a prospecting model based on recurrent neural network
-
摘要:
在大数据和人工智能背景下,基于已有的传统地质找矿模型建立与应用基础,提出基于循环神经网络的找矿模型构建与预测方法,实现对地质数据的深入分析和理解。针对地质找矿模型构建与预测的需求,结合数据清洗理论,对传统地质找矿模型进行归纳与总结,建立地质找矿知识库,为深度学习算法提供训练数据。通过分类算法研究,综合对比结果的准确率与分类所用时间,最终选用RNN分类算法对找矿概念模型进行分类。在建立研究区找矿模型中,通过关键词与控矿要素完成模型匹配,利用模型计算对模型匹配结果进行数据分析,实现区域地质找矿模型的构建与矿产资源的预测评价和分析。以大水金矿为例,快速准确地实现了找矿模型的构建,有效地对矿产资源预测工作提供了指导,验证了该方法的可行性。
Abstract:Under the background of big data and artificial intelligence and on the basis of the establishment and application basis of existing traditional geological prospecting model, this paper proposes a prospecting model construction and prediction method based on cyclic neural network, with the purpose of achieving in-depth analysis and understanding of geological data. According to the requirements for construction and prediction of geological prospecting model, the authors combined the data cleaning theory to systematically summarize and summarize the traditional geological prospecting model, thus establishing a geological prospecting knowledge base and providing training data for deep learning algorithms. The accuracy of the comparison results and the time used for classification were comprehensively analyzed. Finally, the RNN classification algorithm was selected to classify the conceptual model of prospecting. In the process of establishing the prospecting model of the study area, by using the key words and ore control elements to complete the model matching, the model was used to analyze the model matching results so as to realize the construction of the regional geological prospecting model and the prediction and analysis of the mineral resources. With the Dashui gold deposit as an example, the construction of the prospecting model was realized quickly and accurately, which effectively provides guidance for the prediction of mineral resources and verifies the feasibility of the method.
-
鄂尔多斯盆地位于中国中西部地区,为中国第二大沉积盆地,跨陕、甘、宁、蒙、晋五省区,盆地面积达到25×104km2。鄂尔多斯盆地的中上三叠统—下白垩统发育,发现有多门类的动植物化石[1],盆地沉积了巨厚的白垩系。含恐龙等脊椎动物足迹的地层属于下白垩统志丹群,自下而上包含宜君组、洛河组、华池组、环河组、罗汉洞组、泾川组,以及仅分布于东北部的喇嘛湾组[2]。在鄂尔多斯盆地西北部,恐龙足迹主要产于罗汉洞组和泾川组[3]。在鄂尔多斯盆地南部边缘旬邑县洛河组也发现过恐龙足迹[1]。
2017年9—11月,陕西省地质调查中心承担的“陕北丹霞地貌地质遗迹调查项目”及神木市公格沟丹霞地质公园申报项目,在鄂尔多斯盆地东北缘神木市中鸡一带的下白垩统洛河组(K1l)上部紫红色砂岩中发现恐龙与其他四足类足迹多处,该组合的发现在中国尚属首次。
1. 地质背景
洛河组由“洛河砂岩”演变而来,区域上平行不整合在中侏罗统安定组之上[4]。研究区,即鄂尔多斯东北部一带,洛河组厚度63.79m,以紫红色-暗紫红色厚-块状粉砂质泥岩、泥质粉砂岩与薄层中-粗粒长石石英砂岩、石英砂岩为主,构成典型的丹霞地貌景观。
鄂尔多斯盆地在中侏罗统安定组沉积末期,受晚侏罗世燕山运动末期的隆升影响,盆地抬升掀斜遭受剥蚀[5]。到早白垩世初期,鄂尔多斯盆地伸展,洛河组开始沉积。前人研究与1:5万区域地质调查资料①指出,洛河组的沉积环境属河流、湖泊相[6],而近年来不少学者则认为其属于沙漠相[7-8],在洛河期,鄂尔多斯盆地进入白垩纪第一个沙漠沉积发育的鼎盛期[8]。综合区调等资料,洛河组早期沉积时盆地具准平原性质,河流宽阔,河漫滩较发育,沉积了紫红色、棕红色、砖红色厚层砂岩,并夹有灰白色高岭石质细砂岩,砂岩体中发育以大-巨型槽状交错层、交错层理为特征的中粒长石砂岩夹少量粉砂岩沉积组合,属河流及冲积扇沉积;中期沉积形成紫红色、棕红色、砖红色厚层中粗粒砂岩,砂岩体中发育以大-巨型风成板状交错层、风成斜层理为特征的中粗粒长石砂岩,明显具有沙漠相沙丘、丘间亚相;晚期沉积则形成一套紫红色块状泥岩、粉砂质泥岩夹薄层泥质粉砂岩组合,发育水平层理、低角度斜层理、泥裂、雨痕等,指示了浅水沙漠湖泊相沉积沙丘砂岩发育的低角度斜层理方向,可能反映了以西北风为主,局部有东南暖风作用。
现将研究区含恐龙等脊椎动物足迹地层岩性描述如下。
上覆地层:第四纪全新世风成沙、黄土层
~~~~~~~~~~~~~~~~~不整合接触~~~~~~~~~~~~~~~~~
早白垩世洛河组(K1l) >18.74m
6.紫红色薄层状细粒长石石英砂岩 0.51m
5.紫红色薄层中-粗粒长石石英砂岩,发育板状斜层理,有三趾型恐龙足迹 4.74m
4.紫红色薄层细粒石英砂岩,发育平行层理 5.20m
3.紫红色中厚层中粒长石石英砂岩,具平行层理 5.80m
2.紫红色薄层细粒长石石英砂岩,发育水平层理 1.53m
1.紫红色薄层中粒石英砂岩,有二趾型恐龙足迹与小型四足类足迹,未见底 0.96m
~~~~~~~~~~~~~~~~~不整合接触~~~~~~~~~~~~~~~~~
下伏地层:中侏罗统安定组(J2a)深灰色微-薄层粉砂质泥岩
2. 足迹点与足迹形态
2.1 足迹点概貌
神木市中鸡镇脊椎动物足迹化石分布在宝刀石梨村公格沟水库东岸边,在30km2红色丹霞景观范围内,目前已发现3处恐龙足迹点及2处小型四足类足迹点(图 1)。
1号足迹点目前发现两枚足迹,产于洛河组上部紫红色块状泥岩、粉砂质泥岩与微–薄层泥质粉砂岩中的湖泊相近底部薄层泥质粉砂岩层面上,层面发育泥裂。2~5号足迹点分布在洛河组上部滨岸相紫红色薄层中细粒石英砂岩中岩层面上。其中2号足迹点发现21枚三趾型足迹,层面发育雹痕、雨痕。3、5号足迹点为小型四足类所留。4号足迹点,目前发现16枚二趾型脚印,层面发育浅水流水波痕、雹痕、雨痕、虫迹。
2.2 小型四足类足迹
小型四足类足迹约200个,至少组成5道行迹。其中保存最好的行迹长约1.5m(图版Ⅰ-A),由前足迹与后足迹组成,都呈扁椭圆形。前足迹平均长1.0cm,宽1.3cm;后足迹平均长1.1cm,宽1.6cm,前足迹位于后足迹的前内侧。因保存或后期风化的原因,绝大部分足迹的趾痕不清,保存最好的后足迹能观察到至少4个趾痕。这些小型四足类足迹的形态与尺寸都与巴西足迹(Brasilichnium) [9]非常相似。巴西足迹最初发现于巴西上侏罗统—下白垩统博图卡图组,传统上被归于哺乳形类(Mammaliamorpha)或衍生的兽孔类(Therapsida)。此类足迹为中国首次发现。
2.3 三趾型兽脚类足迹
三趾型兽脚类分布于1号和2号足迹点。1号足迹点仅1个足迹保存较好(图版Ⅰ-B),长14.5cm,宽15.8cm,长宽比为0.9,三趾较纤细,第Ⅱ趾至第Ⅳ趾之间的趾间角约为110°。2号足迹点的21枚三趾型足迹形成一道拐弯的行迹(图版Ⅰ-C)。拐弯的行迹相对罕见。其中保存最好的足迹长12.5cm,宽10.0cm,长宽比为1.3,第Ⅱ趾至第Ⅳ趾之间的趾间角为69°,其趾垫不清,跖趾垫较发育。从整体形态看,2号足迹点的三趾型足迹与实雷龙足迹类(Eubrontidae) [10]较相似。实雷龙足迹类最初发现于北美的下侏罗统,但衍生的足迹形态广泛出现在中国的侏罗系—白垩系[11-12],鄂尔多斯盆地的白垩系也有类似发现[13]。1号足迹点的孤立足迹的形态特征与实雷龙足迹类完全不同,但其较尖锐的爪痕与宽的趾间角表明其属于兽脚类足迹。
2.4 两趾型兽脚类足迹
2号足迹点的一道行迹揭示了有趣的受沉积物影响的保存现象。大多数足迹只留下明显的一个趾痕(图版Ⅰ-D),但在一处沉积物条件适宜区,该造迹者留下了一个保存良好的两趾型足迹(图版Ⅰ-E)。该足迹长14.5cm,宽5.0cm,长宽比为2.9,第Ⅲ趾至第Ⅳ趾之间的趾间角为20°。这是二趾型足迹在陕西省的首次记录,与该区相邻的内蒙古鄂托克旗查布地区也曾有报道[3]。
由于与鸟类系统发育学上的紧密联系,近年来,恐爪龙类(deinonychosaurian)演化支得到学者们的充分研究。恐爪龙类包括驰龙类(dromaeosaurids)和伤齿龙类(troodontids),该类群最具代表性的特征是其第Ⅱ趾上有一个高度发育的大爪,这个大爪可以伸出并高度延展[14]。恐爪龙类运动时,该特化的第Ⅱ趾处于扬起状态,因此留下足迹为两趾,仅由第Ⅲ趾和第Ⅳ趾的印迹组成[11]。因此,两趾型足迹对应恐爪龙类造迹者,是迄今为止特征最鲜明的兽脚类足迹之一。自1994年在中国首次发现以来[15],现在至少发现了十余个足迹点[11],均来自白垩系,分布于四川盆地与攀西地区的多个点,以及山东莒南与岌山、河北赤城、北京延庆、甘肃盐锅峡等。中鸡恐爪龙类足迹的尺寸与甘肃盐锅峡标本类似,该记录增加了该类造迹者的古地理分布范围。
3. 结论
在鄂尔多斯盆地东北缘神木市中鸡白垩系丹霞地貌中发现的恐龙与其他四足类的足迹化石,展示了一个非常独特的组合类型:哺乳形类/兽孔类足迹-实雷龙足迹类-恐爪龙类足迹。这种多样性的兽脚类行迹与小型四足类足迹的组合,在中国属首次发现。虽然其详细分类还有待进一步研究,但这无疑对中国白垩纪沙漠相恐龙动物群的类型与分布,乃至该地区的古气候、古地理和地层对比都具有重要的意义。
致谢: 在找矿知识库构建与模型训练过程中得到课题组人员的大力协助,审稿专家提出了细致、中肯的建议,在此表示衷心的感谢。 -
表 1 大水金矿控矿要素提取
Table 1 Extraction of ore-controlling factors from the Dashui gold deposit
控矿要素类型 特征参数描述 成矿地质背景 秦祁昆造山带, 处在东昆仑—南秦岭褶皱带 甘肃省南部的南秦岭晚古生代—中生代多金属成矿带 金矿赋存于三叠系马热松多组的一套灰岩和白云质灰岩中 成矿期 燕山期、三叠系与成矿密切相关 含矿岩系 白云质灰岩、灰岩、闪长玢岩及花岗闪长岩 构造条件 构造运动控矿、深大断裂构造及次级断裂 深大断裂、断裂破碎带 围岩蚀变 方解石化、硅化及赤铁矿化 表 2 找矿模型构建
Table 2 Construction of the prospecting model
要素类型 控矿要素 特征变量 相关重要性 地层条件 大地构造位置 秦祁昆造山系 文献提取 成矿时代 燕山期、三叠纪 岩体条件 成矿有利岩体 花岗闪长岩、闪长玢岩 13.6 围岩蚀变 矿化蚀变带 岩体缓冲区 方解石脉缓冲区、花岗闪长玢岩缓冲区、闪长玢岩缓冲区 构造条件 断裂缓冲区 断裂缓冲区 文献提取 构造展布特征 断裂等密度、断裂频数、断裂异常方位、断裂方位异常度 地球化学 地球化学 Au、Ag、Sb、Fe、Cu、Au、As、Pb(Mo、Sn)晕异常及金分散流异常 13.8 地球物理 磁法 磁异常、△T高异常 12 重力 重力正异常、重力高值异常 12 激电 激发极化异常、高阻异常 3 重砂异常 自然重砂异常 10 -
肖克炎, 孙莉, 李楠, 等.大数据思维下的矿产资源评价[J].地质通报, 2015, 34(7):1266-1272. doi: 10.3969/j.issn.1671-2552.2015.07.003 赵鹏大, 张寿庭, 陈建平.危机矿山可接替资源预测评价若干问题探讨[J].成都理工大学学报(自然科学版), 2004, 31(2):111-117. doi: 10.3969/j.issn.1671-9727.2004.02.001 郑啸, 李景朝, 王翔, 等.大数据背景下的国家地质信息服务系统建设[J].地质通报, 2015, 34(7):1316-1322. doi: 10.3969/j.issn.1671-2552.2015.07.009 赵鹏大.大数据时代数字找矿与定量评价[J].地质通报, 2015, 34(7):1255-1259. doi: 10.3969/j.issn.1671-2552.2015.07.001 周顺平, 徐枫.大数据环境下地理信息产业发展的几点思考[J].地理信息世界, 2014, 21(1):45-50. doi: 10.3969/j.issn.1672-1586.2014.01.027 朱月霞.基于大数据的地质数据存储与管理研究[C]//江苏省测绘地理信息学会.江苏省测绘地理信息学会2014年学术年会论文集, 2014: 3. http://cpfd.cnki.com.cn/Article/CPFDTOTAL-XDCH201412001036.htm 严光生, 薛群威, 肖克炎, 等.地质调查大数据研究的主要问题分析[J].地质通报, 2015, 34(7):1273-1279. doi: 10.3969/j.issn.1671-2552.2015.07.004 黄宜华.大数据机器学习系统研究进展[J].大数据, 2015, 1(1):35-54. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=dasj201501005 张震, 王文发.人工智能原理在人类学习中的应用[J].吉首大学学报(自然科学版), 2006, (1):39-42. doi: 10.3969/j.issn.1007-2985.2006.01.009 张丽芳.浅谈机器学习的现状及策略[J].现代经济信息, 2009, (6):155, 157. http://d.old.wanfangdata.com.cn/Periodical/xdjjxx200906120 陈建平, 陈勇, 朱鹏飞, 等.数字矿床模型及其应用——以新疆阿勒泰地区可可托海3号伟晶岩脉稀有金属隐伏矿预测为例[J].地质通报, 2011, 30(5):630-641. doi: 10.3969/j.issn.1671-2552.2011.05.002 于萍萍, 陈建平, 柴福山, 等.基于地质大数据理念的模型驱动矿产资源定量预测[J].地质通报, 2015, 34(7):1333-1343. doi: 10.3969/j.issn.1671-2552.2015.07.011 弓小平, 王世称, 杨兴科, 等.地质矿产预测信息化相关问题的探讨[J].地质找矿论丛, 2005, (1):66-70. doi: 10.3969/j.issn.1001-1412.2005.01.013 Anderson T W. An Introduction to Multivariate Statisical Analysis[M]. New York:John Wiley & Sons, 2003.
Wu X, Kumar V, Ross-Quinlan J, et al. TOP 10 algorithms in data mining[J]. Knowl. Inf. Syst., 2007, 14:1-37. http://cn.bing.com/academic/profile?id=0922afbe2f505e7935e508249812b224&encoded=0&v=paper_preview&mkt=zh-cn
翟裕生, 邓军, 李晓波.区域成矿学[M].北京:地质出版社, 1999. 涂光炽.超大型矿床的找寻和理论研究[J].矿产与地质, 1989, (1):1-8. http://www.cnki.com.cn/Article/CJFDTotal-KCYD198901000.htm 朱裕生, 梅燕雄.成矿模式研究的几个问题[J].地球学报, 1995, (2):182-189. http://www.cnki.com.cn/Article/CJFDTotal-DQXB502.006.htm 程裕淇, 陈毓川, 毛景文, 等.初论矿床的成矿系列问题[J].中国地质科学院院报, 1979, (1):1-7. doi: 10.1017-jfm.2011.328/ 李玉斌, 吴静哲, 陈小格.基于关键词聚类的深度学习研究[J].软件导刊, 2019, 18(3):199-203. http://d.old.wanfangdata.com.cn/Periodical/rjdk201903045 吴永亮, 贾志杰, 陈建平, 等.基于大数据智能的找矿模型构建与预测[J].中国矿业, 2017, 26(9):79-84. http://d.old.wanfangdata.com.cn/Periodical/zgky201709016 Li S, Chen J P, Xiang J. Prospecting Information Extraction by Text Mining Based on Convolutional Neural Networks A case study of the Lala Copper Deposit, China[J]. IEEE Access, 2018, 6:52286-52297. doi: 10.1109/ACCESS.2018.2870203
龚千健.基于循环神经网络模型的文本分类[D].华中科技大学硕士学位论文, 2016. http://cdmd.cnki.com.cn/Article/CDMD-10487-1016781801.htm 尹汉钊.基于递归神经网络与集成算法的时间序列预测应用研究[D].西安电子科技大学硕士学位论文, 2010. http://www.wanfangdata.com.cn/details/detail.do?_type=degree&id=Y1866190 林蕾.基于循环神经网络模型的遥感影像时间序列分类及变化检测方法研究[D].中国科学院大学(中国科学院遥感与数字地球研究所)博士学位论文, 2018. http://cdmd.cnki.com.cn/Article/CDMD-80070-1018995618.htm Alom M Z, Hasan M, Yakopcic C, et al. Inception Recurrent Convolutional Neural Network for Object Recognition[J]. arXiv: 1704.07709, 2017: 1-11. https://arxiv.org/abs/1704.07709
刘腾飞, 于双元, 张洪涛, 等.基于循环和卷积神经网络的文本分类研究[J].软件, 2018, 39(1):64-69. doi: 10.3969/j.issn.1003-6970.2018.01.013 Nallapati R, Zhai F, Zhou B. SummaRuNNer:A Recurrent Neural Network based Sequence Model for Extractive Summarization of Documents[J]. AAAI, 2017, 1:1. http://cn.bing.com/academic/profile?id=dc721f44c24e25e87a026fdc5f78a52a&encoded=0&v=paper_preview&mkt=zh-cn
刘婷婷, 朱文东, 刘广一.基于深度学习的文本分类研究进展[J].电力信息与通信技术, 2018, 16(3):1-7. http://d.old.wanfangdata.com.cn/Periodical/dlxxh201803001 Qin Y, Song D J, Chen H F, et al. A Dual-Stage Attention-Based Recurrent Neural Network for Time Series Prediction[J]. arXiv: 1704.02971, 2017: 1-7. http://www.ijcai.org/proceedings/2017/366