地质通报  2019, Vol. 38 Issue (12): 2053-2058  
0

引用本文 [复制中英文]

白林, 魏昕, 刘禹, 吴崇阳, 陈立辉. 基于VGG模型的岩石薄片图像识别[J]. 地质通报, 2019, 38(12): 2053-2058.
[复制中文]
Bai L, Wei X, Liu Y, Wu C Y, Chen L H. Rock thin section image recognition and classification based on VGG model[J]. Geological Bulletin of China, 2019, 38(12): 2053-2058.
[复制英文]

基金项目

国家重点研发计划《基于“地质云”平台的深部找矿知识挖掘》(编号:2016YFC0600510)、四川省应用基础研究项目《基于人工智能方法的岩石和矿物自动识别技术研究》(编号:2018JY0112)、自然资源部地质信息技术重点实验室开放课题《基于深度学习的野外岩石识别技术研究及应用》(编号:2018433)

作者简介

白林(1980-), 男, 博士, 讲师, 从事地质信息化研究工作。E-mail:bailin@mail.cdut.edu.cn

文章历史

收稿日期: 2019-04-17
修订日期: 2019-07-16
基于VGG模型的岩石薄片图像识别
白林1,2,3, 魏昕4, 刘禹2, 吴崇阳2, 陈立辉4    
1. 成都理工大学数学地质四川省重点实验室, 四川 成都 610059;
2. 成都理工大学管理科学学院, 四川 成都 610059;
3. 自然资源部地质信息技术重点实验室, 北京 100037;
4. 成都理工大学地球科学学院, 四川 成都 610059
摘要: 岩石薄片图像的复杂性和多解性,导致岩石薄片分类难度较大。尝试将深度学习方法应用于岩石薄片图像分类。实验选取了安山岩、白云岩、花岗岩等6种常见岩石种类的薄片图像,每类1000张图像作为实验数据,建立了岩石薄片分类的VGG模型,经过9万次训练后,测试集识别准确率达到了82%。对实验结果进行了分析,发现相似组成成分的岩石图像容易混淆,如白云岩与鲕粒灰岩均属于碳酸盐岩,容易相互误判。在安山岩特征图中提取出了斜长石斑晶和微晶及隐晶质或玻璃质基质,在鲕粒灰岩特征图中提取了鲕粒及填隙物中的亮晶方解石,也验证了方法的可靠性。
关键词: 岩石薄片图像    深度学习    VGG    特征提取    
Rock thin section image recognition and classification based on VGG model
BAI Lin1,2,3, WEI Xin4, LIU Yu2, WU Chongyang2, CHEN Lihui4    
1. Geomathematics Key Laboratory of Sichuan Province, Chengdu University of Technology, Chengdu 610059, Sichuan, China;
2. College of Management Science, Chengdu University of Technology, Chengdu 610059, Sichuan, China;
3. Key Laboratory of Geological Information Technology, Ministry of Natural Resources, Beijing 100037, China;
4. College of Earth Sciences, Chengdu University of Technology, Chengdu 610059, Sichuan, China
Abstract: The complexity and multiple solutions of rock thin section images lead to the difficulty in classification of rock thin sections. This paper attempts to apply the deep learning method to the classification of rock thin images. Thin section images of 6 common rock types, such as andesite, dolomite and granite, were selected in the experiment, and 1000 images of each type were used as experimental data. The VGG model was established, and the identification accuracy of the verification set reached 82% after 90, 000 iterations. Based on the analysis of the experimental data, the authors found that the rock images with similar compositions are easy to be confused; for example, dolomite and oolitic limestone are both carbonate rocks and it is easy to misjudge each other. Plagioclase porphyry, microcrystalline and cryptocrystalline or vitreous matrix were extracted from the andesite characteristic diagram, and oolitic and interstitial materials were extracted from the oolitic limestone characteristic diagram. The result obtained by the authors proves that the VGG model is effective in the classification of rock thin section.
Key words: rock thin section images    deep learning    VGG    feature extraction    

地质工作中,野外肉眼鉴定岩石类型的结果往往不够准确,需要将岩石样品采集回来磨制成薄片进一步在显微镜下鉴定。镜下需要观察岩石薄片的矿物成分、组构、相对含量等特征,确定岩石的类别。岩石镜下鉴定对鉴定人的地质经验要求高,耗时长,且容易受个人主观因素的影响。在当前大数据的时代背景下,用数据科学的研究方法对地质学中的大数据进行智能处理,从中分析和挖掘有价值的核心信息和关键数据,已经成为一种公认的研究方法[1-4]

国内外不少学者尝试采用机器学习中的分类方法实现岩石薄片的识别。2008年,刘保延等[5]利用LS-SVM分类机对花岗岩的岩石薄片图像等进行分割处理并对其分类,获得了较好的处理准确率。2010年,Singh等[6]以玄武岩岩石薄片图像作为输入,提取27个数值参数,输入多层感知器神经网络,通过网络训练后输出岩石类别。2012年,Ghiasi-Freez等[7]利用图像分析技术提取每幅图像6个几何形状参数,建立了线性判别分析和二次判别分析模型,实现了薄片图像的识别。2013年,Mlynarczuk等[8]针对9种不同的岩石种类,每种岩石收集了300张图像,通过最近邻算法、k近邻算法等实现分类。程国建等[9]尝试将K-means聚类分割算法与概率神经网络结合,实现对岩石薄片的分类。Marmo等[10]将灰度数字图像作为输入,基于多感知器神经网络实现了对不同环境下的碳酸盐岩的薄片图像识别,实验效果显著。郭超等[11]对同一地区4种不同类型的岩石薄片图像,统计RGB彩色空间的特征,基于传统神经网络进行分类识别,达到较高的识别准确率。刘烨等[12]从铸体薄片图像的原始颜色空间与其形态学梯度中提取特征参数,运用支持向量机方法结对铸体薄片图像进行了分类识别,获得较高的识别正确率。Li等[13]提出利用迁移学习处理砂岩岩石图像分类的Festra方法,通过对图像颜色等特征提取实现了图像分类。

综上所述,前人虽然采用了诸多的机器学习方法用于岩石薄片的分类,但多是先计算岩石薄片的特征再进行分类。近年来,随着人工智能技术的兴起,深度学习等人工智能方法广泛地应用于图像识别[14]。地质学领域中,深度学习等方法已经在岩石手标本等图像分类中得到应用,并体现出一定的效果[15-16]。因此,借助大数据的思维模式,广泛收集岩石薄片图像数据,采用人工智能的方法用于岩石薄片图像的分类识别,从中归纳总结薄片识别的特征,将是有意义的尝试。

1 薄片图像分类特征

岩石薄片镜下鉴定需要结合岩石的矿物组合、结构构造等特征。岩石的多样性(物源多样性、成岩作用多样性、形成环境多样性)导致了岩石薄片研究的复杂性及多解性,因此岩石薄片识别难度很高,即使是人工鉴定岩石薄片,也要求鉴定人员具备丰富的鉴定经验。

用于岩石薄片鉴定的偏光显微镜光性包括单偏光、正交偏光和锥光3种。不同的透明矿物在这3种光性下表现为性质不同的光性特征,能帮助确定岩石中矿物的种类。单偏光下可以对矿物的形态、颜色、解理、突起等级等特征进行鉴定;正交偏光下可以对矿物的干涉色、消光类型、消光角、双晶类型等特征进行鉴定;锥光下可以对矿物的轴性和光性符号进行鉴定。

为了统一标准,本次实验选取的研究对象是正交偏光下10倍的岩石薄片图像。具体的岩石种类为安山岩、白云岩、鲕粒灰岩、花岗岩、岩屑砂岩和石英砂岩。本文以安山岩与鲕粒灰岩在10倍正交偏光下的岩石薄片图像为例,说明薄片图像的特征(表 1)。

表 1 部分岩石薄片图像特征 Table 1 Some images features of rock thin sections
2 岩石薄片分类深度学习模型

目前,在图像识别领域广泛运用的深度学习模型为卷积神经网络,卷积神经网络利用图像的空间相关性提取图像的轮廓信息,提高了网络的学习能力。卷积神经网络经典模型有LeNet、VGG[17-18]等。考虑到岩石薄片图像较大,本次薄片分类实验采用稳定且高性能的VGG模型。

岩石薄片分类的VGG模型结构如图 1所示。输入岩石薄片图像大小为224×224像素,岩石图像对应R、G、B三个颜色通道,因此把一个薄片图像数字化为一个224×224×3的矩阵。VGG模型共有5组卷积和池化的迭代过程,5次卷积组的参数不尽相同。在进行完卷积和池化的迭代操作过后,原224×224×3的数字图像矩阵已经缩小至7×7×512的数字矩阵。将缩小后的矩阵中的数据依次取出排成一个向量,然后进行3次全连接操作,第一、第二个全连接层的隐含节点数为4096,第三个全连接层的隐含节点数为1000,最后利用softmax函数输出分类概率,确定对应的岩石薄片类别。

图 1 基于VGG的薄片识别模型 Fig.1 Rock thin section image recognition based on VGG model
3 实验过程及结果

本次实验使用的薄片图像均来源于中国实物地质资料网(全国重要实物地质资料图像服务系统),数据来源可靠。经过地质专业人员进行辨认筛选过后制成所需的数据集,选定安山岩、白云岩、鲕粒灰岩、花岗岩、岩屑砂岩、石英砂岩6类常见的薄片类型。每类的数据集中的图像约为1000张,在实验中随机划分其中的80%作为训练集,10%作为验证集,10%作为测试集。然后通过统计训练集的通道均值,对训练集进行中心化处理。

对于清洗后的薄片图像进行旋转、亮度变换等操作后,输入到构建的薄片图像深度学习模型中进行训练,设置初始的学习率为0.001,正则化系数为0.00001,模型通过随机参数初始化开始训练。图 2为薄片分类训练过程准确率图。经过90000次迭代后,训练集在模型上的准确率为100%,验证集在模型上的准确率为82%。

图 2 薄片识别训练过程准确率变化图 Fig.2 Variation chart of accuracy of the training process for rock thin section image recognition (横坐标表示训练次数,纵坐标表示模型的准确率,上方的蓝色线表示训练集的准确率,下面的黄色线表示验证集的准确率)

表 2给出了测试集中6种薄片图像的识别准确率。表中的每一行表示对应的是薄片图像识别为其他类别薄片的概率,对角线元素均表示将薄片图像识别为自己的概率,其余位置的元素表示识别成其他类别的误判率。结果数据显示,白云岩与鲕粒灰岩容易互相错认,白云岩和鲕粒灰岩互相错认的概率约为10%。

表 2 薄片图像分类混淆矩阵 Table 2 Confusion matrix of rock thin section images classification

白云岩与鲕粒灰岩都属于碳酸盐岩,主要组成矿物分别为白云石和方解石。白云石和方解石均为碳酸盐矿物,很多方面的性质相同或相似。例如图 3中,a图为误判为白云岩薄片的鲕粒灰岩薄片图像,b图为白云岩薄片图像。可以看出,鲕粒灰岩与白云岩的图像十分相似,均具有高级白干涉色、两组菱形相交解理等性质,而鲕粒灰岩图像中的鲕粒不完整,特征不明显,因此部分鲕粒灰岩图像容易误判为白云岩。针对这种误判现象,实验工作可以滴加茜素红试剂,如果薄片用茜素红试剂染色变红表示为灰岩,薄片用茜素红试剂染色无明显变化则为非灰岩。花岗岩与安山岩识别率也较低,原因是花岗岩与安山岩相对实验中的其他岩类具有明显的非均质性,加之实验采取的研究对象是正交偏光下10倍的岩石薄片图像,使这2种岩类的非均质性更加突出,因此分割后的图像之间能提取到的一致特征较少,从而导致识别率低。

图 3 误判的鲕粒灰岩和白云岩薄片图像对比 Fig.3 Comparison of misclassification oolitic limestone image with dolomite image
4 薄片图像的特征提取

在卷积神经网络中,原始图像经过卷积和池化产生的特征图,能反映从原始图像中提取的特征。表 3中第一行的3张图片,第1张为安山岩薄片原始图像,第2~3张为对应的特征图,该特征图为卷积神经网络底层激活函数的输出结果。对比薄片的原始图像和特征图,可看出特征图是否从原始图像中提取到有用的特征。以安山岩和鲕粒灰岩为例,表 3中安山岩有2张特征图,特征图 1中亮色部分提取的特征是斜长石,包括宽板状的斜长石斑晶和基质中长条状的斜长石微晶;特征图 2中亮色部分提取的特征是安山岩基质中的隐晶质或玻璃质。鲕粒灰岩也有2张特征图,特征图 1中的亮色部分提取的是圆形或椭圆形鲕粒;特征图 2中的亮色部分提取的是填隙物中的亮晶方解石。从提取出的特征图可以看出,神经网络已经在底层的结构中提取出了颜色和纹理特征。

表 3 岩石薄片特征提取 Table 3 Feature extraction figures of rock thin section images
5 结语

岩石薄片的复杂性及多解性导致岩石薄片图像分类识别难度很高。人工进行岩石薄片鉴定需要观察其矿物成分、组构特征和相对含量,确定岩石的类别,存在工作量大、过程繁琐、主观性强等问题。笔者将深度学习方法应用于岩石薄片图像分类识别,建立了薄片分类的VGG模型,对6类薄片图像进行训练学习,训练集达到100%的识别正确率,测试集达到82%的识别正确率。分析实验结果,发现组成矿物相似的岩石薄片容易相互误判。对深度学习模型提取的特征图进行分析,安山岩特征图提取了斜长石斑晶和微晶,以及基质中的隐晶质或玻璃质,识别的准确率和特征图分析结果说明深度学习对岩石薄片分类是有效的。后续可在薄片种类、图像数量等方面扩展,进一步探索深度学习用于薄片识别的规律。

致谢: 本次工作得到中国地质调查局发展研究中心谭永杰总工程师、朱月琴高级工程师等多位专家和学者的指导和建议,还有许多同学辛苦的整理薄片图像数据,在此表示诚挚的感谢。

参考文献
[1]
赵鹏大. 大数据时代数字找矿与定量评价[J]. 地质通报, 2015, 34(7): 1255-1259. DOI:10.3969/j.issn.1671-2552.2015.07.001
[2]
严光生, 薛群威, 肖克炎, 等. 地质调查大数据研究的主要问题分析[J]. 地质通报, 2015, 34(7): 1273-1279. DOI:10.3969/j.issn.1671-2552.2015.07.004
[3]
陈建平, 李婧, 崔宁, 等. 大数据背景下地质云的构建与应用[J]. 地质通报, 2015, 34(7): 1260-1265. DOI:10.3969/j.issn.1671-2552.2015.07.002
[4]
肖克炎, 孙莉, 李楠, 等. 大数据思维下的矿产资源评价[J]. 地质通报, 2015, 34(7): 1266-1272. DOI:10.3969/j.issn.1671-2552.2015.07.003
[5]
刘延保, 曹树刚, 刘玉成. 基于LS-SVM的岩石细观图像分析方法探讨[J]. 岩石力学与工程学报, 2008, 27(5): 1059-1059. DOI:10.3321/j.issn:1000-6915.2008.05.023
[6]
Singh N, Singh T, Tiwary A, et al. Textural identification of basaltic rock mass using image processing and neural network[J]. Computers & Geosciences, 2010, 14(2): 301-310.
[7]
Ghiasi-Freez J, Soleimanpour I, Kadkhodaie-Ilkhchi A, et al. Semiautomated porosity identification from thin section images using image analysis and intelligent discriminant classifiers[J]. Computers & Geosciences, 2012, 45: 36-45.
[8]
Mlynarczuk M, Górszczyk A, Ślipek B. The application of pattern recognition in the automatic classification of microscopicrock images[J]. Computers & Geosciences, 2013, 60(10): 126-133.
[9]
程国建, 杨静, 黄全舟, 等. 基于概率神经网络的岩石薄片图像分类识别研究[J]. 科学技术与工程, 2013, 13(31): 9231-9235. DOI:10.3969/j.issn.1671-1815.2013.31.014
[10]
Marmo R, Amodio S, Tagllaferri R, et al. Textural identification of carbonate rocks by image processing and neural network:Methodology proposal and examples[J]. Computers & Geosciences, 2014, 31(5): 649-659.
[11]
郭超, 刘烨. 多色彩空间下的岩石图像识别研究[J]. 科学技术与工程, 2014, 14(18): 247-251. DOI:10.3969/j.issn.1671-1815.2014.18.048
[12]
刘烨, 程国建, 马微, 等. 基于铸体薄片图像颜色空间与形态学梯度的岩石分类[J]. 中南大学学报(自然科学版), 2016, 47(7): 2375-2382.
[13]
Li N, Hao H, Gu Q, et al. A transfer learning method for automatic identification of sandstone microscopic images[J]. Computers & Geosciences, 2017, 103: 111-121.
[14]
白林, 姚钰, 李双涛, 等. 基于深度学习特征提取的岩石图像矿物成分分析[J]. 中国矿业, 2018, 27(7): 178-182.
[15]
Hinton G E, Osindero S, Teh Y W. A Fast Learning Algorithm for Deep Belief Nets[J]. Neural Computation, 2006, 18(7): 1527-1554. DOI:10.1162/neco.2006.18.7.1527
[16]
Krizhevsky A, Sutskever I, Hinton G. ImageNet Classification with Deep Convolutional Neural Networks[C]//NIPS. Curran Associates Inc., 2012.
[17]
Lecun Y, Bottou L, Bengio Y, et al. Gradient-based learning applied to document recognition[J]. Proceedings of the IEEE, 1998, 86(11): 2278-2324. DOI:10.1109/5.726791
[18]
Zhu Y, Bai L, Peng W, et al. Depthwise Separable Convolution Feature Learning for Ihomogeneous Rock Image Classification[C]//ICCSIP, 2018, 1005: 165-176.