Model recognition of gasoline by NIR technology
Tiangaoyou Liuhuiying
Abstract Little differences between 90 gasoline and 93 gasoline are shown in the near infrared spectra, which show that NIR can be used to recognize them. In this paper, the recognition methods have been investigated. Results show that it is difficult to classify 90 gasolines and 93 gasolines; they cannot be well recognized by traditional mahalanobis distance methods. WPT-BAYES (combination of wavelet packet transform and Bayes) method can increase its recognition accuracy to 98%, over 95% and meet analysis need.
Keywords: gasoline; recognition; NIR, BAYES, WPT
为了提高野外条件下检测油料质量的快速保障能力,确保车辆使用合格油料。北京油料研究所研制了一种“便携式油料质量快速分析仪”[1]。该仪器属于近红外光谱仪 ,仪器采用全恒温方式,短焦距、交叉光路,双光束,CCD 检测器,结构紧凑、密闭,防潮湿,抗震动。该仪器适用于测定车用无铅汽油、柴油、喷气燃料的辛烷值、十六烷值、馏程、冰点、凝点、密度、烯烃含量、芳烃含量、饱和烃含量等主要性质。具有分析速度快、准确性好、操作简单等优点,得到用户的认可。
随着环保对汽油质量要求的提高,90号汽油用量逐渐减少,93号汽油储存量逐渐增加。为了提高号分析精度,需要单独建立90号和93号汽油定量模型。同时,也需要系统能够自动识别汽油、选择合适的定量模型进行分析。本文详细研究了90号和93号汽油的模式识别。结果表明,选用传统的主成分-马氏距离阈值法无法准确识别90号汽油和93号汽油,需要采用新的识别方法,比如小波包-贝叶斯识别方法,其识别率高达95%以上,能够满足要求。
1. 试验部分
汽油 从全国各个炼油厂收集了65个90号汽油和93号汽油油样。
仪器 便携式油料质量分析仪,北京油料研究所研制。2048象元线形CCD阵列检测器,分辨率优于1.5nm,光谱采集范围700nm-1100nm,数据间隔0.2nm。
光谱测量 将汽油样品倒入
2. 试验结果与讨论
2.1 模式识别可行性分析
目前,我国的90号汽油主要是由催化裂化汽油单独调和而成;而93号汽油的主要调和组分为催化裂化汽油,同时还掺有重整汽油、烷基化汽油和MTBE。不同馏分油其化学组成不同,导致了最终产品的烯烃、芳烃以及饱和烃等主要组成含量不同。图1为90号汽油样品集和93样品集烯烃和芳烃含量分布图。总体上,二者分布在不同的区域,但也有部分样品重叠分布。90号汽油分布在烯烃含量高,芳烃含量少区域,而93号汽油分布在烯烃含量低,芳烃含量高区域。烃族组成决定了汽油近红外光谱的形貌。图

图1 90号和93号汽油烃族组成分布

2.2 主成分-马氏距离阈值法(PCA-MD)
早在1994年,Downey[2]详细讨论了近红外光谱定性分析所遇到的问题,并提出了解决办法,随后ASTM制定近红外光谱的定性标准方法[3],明确指出PCA-MD法是近红外光谱模式识别的常用方法。该方法基本思想是i类的校正集光谱经过主成分(PCA)分析,选取分类能力强的主成分得分作为识别特征,计算i类各样品到i类中心的马氏距离,并确定i类样品的马氏距离范围MDthreshold。对于未知样品,首先计算该样品到i类中心的马氏距离MDunkown,如果MDunkown小于MDthreshold,则该样品属于i类,反之不属于i类。通常,MDthreshold=MDaverage+k×MDSTD。其中MDaverage 为i类校正集样品的马氏距离平均值;MDSTD 为i类样品的马氏距离平均偏差;k为阈值参数。通过调节k,确定最佳的阈值。图
|
图 |
图3b 90号汽油和93号汽油的马氏距离分布图,校正集为93号汽油 |
表1 PCA-MD法对90号和93号汽油识别结果
|
校正集 |
校正集为90号汽油 |
校正集为93号汽油 |
||||||
|
待识别样品 |
90号汽油 |
93号汽油 |
90号汽油 |
93号汽油 |
||||
|
MDAVERAGE |
2.7 |
3.86 |
5.87 |
2.61 |
||||
|
MDMAX |
5 |
6.5 |
9.85 |
6.23 |
||||
|
MDMIN |
1.41 |
1.7 |
2.2 |
1.24 |
||||
|
MDSTD |
0.756 |
0.759 |
1.61 |
1.03 |
||||
|
k |
错识别数 |
正确识别率,% |
错识别数 |
正确识别率,% |
错识别数 |
正确识别率,% |
错识别数 |
正确识别率,% |
|
0.5 |
15 |
76.9 |
6 |
92.2 |
2 |
96.9 |
18 |
76.7 |
|
1.0 |
10 |
84.6 |
22 |
71.4 |
5 |
92.3 |
11 |
85.7 |
|
1.5 |
7 |
89.2 |
41 |
46.7 |
11 |
7 |
83.1 |
90.9 |
识别特征为分类能力最强的前7个主因子得分
2.4 WPT-BAYES法
田高友[4]详细讨论了柴油的近红外光谱模式识别技术,提出了WPT-BAYES方法,并成功用于四种柴油(0≠轻柴、-10≠轻柴、-35≠号军柴和-10≠军柴)识别。WPT-BAYES法指先对近红外光谱原始数据进行小波包分解,得到小波包系数;然后利用Bayes统计方法的F参数来评价各小波系数的识别能力;选取m+1个识别能力最强(F值大)的小波系数作为识别特征,采用BAYES方法进行识别。BAYES方法基本思想为寻找一个最佳的分类界面,使每一类样品错误识别的概率最低。通常该分类界面为椭圆、椭球,识别性能优越。图

表3 WPT-BAYES识别参数和识别结果
|
参数 |
母小波:Db2;分解次数:6;m:28 |
|||||
|
识别 结果 |
90号汽油 |
93号汽油 |
||||
|
样品数 |
错误识别数 |
正确识 别率,% |
样品数 |
错误识 别数 |
正确识 别率,% |
|
|
65 |
0 |
100 |
77 |
1 |
98.7 |
|
结论
90号汽油和93号汽油组成的细微差异可以在近红外光谱体现,NIR技术对其进行识别是可行的,但比较困难,无法通过传统的PCA-MD法进行识别。采用WPT-BAYES方法,可以大幅度提高其识别性能,正确识别率高达98%,大于95%,能够满足要求。
参考文献
1.刘慧颖,鲁长波,田高友等一种野外近红外油料质量分析仪的研制.现代仪器.2005,6,48-56
2.
3 ASTM E1790-00: standard Practice for Near infrared qualitative analysis
4.田高友.小波变换用于柴油近红外光谱分析.石油化工科学研究院博士学位论文.
0
顶一下0
踩一下