CN1261907C - 图形分类方法及其装置 - Google Patents

图形分类方法及其装置 Download PDF

Info

Publication number
CN1261907C
CN1261907C CNB018028918A CN01802891A CN1261907C CN 1261907 C CN1261907 C CN 1261907C CN B018028918 A CNB018028918 A CN B018028918A CN 01802891 A CN01802891 A CN 01802891A CN 1261907 C CN1261907 C CN 1261907C
Authority
CN
China
Prior art keywords
dictionary
mentioned
feature amount
graphic feature
pattern classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB018028918A
Other languages
English (en)
Other versions
CN1393002A (zh
Inventor
吉原隆史
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Olympus Corp
Original Assignee
Olympus Optical Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Olympus Optical Co Ltd filed Critical Olympus Optical Co Ltd
Publication of CN1393002A publication Critical patent/CN1393002A/zh
Application granted granted Critical
Publication of CN1261907C publication Critical patent/CN1261907C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0004Industrial image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30108Industrial image inspection
    • G06T2207/30148Semiconductor; IC; Wafer

Abstract

一种图形分类方法,从图形分类对象中提取图形特征量,把与上述图形特征量相对应的分类范畴信息登记/设定在图形词典中,根据上述图形特征量和上述图形词典中所登记的马哈朗诺比斯词典,进行图形分类,同时,根据上述分类范畴名称和上述图形特征量,进行上述图形词典的优化处理,编制上述马哈朗诺比斯词典。

Description

图形分类方法及其装置
本发明涉及那种例如适用于找出缺陷,对在缺陷种类等的图形(pattern)分类中所用的图形词典进行优化处理的图形分类方法及其装置,以及能用计算机读出的存储媒体。
背景技术
LCD的玻璃基片的检查和半导体晶片的检查,对玻璃基片进行摄像,取得其图像数据,从该图像数据中例如提取缺陷的面积、形状、浓淡值等图形特征量,对该被提取的图形特征量利用以下图形分类方法来进行检查。
对根据已知图形特征量及其分类范畴信息而编辑的图形词典预先进行登记。在此,如果图形特征量是适用于上述玻璃基片检查的,那么就是例如面积、形状、浓淡度等。分类范畴信息例如是图形缺陷种类、灰尘、斑痕、焦点模糊、聚焦偏差等。
若输入图形分类对象的图形特征量(输入图形),则对该图形特征量和上述图形词典进行图形匹配处理。作为分类结果,输出分类范畴、相似度或距离的数值信息。对输入图形进行分类,使其属于这样的分类范畴,即其具有作为分类结果的数值信息中最适当的值(若是相似度,则为1,若是距离,则是接近0的值),并且把作为分类结果的数值信息与某阈值相比较,若为阈值以下(或以上),则加以确定。
作为数值信息使用的相似度和距离,利用单纯相似度和复合相似度作为相似度尺度。利用欧几里德距离和市街地距离、马哈朗诺比斯(マハラノビス)距离等作为距离尺度。
作为相似度尺度的单纯相似度,把预先登记的特征量向量g和新提取的特征量向量g’所形成的角度的余弦(Cosine)定义为评价尺度s。
S=(g,g’)/(‖g‖·‖g’‖)    ……(1)
式中,(,)表示内积。相似度s仅依存于特征量向量方向(即角度),不取决于该向量的大小。而且,相似度尺寸作为向距离尺度s’的变换,也常进行以下距离变换:
s’=1。0-单纯相似度    ………(2)
复合相似度是考虑了多个学习特征量向量的分布状态的相似度值。利用登记特征量向量的固有值λj和固有向量uj,对新提取的特征量向量g的评价尺度s定义如下:
s=∑j=1,rλj(gtuj)2/(λ1‖g|2|)    ……(3)
因此,与单纯类似法相比,能期待提高分类精度。但需要大量学习数据。
作为距离尺度,最一般的距离尺度,即欧几里德距离d根据登记特征量向量g和新提取的特征量向量g’定义如下。
d = ( g - g , ) 2 ‾ · · · ( 4 )
市街地距离,其别名也可称为曼哈顿距离,根据登记特征量向量g和新提取的特征量向量g’定义如下。
d=|g-g’|    ……(5)
若按照市街地距离,则能进行高速的距离计算。
马哈拉诺比斯距离D2与复合相似度一样,是考虑了登记特征量向量数据的分散的距离,是现在最适合于图形分类的距离之一。该马哈拉诺比斯距离D2可由下式表示。
D2=dtV-1d    ……(6)
在上式中,假定分类范畴数据xi(=xio、xi1、xi2、……、xi p、:i是分类范围,p是特征量次元数)的共同方差。协方差矩阵V的逆矩阵为V-1;与分类范畴平均值xi的差矩阵为d(=xi-xi);其转置矩阵为dt
哈马拉诺比斯距离D2是分类范畴数据的各数据方差规范化的距离。如果分类范畴数据间为不相关,那么,该马哈朗诺比斯距离与欧几里德距离等效。并且,如果在上式(6)中把差矩阵d作业分类范畴平均值差,那么,马哈朗诺比斯距离变成分类范畴间的马哈朗诺比斯泛距离。
例如,具有某分类范畴C的分类特征量xc1、xc2,在这些分类特征量xc1、xc2之间有正的相关的情况下,描绘出图1所示的等概率椭园。在图1中某特征量数据A和B,其布置的位置离开分类范畴平均值G在欧几里德距离尺度上距离相等。然而马哈朗诺比斯距离D2在图1所示的等概率椭园的轨迹上相等。特征量数据A和B不在同一等概率椭园轨迹上,特征量数据A的马哈朗诺比斯距离接近分类范畴平均值G,所以,特征量数据A比特征量数据B更接近分类范畴平均值G。
即使在以上各种尺度中,也可把马哈朗诺比斯距离称为现在最适合图形分类的距离尺度。并且,虽然马哈朗诺比斯距离需要确保运算处理量多,登记/学习的量大等,但随着最近CPU的高速化,马哈朗诺比斯距离在许多图形分类装置中的应用日益增多。
作为分类结果的马哈朗诺比斯距离等数值信息,其获得的方法是对预先编辑的图形词典和输入图形进行图形匹配处理。在该图形匹配处理中所使用的图形词典,尤其是马哈朗诺比斯距离计算用图形词典如上述式(6)所示,具有分类范畴数据的共同方差·协方差矩阵V的逆矩阵V-1和分类范畴平均值xi作为构成要素。这些构成要素从预先登记在图形词典中的许多已知图形特征量及其分类范畴信息中求出。
为了编制马哈朗诺比斯距离计算用图形词典(逆矩阵V-1和分类范畴平均值xi),可单纯使用登记图形特征量及其分类范畴信息,或者,根据经验利用试行错误来选择制作那种被认为适合图形分类的一部分图形特征量。
例如,若利用所有的登记图形特征量来编制马哈朗诺比斯距离计算用图形词典,则经常出现某一部分图形特征量产生不良影响,造成图形分类精度(图形分类率)降低。
并且,可以从对登记图形特征量进行主成分分析而求得的、有用性强的图形特征量中优先利用对图形分类率产生不良影响的图形特征量,编制马哈朗诺比斯距离计算用图形词典。但是,用主成分分析求得的有用性只不过表示有效地表现该图形的图形特征量,所以,与图形分类率没有直接关系。也就是说,即使有选择地使用有用性强的图形特征量,也不一定能提高图形分类率。
作为影响马哈朗诺比斯距离计算的主要原因,可以考虑登记图形特征量的分布不是正规分布的情况,使登记图形特征量的分布近似于一个或者多个正规分布,计算出对一个或者多个正规分布的马哈朗诺比斯距离。但是,通常很难决定对作为多次元数据的图形特征量分布进行近似的多个正规分布。
发明的公开
本发明的目的在于提供一种图形分类方法及其装置、存储媒体,它对适合于图形分类处理的马哈朗诺比斯距离计算用图形特征量进行最佳搜索,对用于马哈朗诺比斯距离计算的图形特征量进行加权的图形特征量加权矩阵进行搜索处理。
涉及本发明的图形分类方法,其特征在于具有以下程序步:从图形分类对象中提取图形特征量,把与上述图形特征量相对应的分类范畴信息登记/设定在图形词典中,根据上述图形特征量和上述图形词典中所登记的马哈朗诺比斯距离词典,进行图形分类,
根据上述图形词典中所存放的上述图形分类范畴名称和上述图形特征量,进行上述图形词典的优化处理,编制上述马哈朗诺比斯词典。
涉及本发明的图形分类装置,其特征在于具有:
图形词典,用于存放从图形分类对象中提取的图形特征量,以及与该图形特征量相对应的分类范畴信息;
分类装置,用于根据上述图形特征量以及上述图形词典中所登记的马哈朗诺比斯词典进行图形分类;以及
图形词典优化装置,用于根据上述图形词典内所存放的上述分类范畴名称和上述图形特征量而进行优化处理,编制马哈朗诺比斯词典。
涉及本发明的另一图形分类装置,其特征在于具有:
图形获取装置,用于获取图形分类对象;
图形区域分出装置,用于从上述图形获取装置中送来的图形分类对象中切出特定图形区域;
分类特征量提取装置,用于从上述图形区域分出装置中送来的上述特定图形区域中计算出对图形分类有用的图形特征量;
词典登记装置,它把由上述分类特征量提取装置计算出的上述图形特征量以及与该图形特征量相对应的分类范畴信息登记/设定到图形词典内;
特征量分类装置,用于根据由上述分类特征量提取装置计算出的上述图形特征量以及在上述图形词典中登记的马哈朗诺比斯词典,进行图形分类;以及
图形词典优化装置,用于根据上述图形词典内所存放的上述分类范畴名称以及上述图形特征量,进行优化处理,编制上述马哈朗诺比斯词典。
附图的简要说明
图1是用于说明马哈朗诺比斯距离的图。
图2是表示涉及本发明的图形分类装置的第1实施例的结构框图。
图3是表示涉及本发明的图形分类装置的第1实施例的图形词典的数据结构的模式图。
图4是表示涉及本发明的图形分类装置的第1实施例的优化候选表的模式图。
图5是表示涉及本发明的图形分类装置的第1实施例的利用特征量加权矩阵的图。
图6是表示涉及本发明的图形分类装置的第1实施例的的图形词典优化处理的流程图。
图7是表示涉及本发明的图形分类装置的第1实施例的马哈朗诺比斯词典优化候选表初始化方法流程图。
图8是表示涉及本发明的图形分类装置的第1实施例的优化候选表选择和利用特征加权矩阵更改方法的流程图。
图9是表示涉及本发明的图形分类装置的第1实施例的优化候选表更新方法的流程图。
图10是表示涉及本发明的图形分类装置的第2实施例中的方框结构图。
图11是表示涉及本发明的图形分类装置的第2实施例中的马哈朗诺比斯词典中的优化候选表的模式图。
图12是表示涉及本发明的图形分类装置的第2实施例中的利用特征量信息的模式图。
图13是表示涉及本发明的图形分类装置的第2实施例中的图形词典优化处理的流程图。
图14是表示涉及本发明的图形分类装置的第2实施例中的优化候选表的初始化方法及其选择/更新方法的流程图。
图15是表示涉及本发明的图形分类装置的第2实施例中的优化候选表的初始化方法及其选择/更新方法变形例的流程图。
图16是表示涉及本发明的图形分类装置的第2实施例中的优化候选表的初始化方法变形例的流程图。
最佳实施例
以下参照附图,详细说明本发明第1实施例。
图2是图形分类装置的方框结构图。当图形获取装置1适用于作为图形分类对象的输入图形2,例如LCD的玻璃基片的检查,把对玻璃基片进行摄像而获得的图像数据作为输入图形2获取。而且,如果图形不仅是涉及缺陷提取的缺陷的形状等,而且是颜色等作为数据能够图形化,那么无论是怎么样的均可。
图形区域分出装置3从图形获取装置1送来的输入图形2中把作为目标的特定图形区域分出来(提取)。图形区域分出装置3例如进行各种滤波处理或2进制处理中的至少一种处理,从输入图形2中提取特定的图形区域,把该特定图形区域获取到分类特征量提取装置4内。
分类特征量提取装置4从图形区域分出装置3送出来的特定图形区域中计算出对图形分类有用的图形特征量,例如,如上所述如果是适用于玻璃基片检查的,则计算出玻璃基片上的缺陷的面积、形状、浓淡值等。分类特征量提取装置4把计算出的图形特征量分别获取到词典登记装置5和特征量分类装置17内。
词典登记装置5把由分类特征量提取装置4计算出的图形特征量以及与该图形特征量相对应的分类范畴信息,例如图形缺陷种类、灰尘、斑痕、焦点模糊、聚焦偏移等登记/设定到图形词典6内。
在图形词典6内如图3的数据结构模式图所示,存放了多个登记图形7(M=1、2、3、……)和马哈朗诺比斯词典8。各登记图形7分别存放分类范畴名称9和图形特征量10。具有同一分类范畴名称9的登记图形7登记1个或多个。
马哈朗诺比斯词典8当把分类范畴名称9的数设定为C,把图形特征量10的种类数设定为N时,具有:作为C×N的矩阵的平均值矩阵(d)11、作为N×N的矩阵的共同方差·协方差矩阵的逆矩阵(V-1)12、以及优化候选表13。优化候选表13如图4所示,其要素有:形成N×N的对角矩阵的多个利用特征量加权矩阵(1~K)14(参见图5)、多个预测分类率(1~K)15、以及多个平均分类距离(1~K)16。在此,利用特征量加权矩阵(1~K)14是下述(7)式中的A,相当于V-1的校正矩阵。并且,预测分类率(1~K)15是当把图形词典中所登记的图形作为未知图形时的分类率。平均分类距离(1~K)16是在求出预测分类率时计算出的马哈朗诺比斯距离的平均值。
特征分类装置17根据由分类特征量提取装置4计算的图形特征量和图形词典6中所登记的马哈朗诺比斯词典8,进行图形分类。也就是说,特征量分类装置17对马哈朗诺比斯距离D2进行运算,得出其分类结果18。在此马哈朗诺比斯距离D2用下式(7)进行计算。
D2=dtAV-1Ad    ……(7)
而且,A是利用特征量加权矩阵14,对角要素以外是0的对角矩阵。
图形词典优化装置19存储一种程序,该程序用于执行图6所示的图形词典优化处理流程图中所示的处理。并且,图形词典优化装置19通过执行已存储的程序而根据图形词典6内所存放的分类范畴名称9和图形特征量10来进行优化处理,编制马哈朗诺比斯词典8。而且,进行图形词典优化处理所用的程序存储在例如未示出的硬磁盘、软磁盘或CD-ROM等中。
根据图6所示的图形词典优化处理流程图,说明图形词典优化装置19的具体动作。
首先,图形词典优化装置19在#1步进行登记图形7的数M、分类范畴名称9的数,这些每个分类范畴名称9的登记图形数、优化反复结束信息的取得/设定。
其次,图形词典优化装置19在#2步,编制一种利用除各登记图形7外的全图形特征量10的马哈朗诺比斯词典8中的平均值矩阵(d)11、共同方差·协方差矩阵的逆阵列(V-1)12,同时进行马哈朗诺比斯词典8中的优化候选表13的初始化。
具体来说,图形词典优化装置19根据图7所示的马哈朗诺比斯词典(优化候选表13)的初始化方法的流程图,进行优化候选表13的初始化。具体内容如下。
首先,图形词典优化装置19在#20步,对把‘1’设定在全特征量对角要素内的利用特征量加权矩阵14进行设定。
其次,图形词典优化装置19在#21步选择登记(m)7。图形词典优化装置19在#22步判断已选择登记图形(m)7的每个分类范畴的登记图形7的数是否是2以上。
该判断结果,如果登记图形7的数为2以上,那么,图形词典优化装置19进入#23步,选择把登记图形(m)7除外而编制的马哈朗诺比斯词典(平均值矩阵(d)11、共同方差·协方差矩阵的逆矩阵(V-1))12。
然后,图形词典优化装置19在#24步对登记图形(n)7进行图形分类处理。图形词典优化装置19在#25步对分类结果进行检查,在#26步判断关于全登记图形7(M=1、2、3……)的分类处理是否已结束。
并且,如果关于全登记图形7(M=1、2、3……)的分类处理已结束,那么,图形词典优化装置19在#27步把预测分类率15和平均分类距离16设定到优化候选表13内向上填满。
然后,图形词典优化装置19在#28步设定n=0(仅在环的最初设定为起始值)、n=n+1。图形词典优化装置19在#29步对全特征量纵向进行主成分分析,把从第1主成分的有用性最小起第n个特征量的对角要素设定为“0”,把其他特征量的对角要素设定为“1”,这样的利用特征量加权矩阵14设定在优化候选表13内向上填满。
然后,图形词典优化装置19在#30步在对优化候选表13要素的设定全部结束之前反复进行上述#21-#27步的处理。
并且,图形词典优化装置19在#31步判断对优化候选表13要素的设定全部结束时,则转移到下一步#32,利用预测分类率15来对优化候选表13进行分类。通过上述处理,马哈朗诺比斯词典优化结束。
然后,图形词典优化装置19在图6所示的#3步进行在优化中所使用的优化表13的选择和利用特征量加权矩阵14的更改。具体来说,优化表13的要素选择和利用特征量加权矩阵14的更改按以下方法。
图形词典优化装置19根据图8所示的优化候选表要素选择和利用特征量加权矩阵更改方法的流程图,进行优化候选表13的要素选择和利用特征量加权矩阵14的更改。
首先,图形词典优化装置19在#40步利用伪随机数来选择优化候选表13的要素,即利用特征量加权矩阵(1~K)14、多个预测分类率(1~K)15和多个平均分类距离(1~K)16。
然后,图形词典优化装置19在#41步利用新的伪随机数来对利用特征量加权矩阵14的对角要素位置的值加上小的伪随机数。
然后,图形词典优化装置19在#42步,如果利用特征量加权矩阵(1~K)14的对角要素位置的值集中在0-1的范围内,那么使其与接近“0”或“1”的一方相一致。这样利用特征量加权矩阵14被更改。
然后,图形词典优化装置19在图6所示的#4步中选择登记图形(m)7,在下一步#5判断已选择的图形(m)7的每个分类范畴的登记图形7的数是否为2以上。
在#5步,如果登记图形7的数为2以上,则图形词典优化装置19转移到#6步,选择那种把登记图形(m)7除去而编制的马哈朗诺比斯词典(平均值阵列(d)11、共同方差·协方差矩阵的逆阵列(V-1))12。
然后,图形词典优化装置19在#7步对登记图形(m)7进行图形分类处理,即利用上述式(7)进行计算求出马哈朗诺比斯距离D2
然后,图形词典优化装置19在#8步对分类结果进行合计。
并且,图形词典优化装置19在#9步判断全登记图形7(M=1、2、3……)是否结束。
该判断结果如果是全登记图形7(M=1、2、3……)结束,那么,图形词典优化装置19转移到#10步,根据分类结果对优化候选表13进行更新。优化候选表13的具体的更新方法如下。
图形词典优化装置19根据图9所示的优化候选表更新方法流程图,对优化候选表13进行更新。
首先,图形词典优化装置19在#51步判断在优化候选表13内是否已有相同的利用特征量加权矩阵14。
该判断结果如果是已有相同的利用特征量加权矩阵14,那么,图形词典优化装置19在#52步计算出作为分类结果的预测分类率r。
然后,图形词典优化装置19在#53依次对优化候选表13内的预测分类率Rk(k为优化候选表要素)15和上述预测分类率r进行比较,在下一步#54判断预测分类率Rk是否大于预测分类率r(Rk>r)。
该判断结果如果是预测分类率Rk大于预测分类率r,那么,图形词典优化装置19在#55步把得到了预测分类率r的候选插入到优化候选表要素k位置上。
然后,图形词典优化装置19在#56步把超过优化候选表要素数的候选例如从下位候选中消除。
然后,图形词典优化装置19在图6所示的#11步中,根据优化反复结束信息,判断优化反复是否结束。并且,如果优化反复未结束,那么再次返回到#3步,如果优化反复已结束,则转移到#12步,选择优化候选表13中的预测分类率15的最大而且平均分类距离16的最小的利用特征量加权矩阵14作为最佳结果。
特征量分类装置17根据分类特征量提取装置4所计算出的图形特征量以及图形词典6内所登记的马哈朗诺比斯词典8,进行图形分类,即对式(7)所示的马哈朗诺比斯距离D2进行运算,得出特征量的分类结果18。
在第1实施例中,具有一种图形词典优化装置19,用于根据图形词典6内所存放的分类范畴名称9和图形特征量10,进行优化处理,编制马哈朗诺比斯词典8。所以,以图形词典6内的各登记图形7为对象,若把哪一种图形特征量10用于编制马哈朗诺比斯词典8,则能进行优化搜索,确定是否能有效地作用于图形分类率。并且,作为优化搜索结果的精度,能确保图形分类精度,使其超过至少利用全图形特征量10而编制的马哈朗诺比斯词典8、以及优先利用通过主成分分析等进行预测的有效特征量而编制的马哈朗诺比斯词典8中的图形分类精度。并且,当假定图形词典6内的登记图形7的一部分被作为未知图形而输入时,作为被输出的分类结果,能保证该图形分类精度约为预测分类率15左右。
图10是涉及本发明第2实施例的图形分类装置的方框结构图。而且,在图10中,对于和图2相同的部分,标注相同的符号,其详细结构说明从略。图形词典20如图3的数据结构模式图所示具有多个登记图形7(M=1、2、3……)、以及马哈朗诺比斯词典8。在本第2实施例中,马哈朗诺比斯词典8中的优化候选表21如图11所示,作为一次元信息把多个利用特征量信息22、多个预测分类率(1-K)15和多个平均分类距离(1-K)16作为要素。
利用特征量信息22的构成要素值如图12所示是0或1的正整数,各构成要素的值表示与该构成要素相对应的图形特征量种类是否被利用于编制马哈朗诺比斯词典8。例如,构成要素的值若为“0”,则表示图形特征量种类未被利用于编制马哈朗诺比斯词典8;若为“1”,则表示图形特征量种类被利用于编制马哈朗诺比斯词典8。
图形词典优化装置23利用图形词典6内的登记图形7的图形特征量10及其分类范畴名称9,进行利用特征量信息的搜索处理,以便表示图形特征量10是否被利用于计算马哈朗诺比斯距离D2
图形词典优化装置23利用图形词典6内的登记图形7的图形特征量10及其分类范畴名称9,进行利用特征量信息的搜索处理,(该信息表示图形特征量10是否被利用于计算马哈朗诺比斯距离D2),编制马哈朗诺比斯词典8。
以下根据图13所示的图形词典优化装置的流程图,具体地说明图形词典优化装置23的动作。
首先,图形词典优化装置23在#60步进行登记图形7的数M、分类范畴名称9的数、这些每个分类范畴名称9的登记图形数、优化反复结束信息、在优化中使用的图形特征量10的种类的取得/设定。
然后,图形词典优化装置23在#61步进行在优化中使用的优化候选表21的初始化、或者优化候选表21的选择和利用特征量信息22的更改。具体的优化候选表21的初始化(#81步)或者优化候选表21(#82步)的选择和利用特征量信息22的更改(#81步和#82步)如下。
图形词典优化装置23根据图14所示的优化候选表21的初始化方法和该优化候选表21的选择/更新方法的流程图,进行在优化中使用的优化候选表21的初始化、或者优化候选表21的选择和利用特征量信息22的更改。
首先,图形词典优化装置23在#80步判断是搜索的前半部分还是后半部分,如果是搜索的前半部分,那么就转移到#81步,进行随机多起始搜索。在该随机多起始搜索中,利用伪随机数把指定个数的“1”设定到利用特征量信息22的要素内。在该随机多起始搜索中,对利用特征量信息22的数加以固定。
如果是搜索的后半部分,那么图形词典优化装置23就转移到#82步,进行局部搜索。在该局部搜索中,在#83步,利用伪随机数来选择优化候选表21,在下一步#84中,进行随机选择。
在该随机选择的一方,在#85步利用新的伪随机数来选择优化候选表21,在下一步#86中,进行利用特征量信息要素的部分更换或置换处理。
在随机选择的另一方,在#87步利用新的伪随机数来更换利用特征量信息要素的“0”或“1”值。
也就是说,在搜索的后半部分的局部搜索中,对于随机选择的利用特征量信息22与其他随机选择的非利用特征量的置换,或者随机选择的特征量的利用的有无,按一定概率进行实施运用,同时,对图形分类率进行评价,选择出获得良好图形分类率的组合。
在上述#85-#86步在不同的表要素之间进行更换/置换处理,在#87步在由#83步选择的同一表要素内进行更换处理。
按照以上那样,进行获得良好图形率的词典优化处理。
然后,图形词典优化装置23在图13所示的#62步选择登记图形(m)7,在下一步#63判断已选择的登记图形(m)7的每个分类范畴的登记图形7的数是否为2以上。
在#63步,如果登记图形7的数为2以上,那么,图形词典优化装置23就转移到#64步,把登记图形(m)7从马哈朗诺比斯词典12的编制对象中除掉。
然后,图形词典优化装置23在#65步仅利用已选择的图形特征量10来编制马哈朗诺比斯词典(平均值矩阵d、共同方差·协方差矩阵的逆矩阵V-1)8。
然后,图形词典优化装置23在#66步对登记图形(m)7进行图形分类处理。也就是说,图形词典优化装置23利用式(7)计算求出马哈朗诺比斯距离D2
然后,图形词典优化装置23在#67步对分类结果进行合计。
并且,图形词典优化装置23在#68步判断全登记图形7(M=1、2、3……)是否已结束。
该判断结果如果是全登记图形7(M=1、2、3……)尚未结束,那么图形词典优化装置23返回到#62步。
如果全登记图形7(M=1、2、3……)已结束,那么图形词典优化装置23转移到#69步,根据分类结果来对优化候选表21进行更新。
然后,图形词典优化装置23在#70步根据优化反复结束信息,判断优化反复是否结束。如果优化反复尚未结束,那么再次返回到#61步;如果已经结束,那么就转移到#71步,根据优化候选表21中的预测分类率15的最大,而且平均分类距离16的最小的利用特征量信息22,编制马哈朗诺比斯词典(平均值矩阵d、共同方差·协方差矩阵的逆矩阵V-1)8。
特征量分类装置17根据由分类特征量提取装置4计算出的图形特征量和图形词典6中所登记的马哈朗诺比斯词典8,对图形分类,即式(7)所示的马哈朗诺比斯距离D2进行运算,获得特征量分类结果18。
在本第2实施例中利用图形词典6内的登记图形7的图形特征量10及其分类范畴名称9,进行利用特征量信息的搜索处理,以便表示是否利用马哈朗诺比斯距离D2计算中所用的图形特征量10。例如,作为图形特征量加权矩阵的对角要素限定于取“0”或“1”的整数,作为图形特征量加权信息设置了作为1次元信息的图形词典优化装置23。所以,能发挥与上述第1实施例相同的效果,同时作为马哈朗诺比斯词典8能仅限定于图形分类特征量,其中利用必要的平均值矩阵(d)11以及共同方差·协方差矩阵的逆矩阵V-1的尺寸,能削减必要的存储容量和运算量。
而且,上述第2实施例也可以变形如下。
在图15中图形词典优化装置23在#90步,对是否是搜索的初次前半部分或后半部分进行判断,若是初次,则转移到#91步,判断在前面是否进行了优化处理。
该判断结果,如果是前面已进行了优化处理,那么图形词典优化装置23转移到#92步,把优化候选表21从以前已编制的优化候选表21中复制下来。
如果以前没有进行优化处理,那么,图形词典优化装置23转移到#93步进行上述随机多起始搜索。
并且,图形词典优化装置23,如果上述#90步的判断结果是搜索的前半部分,那么转移到#93步,进行随机多起始搜索,如果是搜索的后半部分,那么转移到#94步,进行上述局部搜索。
在图16中,图形词典优化装置23在#100步判断是否为初次,若是初次,则转移到#101步,进行上述随机多起始搜索。
然后,图形词典优化装置23在#102步仅利用已选择的图形特征量10,编制马哈朗诺比斯词典(平均值矩阵(d)11、共同方差·协方差矩阵的逆矩阵V-1)8。
然后,图形词典优化装置23在#103步选择登记图形(m)7。图形词典优化装置23在#104步对已选择的登记图形(m)7进行图形分类处理,即利用上述式(7),计算求出马哈朗诺比斯距离D2
然后,图形词典优化装置23在#105步对分类结果进行合计。
并且,图形词典优化装置23在#106步判断全登记图形7(M=1、2、3……)是否结束。
该判断结果,若是全登记图形7(M=1、2、3……)结束,则图形词典优化装置23转入#109步,根据分类结果进行优化候选表13的更新。
并且,若反复尚未结束,则图形词典优化装置23再次返回到#101步。
而且,图15和图16所示的优化候选表21的初始化方法以及该优化候选表21的选择/更新方法的流程图,也可以布置在上述图7所示的马哈朗诺比斯词典8的优化候选表的初始化处理后级来进行。
作为局部搜索方法在预测分类率上位候选之间进行GA(遗传算法(=遗传因子算法))中的遗传因子交换处理,也就是说,也可以适当更换作为对象的2组利用特征量间不同的特征量。另外,也可以和虚拟锻练方法一样,按一定概率允许图形分类率降低的组合。这样一来,通过随机选择的特征量更换,很容易编制具有良好的图形分类率的组合特征量的分类词典。
若采用本发明,则能以图形词典内的各登记图形为对象,进行优化搜索,判断在哪种图形特征量用于编制马哈朗诺比斯词典时是否能有效地作用于图形分类率,作为其优化搜索结果,至少能确保图形分类精度超过利用图形特征量而编制的马哈朗诺比斯词典以及优先利用以主成分分析等预测的有效特征量而编制的马哈朗诺比斯词典的图形分类精度。
并且,当假定图形词典内的登记图形的一部分被作为未知图形而输入时,作为输出的分类结果,能保证图形分类精度为预测分类率程度。
对于应作为马哈朗诺比斯词典编制的平均值矩阵(d)、以及共同方差·协方差矩阵的逆矩阵V-1的尺寸,仅限定于利用的图形分类特征量的种类,能减少所需的存储容量和运算量。
本发明涉及对用于缺陷种类等图形分类的图形词典进行优化的图形分类方法及其装置以及能用计算机读出的存储媒体。

Claims (7)

1、一种图形分类方法,其特征在于,包括:
从图形分类对象中提取图形特征量的步骤;
把与上述图形特征量相对应的分类范畴名称登记/设定在图形词典中的步骤;
根据上述图形特征量和上述图形词典中所登记的马哈朗诺比斯词典,进行图形分类的步骤,
上述马哈朗诺比斯词典是通过根据上述图形词典中所存放的上述图形分类范畴名称和上述图形特征量,进行图形分类处理,来进行上述图形词典的优化处理,编制上述马哈朗诺比斯词典。
2、如权利要求1所述的图形分类方法,其特征在于:上述马哈朗诺比斯词典包括优化候选表,其中以利用特征量加权矩阵和预测分类率或利用特征量信息和预测分类率为要素。
3、一种图形分类装置,其特征在于具有:
图形词典,用于存放从图形分类对象中提取的图形特征量,以及与该图形特征量相对应的分类范畴名称;
分类装置,用于根据上述图形特征量以及上述图形词典中所登记的马哈朗诺比斯词典进行图形分类;以及
图形词典优化装置,用于根据上述图形词典内所存放的上述分类范畴名称和上述图形特征量,编制上述马哈朗诺比斯词典。
4.根据权利要求3所述的通信分类装置,其特征在于,所述马哈朗诺比斯词典包括优化候选表。
5、一种图形分类装置,其特征在于具有:
图形获取装置,用于获取图形分类对象;
图形区域分出装置,用于从上述图形获取装置中送来的图形分类对象中分出特定图形区域;
分类特征量提取装置,用于从上述图形区域分出装置中送来的上述特定图形区域中计算出对图形分类有用的图形特征量;
词典登记装置,它把由上述分类特征量提取装置计算出的上述图形特征量以及与该图形特征量相对应的分类范畴名称登记/设定到图形词典内;
特征量分类装置,用于根据由上述分类特征量提取装置计算出的上述图形特征量以及在上述图形词典中登记的马哈朗诺比斯词典,进行图形分类;以及
图形词典优化装置,用于根据上述图形词典内所存放的上述分类范畴名称以及上述图形特征量,编制上述马哈朗诺比斯词典。
6、权利要求5所述的图形分类装置,其特征在于:上述图形词典优化装置具有一种进行利用特征量加权矩阵的搜索处理的功能,该利用特征量加权矩阵使用上述图形词典内的登记图形的上述图形特征量和上述分类范畴名称,对用于计算上述马哈朗诺比斯距离的上述图形特征量进行矩阵运算。
7、如权利要求5或6所述的图形分类装置,其特征在于:上述马哈朗诺比斯词典包括优化候选表。
CNB018028918A 2000-09-25 2001-09-21 图形分类方法及其装置 Expired - Fee Related CN1261907C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2000289957A JP2002099916A (ja) 2000-09-25 2000-09-25 パターン分類方法及びその装置、コンピュータにより読み取り可能な記憶媒体
JP289957/00 2000-09-25
JP289957/2000 2000-09-25

Publications (2)

Publication Number Publication Date
CN1393002A CN1393002A (zh) 2003-01-22
CN1261907C true CN1261907C (zh) 2006-06-28

Family

ID=18773256

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB018028918A Expired - Fee Related CN1261907C (zh) 2000-09-25 2001-09-21 图形分类方法及其装置

Country Status (7)

Country Link
US (1) US6931386B2 (zh)
JP (1) JP2002099916A (zh)
KR (1) KR100464062B1 (zh)
CN (1) CN1261907C (zh)
AU (1) AU2001290253A1 (zh)
TW (1) TW569145B (zh)
WO (1) WO2002025591A1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7275016B2 (en) * 2003-08-08 2007-09-25 Siemens Aktiengesellschaft Method and system for providing problem identification and trouble-shooting services
JP2005158780A (ja) 2003-11-20 2005-06-16 Hitachi Ltd パターン欠陥検査方法及びその装置
US7281840B2 (en) * 2004-07-09 2007-10-16 Tres-Ark, Inc. Chemical mixing apparatus
US20060080041A1 (en) * 2004-07-08 2006-04-13 Anderson Gary R Chemical mixing apparatus, system and method
JP4821232B2 (ja) * 2004-09-27 2011-11-24 Jfeスチール株式会社 操業結果予測方法及びそのシステム
WO2008004559A1 (fr) * 2006-07-06 2008-01-10 Asahi Glass Company, Limited système de groupage, et dispositif d'évaluation de type de défaut
KR100915922B1 (ko) * 2007-06-13 2009-09-07 경원대학교 산학협력단 영상인식을 통한 얼굴 특징 추출과 사상체질 판별 방법 및시스템
US8170341B2 (en) 2009-01-23 2012-05-01 Nec Corporation Image signature extraction device
JP5542251B1 (ja) * 2013-10-30 2014-07-09 楽天株式会社 処理装置、処理方法、プログラム、及び記録媒体

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02195400A (ja) * 1989-01-24 1990-08-01 Canon Inc 音声認識装置
JP2590414B2 (ja) * 1991-03-12 1997-03-12 科学技術庁長官官房会計課長 ファジィパターン認識方法
JP3118725B2 (ja) * 1991-09-11 2000-12-18 株式会社日立製作所 自動分類方法
JPH05233880A (ja) * 1992-02-20 1993-09-10 N T T Data Tsushin Kk パターン認識用辞書作成法
US5544256A (en) * 1993-10-22 1996-08-06 International Business Machines Corporation Automated defect classification system
JP3249676B2 (ja) * 1994-02-10 2002-01-21 株式会社エヌ・ティ・ティ・データ パターン認識辞書作成方法
JP3019911B2 (ja) * 1994-08-04 2000-03-15 日本電信電話株式会社 パタン認識方法
JP4039708B2 (ja) * 1997-02-14 2008-01-30 ヒューレット・パッカード・カンパニー パターン認識方法およびパターン認識装置
US6539102B1 (en) * 2000-09-01 2003-03-25 Large Scale Proteomics Reference database

Also Published As

Publication number Publication date
AU2001290253A1 (en) 2002-04-02
KR20020067524A (ko) 2002-08-22
JP2002099916A (ja) 2002-04-05
TW569145B (en) 2004-01-01
KR100464062B1 (ko) 2005-01-03
US20020143719A1 (en) 2002-10-03
US6931386B2 (en) 2005-08-16
CN1393002A (zh) 2003-01-22
WO2002025591A1 (fr) 2002-03-28

Similar Documents

Publication Publication Date Title
CN1237574C (zh) 半导体器件的制造方法
CN1519757A (zh) 图像检索装置、图像检索装置的关键词赋予方法及程序
CN1214340C (zh) 多个神经网络的成像设备和方法
CN1108579C (zh) 在序列同源性检测中完成模式词典组成的方法和设备
CN1261907C (zh) 图形分类方法及其装置
CN1828632A (zh) 目标检测装置、学习装置、目标检测系统及目标检测方法
CN1685364A (zh) 在图像中分割像素的方法
CN1140878C (zh) 字符识别方法,修正方法及字符识别装置
CN1922632A (zh) 参考数据优化学习方法及模式识别系统
CN1019054B (zh) 并行相联存储器
US20190355628A1 (en) Process window analysis
CN101059814A (zh) 图像处理设备与图像处理方法
CN1158465A (zh) 读取字符的方法和读取邮政地址的方法
CN1867933A (zh) 评估和优化原油选择的方法及系统
CN1871597A (zh) 利用一套消歧技术处理文本的系统和方法
CN1900655A (zh) 导航系统
CN1503167A (zh) 信息存储及检索
CN1571977A (zh) 字符识别
CN1877566A (zh) 基于现有本体产生新概念的系统和方法
CN1904906A (zh) 地址识别装置和方法
US11416711B2 (en) Defect detection system
CN1656371A (zh) 判定表面缺陷的方法
CN109543753B (zh) 基于自适应模糊修复机制的车牌识别方法
Li et al. Automated analysis and reannotation of subcellular locations in confocal images from the human protein atlas
CN1714361A (zh) 制造工程分析支持方法、使计算机执行该方法的程序、程序产品及记录介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20060628

Termination date: 20130921