


在特征向量为整数类型的特殊情况下,它们位于步长为 1.0 的网格中的特征空间中。例如,通常用于颜色分类的 RGB 特征向量是三元组,它们的每个分量具有 0 到 255 之间的整数值。事实上,甚至可能有几个特征向量代表同一个点。当使用此类数据训练 GMM 时,训练算法可能倾向于将建模的高斯分布沿与网格维度平行的线性相关数据线或平面对齐。如果 train_class_gmm 返回的中心数异常高,则表明算法存在这种行为。参数 Randomize 可用于处理此类不希望的效果。如果 Randomize > 0.0,则将均值为 0 和标准差 Randomize 的随机高斯噪声添加到训练数据向量的每个分量中,并将转换后的训练数据存储在 GMM 中。对于 Randomize 1.0 的值,随机数据将看起来像网格点周围的小云,这不会改善数据云的属性。对于 Randomize >> 2.0 的值,随机化可能会对生成的 GMM 产生过大的影响。对于整数特征向量,建议使用介于 1.5 和 2.0 之间的         Randomize 值,它将整数数据转换为均匀的云,而无需修改其在特征空间中的一般形式。如果数据是通过缩放从整数数据创建的,则可能会出现同样的问题。在这里,必须使用用于缩放原始数据的相同比例因子来缩放 Randomize。

2.1 产生高斯模型

create_class_gmm — Create a Gaussian Mixture Model for classification

create_class_gmm( : : NumDim, NumClasses, NumCenters, CovarType, Preprocessing, NumComponents, RandSeed : GMMHandle)

create_class_gmm 创建用于分类的高斯混合模型 (GMM)。 NumDim 指定特征空间的维数,NumClasses 指定类数。 GMM 由每个类的 NumCenters 高斯中心组成。 NumCenters 不仅可以是要使用的确切中心数,而且可以根据参数的数量指定中心数的上限和下限:

1 NumDim,


2 NumClasses,


3 NumCenters, 

  • 正好一个参数:


  • 正好两个参数:


  • 确切的参数:



4 CovarType,

每个中心都由参数center ,协方差矩阵和混合系数来描述。这些参数是通过期望最大化(EM)算法从训练数据中计算得出的。如果使用了足够的中心,则GMM可以近似任意概率密度。协方差矩阵 的尺寸为NumDim x NumDim(如果使用预处理,则为NumComponents x NumComponents),并且是对称的。进一步的约束可以由CovarType给出 : 

  • 对于CovarType = 'spherical',是单位矩阵的标量倍数。中心密度函数p(x | j)为


  • 对于CovarType = 'diag', 是对角矩阵。中心密度函数p(x | j)为 :

  • 对于CovarType = 'full', 为正定矩阵。中心密度函数p(x | j)为 :

计算的复杂度从CovarType = '球面'超过CovarType = 'diag' 到CovarType = '满'。同时,中心的灵活性增加了。因此,一般而言, “球形”对于NumCenter所需的值要 大于“完整”值

使用GMM的过程如下:首先,由create_class_gmm创建一个GMM 。然后,通过add_sample_class_gmm添加训练向量 ,然后可以使用write_samples_class_gmm将它们写入磁盘。使用train_class_gmm 确定分类器中心参数(如上定义)。此外,可以使用write_class_gmm保存它们,以供以后分类。

根据混合概率和中心密度函数p(x | j),可以通过以下公式计算概率密度函数p(x):


参数Preprocessing和NumComponents可用于预处理训练数据并减小其尺寸。这些参数在操作符create_class_mlp的描述中进行了说明 。

create_class_gmm用随机数初始化中心的坐标。为确保使用train_class_gmm训练分类器的结果可再现,将随机数生成器的种子值传递 给RandSeed。


  • 多线程类型:可重入(与非排他运算符并行运行)。

  • 多线程作用域:全局(可以从任何线程调用)。

  • 未经并行处理。


5 Preprocessing,

预处理(input_control)  字符串→ (字符串)


默认值: “规范化”

值列表:“ canonical_variates”,“ none”,“ normalization”,“ principal_components”

6 NumComponents,

NumComponents(input_control)  整数→ (整数)

预处理参数:变换后的特征数量(对于Preprocessing = 'none'和Preprocessing = 'normalization'忽略)。

默认值: 10

建议值: 1、2、3、4、5、8、10、15、20、30、40、50、60、70、80、90、100

限制:NumComponents> = 1

7 RandSeed 

RandSeed(input_control)  整数→ (整数)


默认值: 42

    create_class_gmm (5, 1, [1,5], 'spherical', 'normalization', 5, 42, GMMHandle)
create_class_gmm创建用于分类的高斯混合模型(GMM)。 NumDim指定要素空间的维数, NumClasses指定类的数量。

* The training is based on five images that contain no errors.

* This example program shows you how to use the GMM classifier for novelty
* detection to perform a web inspection task.  To perform the novelty detection,
* all pixels belonging to the single trained class are computed, and are then
* subtracted from the classification ROI to extract the erroneous pixels.  For
* the web inspection task, the GMM can consequently be used to detect
* textures that do not correspond to the texture of the trained good objects.
dev_update_off ()
ReadPretrainedClassifier := false
* Uncomment the following line to read the pretrained classifier from
* disk. The training may last up to half a minute.
* ReadPretrainedClassifier := true
SaveClassifier := false
* Uncomment the following line to write the GMM classifier to disk after training.
* SaveClassifier := true
read_image (Image, 'plastic_mesh/plastic_mesh_01')
get_image_size (Image, Width, Height)
dev_close_window ()
dev_open_window (0, 0, Width, Height, 'black', WindowHandle)
dev_set_color ('red')
set_display_font (WindowHandle, 16, 'mono', 'true', 'false')
get_system ('example_dir', HalconExamples)
* The texture filters used for the classification will return artifacts at the image
* borders because the images of the plastic mesh to be inspected do not
* contain an integer number of mesh cells.  Because this would lead to wrongly
* detected errors at the image borders, we must exclude the area close to the
* image border from the training and classification.  This is done with the following
* rectangle.  Note that the image is later scaled down by a factor of two.
gen_rectangle1 (Rectangle, 10, 10, Height / 2 - 11, Width / 2 - 11)
if (ReadPretrainedClassifier)* Read the pretrained classifier from disk.dev_display (Image)disp_message (WindowHandle, 'Reading classifier from disk...', 'window', 10, 10, 'black', 'true')read_class_gmm (HalconExamples + '/hdevelop/Segmentation/Classification/novelty_detection.gmm', GMMHandle)wait_seconds (1.5)
else* Create the GMM classifier.create_class_gmm (5, 1, [1,5], 'spherical', 'normalization', 5, 42, GMMHandle)* The training is based on five images that contain no errors.for J := 1 to 5 by 1read_image (Image, 'plastic_mesh/plastic_mesh_' + J$'02')* The images are zoomed down because the resolution of the mesh is very* high.  This saves a large amount of processing time.zoom_image_factor (Image, ImageZoomed, 0.5, 0.5, 'constant')dev_display (ImageZoomed)disp_message (WindowHandle, 'Adding training samples...', 'window', 10, 10, 'black', 'true')* Generate the texture image.gen_texture_image (ImageZoomed, ImageTexture)* Add the samples to the classifier.add_samples_image_class_gmm (ImageTexture, Rectangle, GMMHandle, 2.0)endfordev_display (ImageZoomed)disp_message (WindowHandle, 'Training GMM...', 'window', 10, 10, 'black', 'true')* Train the GMM.train_class_gmm (GMMHandle, 1000, 0.001, 'training', 1e-4, Centers, Iter)if (SaveClassifier)write_class_gmm (GMMHandle, HalconExamples + '/hdevelop/Segmentation/Classification/novelty_detection.gmm')endif
* Now detect errors in the plastic meshes.
for J := 1 to 14 by 1read_image (Image, 'plastic_mesh/plastic_mesh_' + J$'02')zoom_image_factor (Image, ImageZoomed, 0.5, 0.5, 'constant')dev_display (ImageZoomed)gen_texture_image (ImageZoomed, ImageTexture)reduce_domain (ImageTexture, Rectangle, ImageTextureReduced)* Classify samples belonging to the trained class with the GMM.classify_image_class_gmm (ImageTextureReduced, Correct, GMMHandle, 0.001)* Subtract them from the ROI to obtain the texture errors.difference (Rectangle, Correct, Errors)* Postprocess the returned raw errors to remove insignificant parts of the* detected errors.opening_circle (Errors, ErrorsOpening, 3.5)closing_circle (ErrorsOpening, ErrorsClosing, 10.5)connection (ErrorsClosing, ErrorsConnected)select_shape (ErrorsConnected, FinalErrors, 'area', 'and', 300, 1000000)count_obj (FinalErrors, NumErrors)dev_set_color ('red')dev_set_draw ('margin')dev_set_line_width (3)dev_display (FinalErrors)if (NumErrors > 0)disp_message (WindowHandle, 'Mesh not OK', 'window', 10, 10, 'black', 'true')elsedisp_message (WindowHandle, 'Mesh OK', 'window', 10, 10, 'black', 'true')endifif (J < 14)disp_continue_message (WindowHandle, 'black', 'true')endifstop ()
clear_class_gmm (GMMHandle)

