有限论域上的关系可用布尔矩阵表示。同样,有限论域上的模糊关系也可以用所谓模糊矩阵来表示。
A、B为两个非空集合(非模糊集合),AB直积中的一个模糊集合R称为A到B的一个模糊关系,记作RAxB。其中直积(两个集合元素的所有组合)为:
AxB = {(a,b)|a∈A,b∈B}
模糊矩阵R中元素rij=μr(ai,bj)表示论域中A的i元素与B的j元素对于模糊关系R的隶属程度。
模糊关系是定义在直积上的模糊集合,表征的是元素与元素的关系;当A=B时,称为A上的模糊关系。模糊关系有三种性质:自反性、对称性和传递性。
(1)模糊相似关系:当模糊关系有自反性、对称性时,称为模糊相似关系
(2)模糊等价关系:模糊关系有自反性、对称性、传递性时,称为模糊等价关系
在实际工程技术和经济管理问题中,我们常常需要对对象进行分类。例如,根据生物特征对物种分类、根据气候特征对城市分类、根据用户行为对客户群体分类等。传统的聚类分析基于清晰的分类边界,但现实中许多分类问题具有模糊性——类与类之间的界限并不分明。例如,"青年"与"中年"的年龄界限、空气质量等级的划分等。
模糊聚类分析正是为了解决这类模糊分类问题而提出的方法。它通过建立模糊关系矩阵,结合模糊数学理论,将对象的相似性转化为数值化的隶属度,从而实现对模糊类别的动态划分。而用模糊数学的方法来处理聚类问题可得到样本属于各个类别的不确定性程度,表达了样本类属的中介性,更能客观地反映现实世界。 基于模糊关系的聚类分析的一般步骤:
(1)数据标准化:在实际问题中,不同的数据可能有不同的性质和不同的量纲,为了使原始数据能够适合模糊聚类的要求,需要将原始数据矩阵 A 作标准化处理,即通过适当的数据变换,将其转化为模糊矩阵
(2) 构造模糊相似矩阵:构造模糊相似矩阵的方法主要包括以下几种:
1)相似系数法:数量积法:通过计算向量之间的数量积来衡量相似度。夹角余弦法:通过计算向量之间的夹角余弦值来衡量相似度。相关系数法:通过计算向量之间的相关系数来衡量相似度。指数相似系数法:通过指数函数计算相似度。最大最小法:通过最大值和最小值的比较来衡量相似度。算术平均最小法:通过算术平均值来衡量相似度。几何平均最小法:通过几何平均值来衡量相似度。
2)距离法:绝对值倒数法:通过绝对值的倒数来衡量距离。绝对值指数法:通过绝对值的指数来衡量距离。海明距离法:通过海明距离公式计算距离。欧氏距离法:通过欧氏距离公式计算距离。切比雪夫距离法:通过切比雪夫距离公式计算距离。
其他方法:主观评定法:通过专家主观判断来衡。
(3) 模糊聚类:所谓聚类方法就是依据模糊矩阵将所研究的对象进行分类的方法。对于不同的置信水平λ ∈[0,1],可以得到不同的分类结果,从而形成动态聚类图。常用的方法如下:
A. 传递闭包法:从模糊相似矩阵 R 出发,来构造一个模糊等价矩阵 。其方法就是用平方法求出 R 的传递闭包t(R) ,则 t(R) = ;然后,由大到小取一组λ ∈[0,1] , 确定相应的λ 截矩阵,则可以将其分类,同时也可以构成动态聚类图。
B.布尔矩阵法:布尔矩阵法的具体步骤如下:求模糊相似矩阵的λ-截矩阵Rλ,,若Rλ按矩阵元定理判定为等价的,则由Rλ可得U在λ水平上的分类。若前定理判定为不是等价的,则Rλ在某一排列下含有上述形式的特殊子矩阵,此时只要将Rλ中上述形式的特殊子矩阵的“0”一律改为“1”,直到不再产生上述形式的特殊子矩阵为止即可。如此得到的Rλ为等价矩阵。因此,由Rλ可得在λ水平上的分类。
C.直接聚类法:是指在建立模糊相似矩阵之后,不去求传递闭包t(R),也不用布尔矩阵法,而是直接从模糊相似矩阵出发求得聚类图。其步骤如下:
1°取λ₁=1(最大值),对每个xi;作相似类[xi]R,且[xi]R={xj|rij=1},即将满足rij=1的xi与xj放在一类,构成相似类。相似类与等价类的不同之处是,不同的相似类可能有公共元素,即可出现此时只要将有公共元素的相似类合并,即可得λ=1水平上的等价分类。
2°取λ₂为次大值,从R中直接找出相似程度为λ₂的元素对(xi,xj)(即rij=λ₂),将对应于λ₁=1的等价分类中xi所在的类与xj所在的类合并,将所有这些情况合并后,即得对应于λ₂的等价分类。
3°取λ₃为第三大值,从R中直接找出相似程度为λ₃的元素对(xi,xj)(即rij=λ₃),类似地将对应于λ₂的等价分类中xi所在类与xj所在类合并,将所有这些情况合并后,即得对应λ₃的等价分类。
4°依此类推,直到合并到U成为一类为止。
模糊聚类分析的应用
从目前文献看,模糊聚类分析是模糊数学中应用最多、最活跃的一个分支,几乎涉及各个学科领域,科技工作者在其中做了大量的工作。
来源: 成都信息工程大学