一、背景
判别分析是在已知样品分类的前提下,将给定新样品按照某种分类判入某类的分析方法。
距离判别
其中是x,y随机向量的协方差矩阵。马氏距离的作用在于消除了变量单位不一致的影响更加合理。当两个总体的协方差不同时应使用二次判别。
FISHER判别
将高维的点投影到一条直线y上,使G1和G2中的点在y上的投影靠近而彼此之间分开
Bayes判别
假定对研究对象有一定的认识,可以用先验概率描述,样本的作用在于修正已有的先验概率分布得到后验分布,再通过后验分布进行各种统计推断。其判别准则是以个体归属某类的概率最大或错判总平均损失最小为标准。
接下来以今天和昨天的湿温差和气温差为预报明天是否下雨的重要因子,分别应用三种方法。
二、距离判别的代码实现
setwd("C:/Users/myq20170530/data")
data5.2<-read.csv("ex5.2.csv",heading=1)
classG1=data5.2[1:10,2:3]
classG2=data5.2[11:20,2:3]##分别提取不同类别的样本数据
newdata=c[8.1,2.0]##需要预测的数据点
mu1<-colMeans(c

文章介绍了判别分析中的距离判别、Fisher判别和Bayes判别,并通过代码实例展示了它们在预测模型中的应用。距离判别考虑了变量协方差,Fisher判别通过线性投影优化类间距离,Bayes判别利用先验概率修正分类。尽管Bayes判别法在本例中正确率稍低,但它能考虑概率和损失,更适用于复杂情况。

1225

被折叠的 条评论
为什么被折叠?



