基于R多元统计分析——判别分析(附代码)

原创

已于 2023-05-18 20:18:33 修改 · 2.5k 阅读

标签

#r语言 #机器学习 #开发语言

收录于

于 2023-04-10 08:47:49 首次发布

文章介绍了判别分析中的距离判别、Fisher判别和Bayes判别，并通过代码实例展示了它们在预测模型中的应用。距离判别考虑了变量协方差，Fisher判别通过线性投影优化类间距离，Bayes判别利用先验概率修正分类。尽管Bayes判别法在本例中正确率稍低，但它能考虑概率和损失，更适用于复杂情况。

一、背景

判别分析是在已知样品分类的前提下，将给定新样品按照某种分类判入某类的分析方法。

距离判别

$d\left ( x,y \right )=\sqrt{({x-y})'\varepsilon ^{-1}(x-y)}$

其中 $\varepsilon$ 是x，y随机向量的协方差矩阵。马氏距离的作用在于消除了变量单位不一致的影响更加合理。当两个总体的协方差不同时应使用二次判别。

FISHER判别

将高维的点投影到一条直线y上，使G1和G2中的点在y上的投影靠近而彼此之间分开

Bayes判别

假定对研究对象有一定的认识，可以用先验概率描述，样本的作用在于修正已有的先验概率分布得到后验分布，再通过后验分布进行各种统计推断。其判别准则是以个体归属某类的概率最大或错判总平均损失最小为标准。

接下来以今天和昨天的湿温差和气温差为预报明天是否下雨的重要因子，分别应用三种方法。

二、距离判别的代码实现

setwd("C:/Users/myq20170530/data")
data5.2<-read.csv("ex5.2.csv",heading=1)
classG1=data5.2[1:10,2:3]
classG2=data5.2[11:20,2:3]##分别提取不同类别的样本数据
newdata=c[8.1,2.0]##需要预测的数据点
mu1<-colMeans(c

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

XIxi_0519

关注关注

3
点赞
踩
26

收藏

觉得还不错? 一键收藏
8
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

matlab判别分析代码-Multidomain-Discriminant-Analysis:UAI2019论文代码“通过多域判别分析进行域一

05-27

matlab判别分析代码 Multidomain Discriminant Analysis (MDA) MATLAB and Python code of paper Shoubo Hu, Kun Zhang, Zhitang Chen, Laiwan Chan. Conference on Uncertainty in Artificial Intelligence (UAI) 2019.

8 条评论您还未登录，请先登录后发表或查看评论

基于R多元统计分析——聚类算法代码实现

m0_62929945的博客

04-08

1225

以全国各城市空气质量年度数据为例。分别应用系统聚类算法和K均值聚类法对数据进行分析。

距离判别法与R程序实战

weixin_34289454的博客

08-14

3269

距离判别法与R程序实战 2016-03-12 18:21:48 设mu1,mu2,cov1,cov2 分别是总体G1，G2的均值向量和协方差矩阵。一样品x到各总体的马氏距离为 D(x,G1)=mahalanobis(x,mu1,cov1), D(x,G2)=mahalanobis(x,mu2,cov2)）...

R语言多元统计：判别分析

NfCobol的博客

10-15

417

判别分析是一种常用的多元统计方法，用于将样本数据分配到事先定义好的类别中。在R语言中，我们可以使用多个包来进行判别分析，包括MASScaret和lda等。本文将介绍如何使用R语言进行判别分析，并提供相应的源代码示例。

R判别分析

qq_57518649的博客

05-04

1256

常用的判别分析方法是距离判别、贝叶斯判别和Fisher判别等。

[Rcode]三种判别分析比较及R代码

TOMACAT的博客

12-05

2万+

判别方法的比较: #距离判别：按照方差是否相等比较x与总体均值的距离。 #Bayes判别：假定对研究对象已经有一定的认识，但这种认识常用先验概率来描述，取得样本后，就可以用样本修正已有的先验概率，得到后验概率。 #Fisher判别：按照类内方差尽可能小，类间方差尽可能大来求判别函数。 #距离判别： #二分类问题： discriminiant.distance <- function (T

多元统计分析及R语言建模（第五版）——第6章 判别分析课后习题

热门推荐

qq_45111488的博客

12-02

3万+

第6章 判别分析 文章会用到的数据请在这个网址下下载多元统计分析及R语言建模（第五版）数据

【多元统计分析及R语言建模】第一章第多元统计分析的概述

qq_51490070的博客

12-15

5018

1.多元数据的数学表示 2.多元数据的直观分析：通过图示的方法显示数据，即是多元数据的可视化。 3.多元线性相关分析：研究数据之间有没有线性关系 4.多元线性回归分析：在多元线性相关分析基础上，数据之间有相关关系，就用回归分析表示出来。 5.广义和一般线性模型：对多元线性回归分析模型的推广，分成广义和一般线性模型。 6.判别分析：传统的多元统计分析方法。对所研究的对象进行判别分类。要求事先归类，对新的对象判断是哪一类……

多元统计分析及R语言建模-第6章 判别分析

smart_hj的博客

12-21

8415

# 第6章 判别分析 # 线性判别分析函数lda()的用法 lda(formula, data, ...) # formula为一个形如groups~x1+x2+...的公式框架， data为数据框 # 6.2线性判别分析 d6.1 = read.table("clipboard",header=T); attach(d6.1) plot(x1,x2); text(x1

R语言学习笔记9_多元统计分析介绍

skye_s_的博客

09-10

4465

目录九、多元统计分析介绍九、多元统计分析介绍

R语言马氏距离判别法

import_torch_as_tf

04-07

7481

没啥好解释的，就放个代码和运行结果吧 #数据准备 x1<-c(3,3,2,3,3,3,3,3,2,2,1,3,2,1,2,2,2,3,3,2,2,2,2,2) x2<-c(28,45,55,55,50,70,75,80,50,35,40,50,35,50,40,45,25,40,50,70,70,45,25,25) x3<-c(2,2,3,3,2,3,3,3,3,1,2,2...

R语言判别分析--实验总结

lance～crazy

12-04

5706

文章目录1 基本统计分析2 Logistic模型分析3 Fisher判别分析3.1 lda函数使用方法3.2 类别分析标记3.3 新类预判3.4 效果分析4 距离判别分析4.1 两总体距离判别4.1.1 二次判别函数qda函数使用方法4.1.2 判别4.1.3 分析4.1.4 效果分析4.1.5 预测4.2 多总体距离判别4.2.1 训练预测4.2.2 预测对比4.2.3 分析效果4.2.4 预...

R 判别分析

gezongbo的博客

01-15

3180

1. 数据描述对21个破产企业收集它们在破产前两年的财务数据，对25个财务良好的企业也收集同一时期的数据。数据涉及四个变量： CF_TD（现金流量/总债务）； NI_TA（净收入/总资产）； CA_CL（流动资产/流动债务）； CA_NS（流动资产/净销售额），一个分组变量：企业现状（1：非破产企业，2：破产企业）。 2. 调入数据操作步骤： Case5=read.table("clipboard",header=T) #加载数据 attach(Case5)#绑定数据结果：结果解释：将数据以剪

R语言 判别分析

转玄子因的博客

01-03

1万+

（1）判别分析的基本思想有时会遇到包含属性被解释变量和几个度量解释变量的问题，比如我们希望区分好和差的信用风险，如果有信用风险的度量指标就可以使用多元回归，但若需要判断某人是在好的还是差的一类，就不是回归所要求的类型。当被解释变量是属性变量，解释变量是度量变量时，适合用判别分析。（2）基本要求： ··分组在两组以上； ··每组案例的规模至少在一个以上； ··解释变量必须是可测量的。（3）基...

判别分析在R语言中的实现

FgVector的博客

09-18

573

通过以上步骤，我们可以使用R语言实现判别分析，并评估模型的性能。你可以根据实际需求选择适合的判别分析方法，并使用相应的包进行实现和评估。以上代码提供了基本的示例，你可以根据自己的数据和需求进行相应的修改和调整。希望本文对你有所帮助！判别分析是一种常用的统计方法，用于将样本数据分配到已知类别中。在R语言中，我们可以使用多个包来实现判别分析，例如MASS、caret和lda等。本文将介绍如何使用R语言实现判别分析，并提供相应的源代码。

R语言 判别分析：线性判别、K最邻近、有权重的K最邻近、朴素贝叶斯

程志伟的博客

02-25

3573

关注微信公共号：小程在线关注CSDN博客:程志伟的博客 class包：提供Knn()函数 kknn包：提供kknn()函数及miete数据集（房租信息） kknn函数：实现有权重的K最近邻 knn函数：实现K最近邻算法 klaR包：提供NavieBayes()函数 lda函数：线性判别 MASS包：提供lda()和qda()函数 NavieBayes()函数：实现朴素贝叶斯算法...

「Python」机器学习之线性判别分析（代码，不调包）

cumtLeibnizDavid的博客

08-26

1230

线性判别分析(LDA)算法实现，非sklearn

数学建模笔记（十五）：多元统计分析及R语言建模（判别分析、聚类分析、主成分分析、因子分析，含数据代码注释，均可供运行）

qq_52441682的博客

07-26

9576

数学建模笔记（十五）：多元统计分析及R语言建模（判别分析、聚类分析、主成分分析、因子分析，含数据代码注释，均可供运行）

Rstudio做多元统计分析R语言

qq_61247494的博客

10-18

7139

研究货运总量y（万吨）与工业总产值x1（亿元）、农业总产值x2（亿元）、居民非商品支出x3（亿元）的关系。数据见表4-8.

多元统计分析及R语言建模（第五版）部分课后习题代码演示

lsttttt的博客

12-02

7638

多元统计分析及R语言建模（第五版）部分课后习题代码演示