python中利用Sklearn和Scipy分别实现核密度估计

本文探讨了在Python中利用Sklearn和Scipy库进行核密度估计的方法,包括对离散型和连续型随机变量的理解。通过示例展示了如何使用Sklearn的多种核函数(如均匀、三角、伽马和高斯)进行密度估计,并特别以高斯核为例,利用Scipy绘制概率密度函数曲线。

密度估计问题

由给定样本集合求解随机变量的分布密度函数问题是概率统计学的基本问题之一。解决这一问题的方法有参数估计和非参数估计。非参数估计包含核密度估计。

离散型随机变量

概率函数:就是用函数的形式来表达概率;
概率分布
在这里插入图片描述

概率分布函数(简称分布函数):就是概率函数取值的累加结果,所以它又叫累积概率函数、累积概率分布、累积分布函数。

连续型随机变量

概率函数又称为概率密度函数,某点的概率密度即为概率在该点的变化率;
概率密度函数是分布函数的导函数。

Sklearn实现核密度估计

Sklearn中实现核密度估计的方法:均匀核函数、三角核函数、伽马核函数、高斯核函数等。
以高斯核密度估计为例画出概率密度函数曲线(连续变量):

import numpy as np
import matplotlib.pyplot as plt
from sklearn.neighbors.kde import KernelDensity  # 导入核密度估计
X = X.reshape(-1, 1)  # 转换成2D array
X_plot = np.linspace(0, 0.1, 1000)[:, np.newaxis]  # [:,np.newaxis]  # 也能转换成2D array
kde = KernelDensity(kernel='gaussian', bandwidth=0.75).fit(X)  # 高斯核密度估计
log_
评论 11
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值