李航老师《统计学习方法》第十四章聚类方法课后题答案

2022-10-04人工智能111

其他章节答案请参考我的汇总统计学习方法答案汇总，都是自己写的。

1、试写出分裂聚类算法，自上而下地对数据进行聚类，并给出其算法复杂度。

解：
算法流程大致如下：
输入：数据集T，指定需要划分的簇数k
输出：k个数据集的子集

将数据集T中的所有样本作为一个初始簇。
在所有的簇中选择直径最大的簇记为C 0 C_0 C 0 。
计算簇C 0 C_0 C 0 中所有的点到其他点的平均距离最大的点p 0 p_0 p 0 放在一个新的簇C n e w C_{new}C n e w 中，C 0 C_0 C 0 中剩余的样本构成的簇记为C o l d C_{old}C o l d
然后重复一下过程：对C o l d C_{old}C o l d 中的点x x x，如果x x x到C n e w C_{new}C n e w 的距离比x x x 到C o l d C_{old}C o l d 中距离x x x最近的点的距离要小，那么就将点x x x放在新的簇C n e w C_{new}C n e w 中，除了点x x x剩下的点还记为C o l d C_{old}C o l d ，重复这个过程，直到C o l d C_{old}C o l d 中没有点可以放在C n e w C_{new}C n e w 中。
如果不满足停止条件，从步骤2开始继续重复。

时间复杂度是O ( K N 2 M ) O(KN^2M)O (K N 2 M ),其中K K K是类别数，N N N是数据集样本数，M M M是样本的维度。

2、证明类或者簇的四个定义中，第一个定义可以推出其他的三个定义。

证明：

人工智能

猿创征文｜时间序列分析算法之平稳时间序列预测算法和自回归模型(AR)详解+Python代码实现

logistic回归模型—基于R

环境混合物总体效应：加权分位数和回归（WQS）

数学建模学习：岭回归和lasso回归

R 计算均方差MSE(mean squared error)

python数据相关性绘图-散点图正态分布图回归图等及鸢尾花数据集可视化（附Python代码）

基于Lasso回归的实证分析（Python实现代码）

目标检测中边框回归的直观理解 bbox regression

通过R语言实现平稳时间序列的建模–基础（ARMA模型）

【sklearn使用】sklearn中调用R2（回归问题评价指标）的3种方式

【项目实战】Python实现GBDT(梯度提升树)回归模型(GradientBoostingRegressor算法)项目实战

机器学习算法系列（四）- 岭回归算法（Ridge Regression Algorithm）

stata基础–回归，画散点图，异质性分析

机器学习之分类回归树（CART）

机器学习基础：用 Lasso 做特征选择

利用lasso回归建立预测模型并绘制列线图二分类结局资料的lasso回归与列线图绘制

计量经济学笔记6-Eviews操作-自相关的检验与消除（DW、LM检验与FGLS、广义差分变换）

Pytorch：全连接神经网络-MLP回归

机器学习实验——回归预测算法

基于MATLAB的随机森林（RF）回归与变量影响程度（重要性）排序

目录

本页二维码

机器学习算法、Python、数据分析、学习资料 & 面试大汇总（免费送）