KNN算法与 R 语言实现
算法原理:需对所有样本点(已知分类+未知分类)进行归一化处理。对未知分类的数据集中的每个样本点依次执行以下操...
算法原理:
需对所有样本点(已知分类+未知分类)进行归一化处理。
对未知分类的数据集中的每个样本点依次执行以下操作:
1、计算已知类别数据集中的点与当前点(未知分类)的距离。
2、按照距离递增排序
3、选取与当前距离最小的k个点
4、确定前k个点所在类别的出现频率
5、返回前k个点出现频率最高的类别作为当前点的预测类别
实例说明:
选择iris数据集为例,iris共有150条数据,内容如下:
head(iris)
## Sepal.LengthSepal.WidthPetal.LengthPetal.Width为分类的四个维度,Species为分类结果
# 1、对iris进行归一化处理,scale归一化的公式为(x-mean(x))/sqrt(var(x))
iris_s
关注 每天都有进步
微信扫一扫关注公众号