KNN算法与 R 语言实现

 

算法原理:需对所有样本点(已知分类+未知分类)进行归一化处理。对未知分类的数据集中的每个样本点依次执行以下操...



算法原理

需对所有样本点(已知分类+未知分类)进行归一化处理。

对未知分类的数据集中的每个样本点依次执行以下操作:

1、计算已知类别数据集中的点与当前点(未知分类)的距离。

2、按照距离递增排序

3、选取与当前距离最小的k个点

4、确定前k个点所在类别的出现频率

5、返回前k个点出现频率最高的类别作为当前点的预测类别

实例说明:

选择iris数据集为例,iris共有150条数据,内容如下:

head(iris)



## Sepal.LengthSepal.WidthPetal.LengthPetal.Width为分类的四个维度,Species为分类结果

# 1、对iris进行归一化处理,scale归一化的公式为(x-mean(x))/sqrt(var(x))

iris_s


    关注 每天都有进步


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册

归一化 相关文章