K-近邻算法
k近邻算法通过选择样本集中前k个最相似的数据,这也是k-近邻算法中k的出处,通常k不大于20的整数,
kNN算法步骤:
- 计算已知数据集中的点与当前点之间的距离
- 按照距离递增次序排序
- 选取与当前距离最小的k个点
- 确定前k个点所在类别的出现频率
- 返回前k个点出现频率最高的类别作为当前点的预测分类
预测约会网站配对
1 | # -*- coding: UTF-8 -*- |
手写识别系统
1 | # -*- coding: UTF-8 -*- |
总结
K-近邻算法 简单有效 但是执行效率低,占用大量存储空间,而且必须对数据集中的每个数据计算距离值,耗时。