寻找与这个待分类的样本在特征空间中距离最近的K个已标记的样本作为参考,来帮助我们做出分类决策
|
|
该模型没有参数训练的过程,只是根据测试样本在训练数据的分布直接做出分类决策,因此KNN属于无参数模型,正是这样的决策算法,导致了其非常高的计算复杂度和内存消耗 。因为该模型每处理一个测试样本,都需要对所有预先加载在内存的训练样本进行遍历,逐一计算相似度、排序并且选取K个最近邻训练样本的标记,进而做出分类决策。这是平方级别的算法复杂度 ,一旦数据规模稍大,使用者便需要权衡更多计算时间的代价。
Anne.github.io
寻找与这个待分类的样本在特征空间中距离最近的K个已标记的样本作为参考,来帮助我们做出分类决策
|
|
该模型没有参数训练的过程,只是根据测试样本在训练数据的分布直接做出分类决策,因此KNN属于无参数模型,正是这样的决策算法,导致了其非常高的计算复杂度和内存消耗 。因为该模型每处理一个测试样本,都需要对所有预先加载在内存的训练样本进行遍历,逐一计算相似度、排序并且选取K个最近邻训练样本的标记,进而做出分类决策。这是平方级别的算法复杂度 ,一旦数据规模稍大,使用者便需要权衡更多计算时间的代价。