失效链接处理 |
深入出Python机器学习(fn) PDF 下蝲
相关截图Q?/strong>
![]() 主要内容Q?/strong>
我们的数据集里面有一半是“?rdquo;Q图中浅色的炏V,另一半是“ ?rdquo;Q图中深色的点)?/span>
现在有了一个新的数据点Q颜色未知,我们怎么判断它属于哪一个分cdQ?/span>
对于K 最q邻法来说Q这个问题就很简单:(x)新数据点谁最q,和谁属于同一c,从图
3-1 中我们可以看出,新数据点距离?/span>8 炚w方向的浅色数据点最q,那么理所应当圎ͼq个
新数据点应该属于色分类了,如图3 -2 所C?/span>
看v来, K 最q邻法真是够简单的Q这么轻村ְ完成了分cȝ工作。别急,我们q没说完?/span>
刚才只是丄最单的例子Q选的最q邻数等?/span>1 。但如果我们在模型训l过E中让最q邻?/span>
{于1 的话Q?那么非常可能?x)犯?ldquo; 一叉目,不见泰山 Q的错误Q试想一下,万一和新?/span>
据点最q的数据恰好是一个测定错误的点呢Q?/span>
所以需要我们增加最q邻的数量,例如把最q邻数增加到3 Q然后让新数据点的分cd3 个当
|