因为原理简单,实现方便,收敛速度快输入数据一般需要做缩放,如标准化。

原因很简单,K均值是建立在距离度量上的,因此不同变量间如果维度差别过大,可能会造成少数变量“施加了过高的影响而造成垄断”,基本上现在的K均值实现都是K-means++,速度都不错。