无监督学习

利用无标签的数据学习数据的分布或数据与数据之间的关系被称作无监督学习

聚类（clusterinng）

聚类，就是根据数据的“相似性”将数据分为多类的过程，通过计算两个样本之间的“距离”来评估两个不同样本之间的“相似性”,使用不同的方法计算样本间的距离会关系到聚类结果的好坏。

欧氏距离： $d = \sqrt{\sum\limits_{k=1}^n(x_{1k}-x_{2k})}$