机器学习(二)

无监督学习

利用无标签的数据学习数据的分布或数据与数据之间的关系被称作无监督学习

  • 有监督学习和无监督学习的最大区别在于数据是否有标签
  • 无监督学习最常用的场景是聚类(clustering)和降维(Dimension Reduction)

聚类(clusterinng)

聚类,就是根据数据的“相似性”将数据分为多类的过程,通过计算两个样本之间的“距离”来评估两个不同样本之间的“相似性”,使用不同的方法计算样本间的距离会关系到聚类结果的好坏。

欧式距离

欧氏距离: