机器学习算法：UMAP 深入理解

原创

已于 2022-11-13 09:42:42 修改 · 1w 阅读

·

8

·

标签

#算法 #python

于 2022-11-12 15:27:50 首次发布

本文详细介绍了UMAP算法，一种在高维数据可视化中优于t-SNE的工具。UMAP以其快速计算速度、更好的全局结构保留和易于理解的参数调整受到青睐。通过实例和理论分析，对比了UMAP和t-SNE在处理复杂数据集时的性能差异，以及如何选择合适的参数以优化降维效果。

导读

降维是机器学习从业者可视化和理解大型高维数据集的常用方法。最广泛使用的可视化技术之一是 t-SNE，但它的性能受到数据集规模的影响，并且正确使用它可能需要一定学习成本。

UMAP 是 McInnes 等人开发的新算法。与t-SNE相比，它具有许多优势，最显着的是提高了计算速度并更好地保留了数据的全局结构。在本文中，我们将了解UMAP背后的理论，以便更好地了解该算法的工作原理、如何正确有效地使用它，以及与t-SNE进行比较，它的性能如何。

UMAP projection

那么，UMAP带来了什么？最重要的是，UMAP速度很快，在数据集大小和维度方面都可以很好地扩展。例如，UMAP可以在不到 3 分钟的时间内降维 784 维、70,000 点的 MNIST 数据集，而 scikit-learn 的t-SNE需要 45 分钟。此外，UMAP倾向于更好地保留数据的全局结构。这可以归因于UMAP强大的理论基础，使

最低0.47元/天解锁文章

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。