ъ
Основная задача кластерного анализа — разбиение исходного набора объектов на группы (кластеры) таким образом, чтобы:
![]() |
![]() |
---|
min_pts
. interact(dbscan_demo, eps=FloatSlider(min=0.1, max=10, step=0.05, value=1), min_pts=IntSlider(min=2, max=15, step=1, value=5))
<function __main__.dbscan_demo>
В одномерном случае $$ p(x | \theta) = \mathcal{N}(x|\mu, \sigma) = \frac{1}{\sqrt{2\pi\sigma^2}}\exp\left({-\frac{(x-\mu)^2}{2\sigma^2}}\right) $$ В многомерном $$ p(x | \theta) = \mathcal{N}(x|\mu, \Sigma) = \frac{1}{(2\pi\Sigma)^{1/2}}\exp\left(-\frac{1}{2}(x-\mu)^\top\Sigma^{-1}(x-\mu)\right) $$
$p(x|\theta_{z})$ могут пренадлежать разным семействам вероятностных распределений
где
где
Adjusted Rand Index - корректировка Rand index:
$$\text{ARI}(\hat{\pi},\pi^*) = \frac{\text{Rand}(\hat{\pi},\pi^*) - \text{Expected}}{\text{Max} - \text{Expected}}$$Пусть дана кластеризация в $K$ кластеров, и объект $i$ попал в $C_k$