Partitioning Based Methods

Kategori: Data Mining , 08 Kasım 2019 , JanFranco


a) Bölümleme tabanlı yöntemler

Belirlenen bir merkeze dayalı kümeler oluşturulmaya çalışılır. Amaç N kadar veriyi k kadar kümeye bölmektir. Her bir veri mutlaka bir kümeye girmelidir yani hiç bir veri açıkta kalmamalıdır. Ve her kümenin en az bir elemanı olmalıdır. Kullanılan algoritmalara örnek vermek gerekirse: K-Ortalamalar, K-Medoid, PAM ve CLARA'dır. Sık kullanılan K-Ortalamalar algoritmasını incelemek gerekirse:

1- k sayısı kadar veri, rastgele şekilde küme merkezi olarak seçilir.
2- Tüm verilerin X ve Y koordinatları için seçilen küme merkezine öklid uzaklığı hesaplanır. Her veri uzaklık hesaplarına göre kendine en yakın merkezle kümelenir.
3- Atanan veriler ile tekrar küme merkezi belirlenir.
4- Küme merkezleri sabit kalana kadar 2. ve 3. adım tekrarlanır.

Algoritmanın avantajları: 

* Anlaması ve gerçekleştirilmesi kolaydır.
* Hesaplama karmaşıklığı diğer yöntemlere göre daha azdır.
* Büyük veri kümelerinde hızlı çalışır.

Dezavantajları:

* Küme sayısının baştan belirtilmesi gerekir.
* Gürültü veya aykırılıkların olduğu durumlarda performans düşer.
* Küme merkezleri her seferinde rastgele seçildiği için algoritma her çalıştığında farklı değerler üretilir.


Sonraki Yazı: Hierarchical Methods
Yorumlar

Henüz bir yorum bulunmuyor.
Yorum bırakın