Classification

Kategori: Data Mining , 07 Kasım 2019 , JanFranco


Makine öğrenmesi algoritmaları 3 kategoride incelenir:

* Denetimli Öğrenme  (Supervised)
* Denetimsiz Öğrenme (Unsupervised)
* Takviyeli/Pekiştirmeli Öğrenme (Reinforcement)

1- Denetimli Öğrenme

Denetimli öğrenme methodlarında, verisetindeki verileri ait etiketlenmiş çıktı değerleri mevcuttur ve test kümesi üzerinden bu veriler sınanır. Denetimli öğrenme yöntemleri ikiye ayrılır: Regresyon yöntemi ve sınıflandırma yöntemi

b) Sınıflandırma Yöntemi

Sınıflandırma yöntemi, her verinin hangi sınıfa ait olduğunu bilindiği veri kümesisinin eğitilerek, yeni gelecek bir test verisinin hangi sınıfa ait olduğunun tahmin edilmesi üzerine çalışır. Eğer iki sınıf var ise ikili sınıflandırma, daha fazla sınıf varsa çoklu sınıflandırma denir. Sınıflandırma yöntemleri ikiye ayrılır: Doğrusal sınıflandırma yöntemi, Doğrusal olmayan sınıflandırma yöntemi

b.1) Doğrusal sınıflandırma yöntemi

Doğrusal sınıflandırma yöntemi, örnekleri, dağıldığı uzayda, birbirine yakınlık/uzaklık derecelerine göre sınıflandırırken doğrusal bir yol izler. Eğer uzayımız iki boyutluysa, verileri ayıracak bir doğrusal yol çizilirken, çok boyutlu uzaylarda düzlem çizilir. Bu düzlemler hiper düzlemler denir (hyper surface). Doğrusal sınıflandırma yapan algoritmalara örnek vermek gerekirse: Lojistik regresyon (Logistic regression), Doğrusal diskriminant analizi (Linear discriminant analysis), Kısmi en küçük kareler diskriminant analizi (Partial least squares discriminant analysis)

b.2) Doğrusal olmayan sınıflandırma yöntemi

Eğer verileri doğrusal bir doğruyla veya düzlemle ayıramıyorsak, doğrusal olmayan sınıflandırma yöntemi kullanmalıyız. Örneğin elimizdeki uzayda iki sınıf var ve birinci sınıf orijin etrafında elips şeklinde toplanmış olsun. İkinci sınıf da bu elipsin daha da dışında başka bir elip şeklinde toplanmış olsun. Bu verileri doğrusal bir yöntemle ayıramayız. Örneğin bu problem için daire denkleminden faydalanabiliriz. Bu yöntem uygulandığında uzayımızda birinci sınıf düz bir biçimde dizilir. İkinci sınıf da bu sınıfın biraz üstünde düz bir şekilde sınıflanır. Bu iki sınıf %100 doğru olacak şekilde birbirinden ayrılabilir. Bu gibi dönüşümleri sağlayan Çekirdek fonksiyonlar (kernel functions) mevcuttur. Bu sayede elle yapmak zorunda kalmayız ve eski hali bozulan veriler yeniden eski hale getirilebilir. Doğrusal olmayan sınıflandırma algoritmalarına örnek vermek gerekirse: Naive Bayes, Kuadratik Diskriminant Analizi (Quadratic Discriminant Analysis), Karışım Diskriminant Analizi (Mixture Discriminant Analysis).


Sonraki Yazı: Measuring Performance of Classification
Yorumlar

Henüz bir yorum bulunmuyor.
Yorum bırakın