Testing and Validation

Kategori: Data Mining , 09 Kasım 2019 , JanFranco


-Sınama ve Geçerleme

Başarının sınanması için veri kümesinin test ve eğitim olarak ikiye ayrılması gereklidir. İki türlü ayırma yöntemi vardır: Sabit ayırma ve k-katlamalı çapraz doğrulama.

1) Sabit Ayırma: Klasik veri ayırma yöntemidir. Verikümesinin bir kısmı test için bir kısmı eğitim için kullanılır. Genelde %80 - %20 veya %66 - %34 kullanılır.

2) K-Katlamalı Çapraz Doğrulama: Bu yöntemde veri kümesi k sayısı kadar eşit parçaya bölünür ve her parçanın kendi içinde test ve veri kümesi olarak ikiye ayrılır. Örneğin k sayısını 4 seçelim. Bu durumda eğitim ve test aşamaları bu 4 parçaayı da kullanarak gerçekleşir.

Veri Kümesi

Parça 1 - Model1: (Parça 1 + Parça 2 + Parça 3) eğitim kümesi, Parça 4 test kümesi
Parça 2 - Model2: (Parça 1 + Parça 2 + Parça 4) eğitim kümesi, Parça 3 test kümesi
Parça 3 - Model3: (Parça 1 + Parça 3 + Parça 4) eğitim kümesi, Parça 2 test kümesi
Parça 4 - Model4: (Parça 2 + Parça 3 + Parça 4) eğitim kümesi, Parça 1 test kümesi

Bu 4 ayrı modelin aritmetik ortamaları alınarak sistemin genel hatası elde edilir.


Sonraki Yazı: Data Analysis, Python, NumPy
Yorumlar

Henüz bir yorum bulunmuyor.
Yorum bırakın