Random Forest

Kategori: Machine Learning , 03 Aralık 2019 , JanFranco


Bazı durumlarda tek bir algoritma yeterli olmayabilir. Birden fazla regression veya classification algoritmasını birlikte kullanmamız gerekebilir. Bu tekniğe ensemble denmektedir. Bu yazımızda bir ensemble tekniği olan Random Forest algoritmasını göreceğiz. Random forest algoritması arkaplanda decision tree algoritmasını kullanır. Random forest şu şekilde çalışır, tüm veriden tek bir decision tree, karar ağacı çıkarmak yerine, veriyi belirli parçalara bölüp her biri için ayrı ayrı ağaç oluşturur. Bir ağaçlar topluluğu yani orman :). Sonuçlar ise şu şekilde üretiliyor. Örneğin bir predict yapılacak. Eski veri kümemizi hatırlayalım. Boyu x, kilosu y olsun. Bu veri tüm ağaçlara gönderiliyor ve tüm ağaçlar bir tahmin yapıyor. Daha sonrasında bu sonuçların ortalaması alınıyor. Python üzerinden görelim:


import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.ensemble import RandomForestRegressor

df = pd.read_csv('salaries.csv')
print(df)

level = df.iloc[:, [1]].values
salary = df.iloc[:, [2]].values

rfReg = RandomForestRegressor(n_estimators=10, random_state=0)
rfReg.fit(level, salary)

plt.scatter(level, salary)
plt.plot(level, rfReg.predict(level))
plt.show()
random forest


Sonraki Yazı: Metrics
Yorumlar

Henüz bir yorum bulunmuyor.