Data Analysis, Python, NumPy

Kategori: Data Mining , 09 Kasım 2019 , JanFranco


Bu yazımda Python'da NumPy kütüphanesinin kullanımını göreceğiz. Kütüphaneyi import ederek başlayalım:


import numpy as np
Dizi oluşturalım:


numbers = np.array([1,2,3,4,5])
zeros ve ones methodları ile 0 ve 1 matrisleri oluşturabiliriz. Bu matrisi örneğin 5 ile çarparsak tüm elementler 5 olacaktır. Ayrıca boyut da verebiliriz. eye methodu ile birim matris oluşturabiliriz. İçine gönderdiğimiz parametre kadar sayır ve sütun sayısına sahip olur.


zeros = np.zeros((3,3))
ones = np.ones(8) * 5
eye = np.eye(5)
arange methodu ile başlangıç, bitiş sayılarını ve artış mikyarını vererek bir dizi oluşturabiliriz.


numbers = np.arange(10,50,5)
linspace methodu ile başlangıç, bitiş sayılarını ve kaç sayı olacağını girerek bir dizi oluşturabiliriz.


numbers = np.linspace(1,10,20)
rand fonksiyonu 0 ile 1 arasında değerler üretir. randn -1 ile 1 arasında değerler üretir. Aldıkları parametreler matris boyutlarıdır. randint ise rastgele sayılar üretir. Parametre olarak minimum, maximum sayıları ve boyutları alır.


rand = np.random.rand(2, 2)
randn = np.random.randn(1,5)
randint = np.random.randint(1, 10, (5,5))

numbers = np.arange(24)
numbers = numbers.reshape(6,4)
arange methodu ile 1x24 lük bir matris oluşturduk. reshape ile bu matrisi 6x4 lük bir matrise dönüştürdük.


numbers = np.array([1,2,23,100,-5,45])
print(numbers.max())
print(numbers.max(axis=1))
print(numbers.min())
print(numbers.argmax())
print(numbers.argmin())
max ve min methodları max ve min sayıları return eder. argmax ve argmin methodları bu sayıların indexlerini return eder. Max, min methodlarına axis değeri verdiğimizde satırlardaki veya sütunlardaki max, min değerleri bulup listeye atar.


numbers = np.arange(10) ** 2
print(numbers[1:3])
1. indexten başlayıp, 3. indexe kadar bastırdık. (3. index dahil değil)


numbers = np.random.random(16)
numbers = numbers.reshape(4,4)
print(numbers[0:2,2])
0. satırdan başlayıp 2. satıra kadar olan 2. sütunun elemanlarını bastırdık. 2. satır dahil değil.


print(numbers[:,3])
Tüm satırlardaki 3. sütun elemanlarını bastırdık.


for elements in np.ndenumerate(numbers):
    print(elements)
Tüm elementleri, satır ve sütun index bilgisiyle bastırdık.


a = np.array([2, 3])
b = np.array([1, 5])

print(np.hstack((a,b)))
print(np.vstack((a,b)))
hstack ile yatayda, vstack ile dikeyde birleştirme işlemi yaptık.


a = np.array([[1,2], [3,4]])
b = np.array([[5,6], [7,8]])

print(np.concatenate((a,b), axis=0))
print(np.concatenate((a,b), axis=1))
concatenate methodu, matrisleri birleştirir. axis = 0 bilgisini verirsek yatayda, 1 verirsek dikeyde birleştirir.


sum = numbers.sum()
sum_y = numbers.sum(axis=0)
sum_x = numbers.sum(axis=1)
Matristeki elemanların toplamı için sum methodunu kullanırız. Sum methoduna axis bilgisi verilerek satırların toplamı veya sütunların toplamı şeklinde bir liste oluşturbiliriz. Örneğin axis = 0 dediğimizde her bir sütunu toplar ve sonucu bir listeye atar.


mean = numbers.mean()
variation = np.var(numbers)
median = np.median(numbers)
standardDev = np.std(numbers)
Bir matrisin ortalamasını, varyansını, medyanını, standart sapmasını bu methodlar ile bulabiliriz.


uniqueValues = np.unique(numbers)
Bir matristeki eşsiz elemanları bu şekilde bulabiliriz. Örneğin matriste İstanbul İstanbul Ankara değerleri var. Bu method çağırıldığı zaman döndüreceği değer İstanbul Ankara olur.


Sonraki Yazı: Data Analysis, Python, Pandas
Yorumlar

Henüz bir yorum bulunmuyor.