Pandas, Series

Kategori: Python , 11 Eylül 2019 , JanFranco


Pandas, data manipülasyonu ve analizi için kullanılan, Python için yazılmış geniş bir kütüphanedir. Aşağıdaki komut ile kütüphaneyi kolayca indirebiliriz:


pip install pandas
Kütüphaneyi import ederek başlayalım:


import pandas as pd
Bir Pandas serisi oluşturalım. Pandas serisi oluşturmak için Series sınıfını kullanabiliriz. Parametre olarak verileri göndermeliyiz. Eğer index göndermezsek veriler 0, 1, 2, 3 şeklinde otomatik indexlenir:


labelsList = ["Jan Franco", "Jane Franco", "John Doe", "Jane Doe"]
dataList = [10, 20, 30, 40]

print(pd.Series(data=labelsList, index=dataList))
print(pd.Series(data=labelsList))
>>
10     Jan Franco
20    Jane Franco
30       John Doe
40       Jane Doe
dtype: object
0     Jan Franco
1    Jane Franco
2       John Doe
3       Jane Doe
dtype: object
Veri olarak liste gönderebileceğimiz gibi sözlük de gönderebiliriz. Ayrıca index olarak sadece sayı göndermek zorunda değiliz:


dictList = {"Jan Franco": 10, "Jane Franco": 20}
print(pd.Series(data=dictList))
print(pd.Series(data=[10, 20, 30, 40], index=["A", "B", "C", "D"]))
>>
Jan Franco     10
Jane Franco    20
dtype: int64
A    10
B    20
C    30
D    40
dtype: int64
İki seriyi toplayabiliriz. Aynı indexteki değerler toplanır, eğer farklı indexler varsa NaN değeri atanır. NaN açılımı not a number yani bir sayı değil demektir:


s2017 = pd.Series(index=["Wheat", "Corn", "Strawberry", "Plum"], data=[12, 6, 6, 12])
s2018 = pd.Series(index=["Wheat", "Plum", "Cherry", "Corn"], data=[12, 6, 6, 12])
total = s2017 + s2018
print(total)
>>
Cherry         NaN
Corn          18.0
Plum          18.0
Strawberry     NaN
Wheat         24.0
dtype: float64
Belirli bir indexteki değeri almak için:


print("Plum: ", total["Plum"])
>>
Plum:  18.0


Sonraki Yazı: Pandas, DataFrames
Yorumlar

Henüz bir yorum bulunmuyor.
Yorum bırakın