Zamanında NYC'deki köpeklerin dağılımına bakmak için Python kullanmıştım. O kısım [[New York ve Popüler Köpekler|burada]].
Şimdi ise yine Python üzerinden fakat AI yardımı ile işi kolaylaştırmaya çalışacağım.
[[https://catalog.data.gov/dataset/nyc-dog-licensing-dataset|Şuradan]] CSV olarak NYC'ye kayıtlı köpeklerin verisini çekip benzer işlemlerle veri setini temizleyeceğim fakat öncesinde yüklenecekleri halledeyim dedim. pandas yok ise o da yüklenecek tabii.
```python
pip install pandas
pip install pandasai
import pandas as pd
from pandasai import PandasAI
from pandasai.llm.openai import OpenAI
```
Dosya adı nydogs.csv olmak üzere;
```python
df = pd.read_csv('nydogs.csv') # içeri aktardım
new_df = df.dropna() # boşları attım
DataSet = NYCData[['BreedName', 'AnimalGender', 'AnimalBirthYear', 'ZipCode']] # ilgilendiğim sütunları çektim
NYCData = DataSet[DataSet.BreedName != 'Unknown'] # ırkı bilinmeyenleri verisetinden çıkardım
```
pandasAI openAI API'si kullanıyor, [[OpenAI ile Metin ya da Ders Notu Oluşturma|buradaki]] yöntem ile key alabilirsiniz. sk ile başlayan bu keyi tanımlıyorum.
```python
OPENAI_API_KEY = "sk-......."
llm = OpenAI(api_token=OPENAI_API_KEY)
```
artık gerisi biraz da size kalmış, örneğin ben bir grafik elde etmek için baya bir takla atmıştım önceki yazıda, şimdiki hedef bu kadar uğraşmasam da olur muydu sorusuna yönelik: ![[New York ve Popüler Köpekler#^c6a632]]
Temel soruları gayet güzel cevaplıyor.
```python
andas_ai.run(DatasetN, prompt="what is the total number of labrador retrievers?")
```
>[!example] Çıktı
>('Total number of Labrador Retrievers:', 15688)
şimdi ise çok zorlamadan bir grafik istedim, veri biraz daha güncel ama olsun, mantık bu şekilde işliyor.
```python
pandas_ai.run(DatasetN, prompt="En popüler 10 köpek ırkının dağılımını gösteren bir grafik hazırla, bar plot olsun")
```
![[Pasted image 20230612093302.png]]
Fena değil, İngilizce çıktı veriyor ama olsun, modifiye etmek kolay olacaktır. bazı modüller şu an entegre edilmemiş fakat bard'a veya chatgpt'ye bile aktararak ileri istatistiksel/ekonometrik analizler mümkün. genel anlamda veri hakkında fikir veriyor şimdilik ama potansiyeli çok daha fazla. takip etmekte fayda var. bu da bağlantı: [[bağlantı|pandasai]].
aslında oluşturduğu grafiğin python kodunu verebilse de iyi olurdu ama yapamıyor şimdilik. bu arada köpek ırklarının sıralaması da değişmemiş, bu da beklenen bir şey gerçi.