Zamanında NYC'deki köpeklerin dağılımına bakmak için Python kullanmıştım. O kısım [[New York ve Popüler Köpekler|burada]]. Şimdi ise yine Python üzerinden fakat AI yardımı ile işi kolaylaştırmaya çalışacağım. [[https://catalog.data.gov/dataset/nyc-dog-licensing-dataset|Şuradan]] CSV olarak NYC'ye kayıtlı köpeklerin verisini çekip benzer işlemlerle veri setini temizleyeceğim fakat öncesinde yüklenecekleri halledeyim dedim. pandas yok ise o da yüklenecek tabii. ```python pip install pandas pip install pandasai import pandas as pd from pandasai import PandasAI from pandasai.llm.openai import OpenAI ``` Dosya adı nydogs.csv olmak üzere; ```python df = pd.read_csv('nydogs.csv') # içeri aktardım new_df = df.dropna() # boşları attım DataSet = NYCData[['BreedName', 'AnimalGender', 'AnimalBirthYear', 'ZipCode']] # ilgilendiğim sütunları çektim NYCData = DataSet[DataSet.BreedName != 'Unknown'] # ırkı bilinmeyenleri verisetinden çıkardım ``` pandasAI openAI API'si kullanıyor, [[OpenAI ile Metin ya da Ders Notu Oluşturma|buradaki]] yöntem ile key alabilirsiniz. sk ile başlayan bu keyi tanımlıyorum. ```python OPENAI_API_KEY = "sk-......." llm = OpenAI(api_token=OPENAI_API_KEY) ``` artık gerisi biraz da size kalmış, örneğin ben bir grafik elde etmek için baya bir takla atmıştım önceki yazıda, şimdiki hedef bu kadar uğraşmasam da olur muydu sorusuna yönelik: ![[New York ve Popüler Köpekler#^c6a632]] Temel soruları gayet güzel cevaplıyor. ```python andas_ai.run(DatasetN, prompt="what is the total number of labrador retrievers?") ``` >[!example] Çıktı >('Total number of Labrador Retrievers:', 15688) şimdi ise çok zorlamadan bir grafik istedim, veri biraz daha güncel ama olsun, mantık bu şekilde işliyor. ```python pandas_ai.run(DatasetN, prompt="En popüler 10 köpek ırkının dağılımını gösteren bir grafik hazırla, bar plot olsun") ``` ![[Pasted image 20230612093302.png]] Fena değil, İngilizce çıktı veriyor ama olsun, modifiye etmek kolay olacaktır. bazı modüller şu an entegre edilmemiş fakat bard'a veya chatgpt'ye bile aktararak ileri istatistiksel/ekonometrik analizler mümkün. genel anlamda veri hakkında fikir veriyor şimdilik ama potansiyeli çok daha fazla. takip etmekte fayda var. bu da bağlantı: [[bağlantı|pandasai]]. aslında oluşturduğu grafiğin python kodunu verebilse de iyi olurdu ama yapamıyor şimdilik. bu arada köpek ırklarının sıralaması da değişmemiş, bu da beklenen bir şey gerçi.