Pandalar Nan'ı 0 ile Doldurur

Pandalar Nan I 0 Ile Doldurur



Veri bilimi tipik olarak eksik verileri içerir. Ya tüm satır atılabilir veya satır-sütun kombinasyonuna bir değer eklenebilir. Her satır için belirli bir metriği ortadan kaldırdığı için satırı/sütununu bırakmak saçma olur. 'Sayı Değil' anlamına gelen NaN, bir veri kümesinde eksik olan bir değeri göstermenin tipik yollarından biridir. Amaçlanan sonuçları elde etmek için NaN'nin ele alınması oldukça önemlidir. Öyleyse, Pandas DataFrame'in bir satırındaki veya sütunundaki NaN değerlerini nasıl 0 olarak değiştireceğimizi öğrenelim.

Pandalar NaN Değerlerini Doldurur

Veri çerçevenizdeki bir sütunda NaN veya Yok değerleri varsa, bunları sıfır (0) ile doldurmak için 'fillna()' veya 'replace()' işlevlerini kullanabilirsiniz.

doldurmak()







NA/NaN değerleri, “fillna()” işlevi kullanılarak sağlanan yaklaşımla doldurulur. Aşağıdaki sözdizimi dikkate alınarak kullanılabilir:



Tek bir sütun için NaN değerlerini doldurmak istiyorsanız, sözdizimi aşağıdaki gibidir:




DataFrame'in tamamı için NaN değerlerini doldurmanız gerektiğinde, sözdizimi şu şekildedir:






Yer değiştirmek()

Tek bir NaN değerleri sütununu değiştirmek için sağlanan sözdizimi aşağıdaki gibidir:




Oysa DataFrame'in NaN değerlerinin tamamını değiştirmek için aşağıdaki sözdizimini kullanmamız gerekir:


Bu yazıda, şimdi Pandas DataFrame'imizde NaN değerlerini doldurmak için bu iki yöntemin pratik uygulamasını keşfedecek ve öğreneceğiz.

Örnek 1: Pandas “Fillna()” Yöntemini Kullanarak NaN Değerlerini Doldurun

Bu çizim, verilen DataFrame'deki NaN değerlerini 0 ile doldurmak için Pandas “DataFrame.fillna()” fonksiyonunun uygulamasını göstermektedir. Eksik değerleri tek bir sütunda doldurabilir veya tüm DataFrame için doldurabilirsiniz. Burada, bu tekniklerin her ikisini de göreceğiz.

Bu stratejileri uygulamaya koymak için, programın yürütülmesi için uygun bir platform bulmamız gerekiyor. Bu yüzden “Spyder” aracını kullanmaya karar verdik. Python kodumuza “pandalar” araç setini programa aktararak başladık, çünkü DataFrame'i oluşturmak ve o DataFrame'deki eksik değerleri doldurmak için Pandas özelliğini kullanmamız gerekiyor. Program boyunca 'pd', 'pandaların' takma adı olarak kullanılır.

Artık Panda özelliklerine erişimimiz var. DataFrame'imizi oluşturmak için önce “pd.DataFrame()” fonksiyonunu kullanıyoruz. Bu yöntemi çağırdık ve üç sütunla başlattık. Bu sütunların başlıkları “M1”, “M2” ve “M3” şeklindedir. “M1” sütunundaki değerler “1”, “Yok”, “5”, “9” ve “3”tür. “M2”deki girişler “Yok”, “3”, “8”, “4” ve “6”dır. “M3” ise verileri “1”, “2”, “3”, “5” ve “Yok” olarak saklar. “pd.DataFrame()” yöntemi çağrıldığında bu DataFrame'i depolayabileceğimiz bir DataFrame nesnesine ihtiyacımız var. 'Eksik' bir DataFrame nesnesi oluşturduk ve onu 'pd.DataFrame()' işlevinden aldığımız sonuca göre atadık. Ardından, Python konsolunda DataFrame'i görüntülemek için Python'un “print()” yöntemini kullandık.


Bu kod yığınını çalıştırdığımızda, terminalde üç sütunlu bir DataFrame görüntülenebilir. Burada, üç sütunun hepsinin içlerinde boş değerler içerdiğini gözlemleyebiliriz.


Eksik değerleri 0 ile doldurmak için Pandas “fillna()” fonksiyonunu uygulamak için bazı boş değerler içeren bir DataFrame oluşturduk. Bunu nasıl yapabileceğimizi öğrenelim.

DataFrame'i görüntüledikten sonra Pandas “fillna()” fonksiyonunu çağırdık. Burada eksik değerleri tek bir sütunda doldurmayı öğreneceğiz. Bunun sözdizimi öğreticinin başında zaten belirtilmiştir. DataFrame'in adını verdik ve “.fillna()” işleviyle belirli sütun başlığını belirledik. Bu yöntemin parantezleri arasında boş yerlere gelecek değeri sağladık. DataFrame adı “eksik” ve burada seçtiğimiz sütun “M2”. “fillna()”nın parantezleri arasında verilen değer “0”dır. Son olarak, güncellenmiş DataFrame'i görüntülemek için “print()” fonksiyonunu çağırdık.


Burada, NaN değeri 0 ile dolu olduğu için DataFrame'in “M2” sütununun artık herhangi bir eksik değer içermediğini görebilirsiniz.


Tüm DataFrame için NaN değerlerini aynı yöntemle doldurmak için “fillna()” adını verdik. Bu oldukça basit. DataFrame adını “fillna()” fonksiyonu ile sağladık ve parantezler arasında “0” fonksiyon değerini atadık. Son olarak, “print()” işlevi bize doldurulmuş DataFrame'i gösterdi.


Tüm değerler şimdi 0 ile yeniden doldurulduğundan, bu bize NaN değerleri olmayan bir DataFrame verir.

Örnek 2: Pandas “Replace()” Yöntemini Kullanarak NaN Değerlerini Doldurun

Makalenin bu bölümü, bir DataFrame'deki NaN değerlerini doldurmak için başka bir yöntemi gösterir. Değerleri tek bir sütunda ve eksiksiz bir DataFrame'de doldurmak için Pandaların “replace()” işlevini kullanacağız.

“Spyder” aracında kodu yazmaya başlıyoruz. Öncelikle gerekli kütüphaneleri import ettik. Burada Python programının Pandas yöntemlerini kullanmasını sağlamak için Pandas kütüphanesini yükledik. Yüklediğimiz ikinci kitaplık NumPy ve 'np' olarak adlandırılıyor. NumPy, eksik verileri “replace()” yöntemiyle işler.

Ardından, “vida”, “çivi” ve “matkap” olmak üzere üç sütunlu bir DataFrame oluşturduk. Her sütundaki değerler sırasıyla verilmiştir. “Vida” sütununda “112”, “234”, “Yok” ve “650” değerleri bulunur. “Çivi” sütununda “123”, “145”, “Yok” ve “711” bulunur. Son olarak, 'matkap' sütununda '312', 'Yok', '500' ve 'Yok' değerleri bulunur. DataFrame, 'tool' DataFrame nesnesinde saklanır ve 'print()' yöntemi kullanılarak görüntülenir.


Kayıtta dört NaN değerine sahip bir DataFrame, aşağıdaki çıktı görüntüsünde görülebilir:


Şimdi, DataFrame'in tek bir sütunundaki boş değerleri doldurmak için Pandas “replace()” yöntemini kullanıyoruz. Görev için “replace()” fonksiyonunu çağırdık. DataFrame adı 'tool' ve 'screw' sütununu '.replace()' yöntemiyle sağladık. Parantezleri arasında DataFrame'deki 'np.nan' girişleri için '0' değerini belirledik. Çıktıyı görüntülemek için “print()” yöntemi kullanılır.


Elde edilen DataFrame, 'vida' sütununda NaN girişlerinin 0 ile değiştirildiği ilk sütunu gösterir.


Şimdi tüm DataFrame'deki değerleri doldurmayı öğreneceğiz. DataFrame ismiyle “replace()” yöntemini çağırdık ve np.nan girişleriyle değiştirmek istediğimiz değeri sağladık. Son olarak “print()” fonksiyonu ile güncellenen DataFrame'i yazdırdık.


Bu bize hiçbir eksik kayıt olmadan elde edilen DataFrame'i verir.

Çözüm

Bir DataFrame'deki eksik girdileri ele almak, veri analizi sürecinde karmaşıklığı azaltmak ve verileri meydan okurcasına işlemek için temel bir gerekliliktir ve gerekli bir gerekliliktir. Pandalar bize bu sorunla başa çıkmamız için birkaç seçenek sunar. Bu kılavuzda iki kullanışlı strateji getirdik. Her iki tekniği de sizler için biraz daha anlaşılır ve kolay hale getirmek için örnek kodları çalıştırmak için “Spyder” aracının yardımıyla uygulamaya koyduk. Bu işlevler hakkında bilgi sahibi olmak, Panda becerilerinizi geliştirecektir.