Pandalar Benzersiz Veri Çerçevesi

Pandalar Benzersiz Veri Cercevesi



Veri biliminde kullanılan en popüler Python kütüphanesine Pandalar denir. Python programcılarına yüksek performanslı, kullanıcı dostu ve veri analizi araçları sunar. Temel işlevleri ve bunları nasıl kullanacağınızı anladığınızda, Pandalar verileri değiştirmek için güçlü bir araçtır. 'Pandalarda', verileri tablo biçiminde depolamak için standart yöntemler DataFrame'lerdir. 'pandalar' DataFrame sütunundaki benzersiz değerleri elde etmek için bazı 'pandalar' yöntemlerini kullanabiliriz. DataFrame'in sütunlarında benzersiz değerler almamız gerektiğinde ve 'pandalar' DataFrame'in sütunundaki değerlerin tekrarlanmasını istemediğimizde, bunun için 'pandaların' sağladığı yöntemleri kullanabiliriz. DataFrame'in 'pandalar' sütununda benzersiz değerler elde etmek için bazı örnekler ve çıktılarla birlikte bu kılavuzdaki bu tür yöntemlere bakalım.

“Pandalar” DataFrame Sütunlarında Benzersiz Değerler Alma Yöntemleri

“Pandas” DataFrame'in sütunlarındaki benzersiz değerleri elde etmek için iki yöntem kullanabiliriz. Yinelenen değerleri bırakırız ve yalnızca DataFrames sütunlarındaki benzersiz değerleri alırız. Bu görevi yapmak için 'pandaların' sağladığı yöntemler şunlardır:







  • Unique() yöntemini kullanarak.
  • drop_dupliactes() yöntemini kullanarak.

Şimdi, “pandalar” DataFrame sütunlarındaki benzersiz değerleri almak için “pandalar” kodlarında her iki yöntemi de kullanacağız.



Örnek # 01

Burada 'Spyder' uygulaması, 'pandalar' DataFrame sütunlarında benzersiz değerleri elde etmemize yardımcı olan bu yöntemleri kullanmak için bu 'pandalar' kodlarını oluşturmak için kullanılır. DataFrame'i oluşturmadan önce 'pandas' kodu için gerekli olan 'pandas' modüllerini import etmemiz gerekiyor. “İthalat” terimini kullanarak ve “pandaları pd olarak” yerleştirerek bu modülleri içe aktarıyoruz.



Artık “pd” yardımıyla “pandalar” fonksiyonlarını veya yöntemlerini hızlıca elde edebiliriz. Daha sonra “Name” eklediğimiz “Subject_data”yı koyuyoruz ve “Name”e de ismin “Roman, William, Peter, Smith, John, Milli, Thomas ve James” olan verilerini ekliyoruz. Ardından konu verilerini “Matematik, Ekonomi, Fen, Matematik, İstatistik, İstatistik, İstatistik ve Bilgisayar” olan “Subj” içerisine ekliyoruz. Ardından bu “Subject_data”yı “pd.DataFrame()” yöntemini kullanarak “Subject_df” DataFrame'e dönüştürüyoruz. “Subject_df”yi “print()” yöntemine yerleştiriyoruz, böylece terminalde gösterilecek.





Şimdi, 'pandalar' DataFrame'in 'Subj' sütunundaki benzersiz değerleri almak istiyoruz. Bu amaçla, burada “unique()” yöntemini kullanıyoruz ve aşağıda gösterildiği gibi sütunun adını ve ayrıca DataFrame'in adını ekliyoruz. Bu yöntemi “print()”e ekliyoruz, böylece sonuç terminalde de gösterilecektir.



Şimdi bu kodun sonucunu almak için “Shift+Enter” a basıyoruz ve bu kodun terminalde render edilmesi ve burada da tüm değerleri ile DataFrame'in bulunduğu gösterilmektedir. Bu, koda eklediğimiz orijinal DataFrame'dir ve altında “Subj” sütununun benzersiz değerlerini görüntüler. Yinelenen değerleri düşürür ve DataFrame'in 'Subj' sütununun benzersiz değerlerini görüntüler.

Örnek # 02

Bazı bilgileri içeren “Sample_list”i oluşturuyoruz. Bu listeyi DataFrame'e dönüştürdüğümüzde ilk sütun olarak gelecek olan “Layla, 21, 28, 31, 14 ve 39” ekliyoruz. Ardından, DataFrame'in ikinci satırı olarak “Lusy, 31, 25, 34, 26 ve 21” ekliyoruz. Bundan sonra DataFrame'in üçüncü ve dördüncü sıraları olacak “Peter, 38, 20, 20, 35 ve 24” ve “Layla 38, 23, 39 24, 23” var. Ayrıca “Stella, 21, 24, 24, 28, 31”, “Layla, 33, 32, 26, 30, 25” ve ayrıca “Peter, 21, 21, 31, 21, 29” olmak üzere üç veri daha ekledik. .

Şimdi burada “pd.DataFrame()” fonksiyonunu koyarak “Sample_list”i DataFrame ismi olan “DF_Sample”a çeviriyoruz. Ayrıca bu DataFrame'in kolonlarının isimlerini de belirledik ve bu isimler “Name, Ass_1, Ass_2, Ass_3, Ass_4 ve Ass_5” şeklinde. Ardından, DataFrame “DF_Sample”ın görüntülenmesine yardımcı olan “print()”i kullanırız. Şimdi, DataFrame sütunundaki benzersiz değerleri almak için bu örnekte başka bir yöntem kullanıyoruz. Bu yöntem, “pandalar”ın “drop_duplicates()” yöntemidir.

“drop_duplicates()” yönteminde DataFrame'in sütunundaki benzersiz değerleri almak istediğimiz sütunun adını belirliyoruz. Bu sütundaki mükerrer değerleri “drop_duplicates()” yöntemi yardımıyla bırakarak “Name” sütununun benzersiz değerlerini alıyoruz ve buradaki “print()” işlevini kullanarak bu benzersiz değerleri oluşturuyoruz.

“drop_duplicates()” yöntemi uygulandıktan sonra çoğaltılan isimler atılır ve benzersiz değerler oluşturulur. “Layla” adının “Ad” sütununun üç hücresinde göründüğünü not edebilirsiniz. Ancak bu sütuna “drop_duplicates()” yöntemi uygulandığında tüm mükerrer değerler atılır ve ekranda bir “Layla” ismi belirir. Yinelenen değerleri bıraktıktan sonra, bu 'Ad' sütunundaki benzersiz değerleri içeren yeni DataFrame belirdi. Bu şekilde “drop_duplicates()” yöntemi yardımıyla yinelenen değerleri bırakabilir ve DataFrame'in sütunundaki benzersiz değeri alabiliriz.

Örnek # 03

Yine aynı DataFrame kullanılıyor ve şimdi burada “unique()” yöntemini uyguluyoruz. “unique()” yöntemiyle, benzersiz değerleri elde etmek için bu “unique()” yöntemini uygulamak istediğimiz DataFrame'in adının yanı sıra sütunun adını da yerleştiririz. Bu, yalnızca o sütunun benzersiz değerlerini oluşturur ve bu değerleri DataFrame biçiminde göstermez.

Burada DataFrame, “Name” sütununda yedi değer içeriyor ancak “unique()” yöntemini bu sütuna uyguladığımızda sadece dört değer çıktı ve bunlar o sütunun benzersiz değerleridir. Yinelenen değerler oluşturmaz.

Örnek # 04

Bu örnekte oluşturduğumuz DataFrame “F_G_df” dir. Bu DataFrame'e “My_fruits” ve “my_Vegs” ekliyoruz. 'My_fruits' sütunu 'Elma, Portakal, Elma, Armut, Liçi, Elma, Elma, Armut ve Elma' içerir. Ardından, “Chilli, Bringle, Carrot, Patates, Patates, Havuç, Soğan, Sarımsak ve Zencefil” olan sebzelerin isimlerini içeren “My_Vegs” var. Bu DataFrame yalnızca iki sütun içerir.

Şimdi, 'unique()' yönteminin yardımıyla her iki sütundaki benzersiz değerleri alıyoruz. DataFrame'in adından bahsediyoruz. Ardından, sütunun ilk sütun adını girin. Daha sonra append() metodunu kullanıyoruz. Bu eklemede yine DataFrame adını ve ikinci sütun adını yerleştirip “unique()” yöntemini yerleştiriyoruz. Bu, her iki sütunun benzersiz değerlerini alacak ve ardından her iki sütunun benzersiz değerlerini ekleyecek ve bunları ekranda gösterecektir.

DataFrame önce tüm değerleri içeren işlenir. Bundan sonra “unique()” yöntemi uygulanarak her iki sütunun benzersiz değerleri aşağıda işlenir. Bu kodda, “unique()” yöntemini kullanarak DataFrame'in çoklu sütunlarındaki benzersiz değerleri alıyoruz.

Çözüm

DataFrame sütunundaki benzersiz değerleri almanın tam açıklaması bu kılavuzda bulunur. DataFrame sütununun benzersiz değerlerini elde etmemize yardımcı olan “unique()” ve “drop_duplicates()” yöntemlerini tartıştık. Kodlarımızda bu yöntemleri kullanarak “pandalar” kodunda bu yöntemleri nasıl kullanacağımızı araştırdık. Bu kılavuzda farklı örnekler gösterdik ve 'unique()' yönteminin yanı sıra 'drop_duplicates()' yöntemini kullanarak bir sütunun benzersiz değerlerini nasıl alacağınızı gösterdik. Bu kılavuzdaki “unique()” yöntemini kullanarak birden çok sütunda benzersiz değerlerin nasıl elde edileceğini de araştırdık.