Pandalar Toplamı Sütunu

Pandalar Toplami Sutunu



'Bu makale, Python kullanarak bir Pandas DataFrame'deki tüm veya belirli sütunların nasıl toplanacağını gösterecek. DataFrame.sum() işlevi, bu öğreticinin sayısız örneğinde birkaç yardımcı parametreyle birlikte kullanılacaktır.”

Bu eğitim bittiğinde, şunları nasıl yapacağınızı biliyor olabilirsiniz:







    • Pandalarda veri çerçevesi Sütununun toplamını bulun.
    • Veri çerçevesi sütunlarını birlikte ekleme
    • Belirtilen Koşulu karşılayan bir Panda Veri Çerçevesine Sütunlar ekleyin.
    • Veri çerçevesinin verilerini grupladıktan sonra toplamı belirleyin.

Dataframe Sütunlarının Toplamı Nasıl Belirlenir?

Pandalar'daki “dataframe.sum()” işlevi, belirtilen eksen için toplam toplamı döndürür. Girdi dizinin bir ekseniyse, işlev her sütunun değerlerini ayrı ayrı ekler, ardından her sütun için aynısını yaparak her sütundaki verilerin/değerlerin toplamını depolayan bir seri döndürür. Ek olarak, eksik değerleri yok sayarak veri çerçevesinin toplamının hesaplanmasını destekler.



Sözdizimi: DataFrame.sum(eksen = Yok, atlama = Yok, düzey = Yok, numeric_only = Yok, min_count = 0, **kwargs)



Neresi,





eksen: {sütunlar (1), dizin (0)}

emir: Sonucu hesaplarken NA/boş değerleri yok sayın.



seviye: Belirtilen eksen hiyerarşikse (bir çoklu indeks), bir Seriye dönüştürmeden önce belirli bir indeks seviyesine kadar sayın.

sayısal_yalnızca: Sadece float, int ve boole sütunları kabul edilebilir. Hiçbiri ise, her şeyi kullanmayı deneyin; değilse, yalnızca sayısal veriler. Seriler için uygulanmadı.

min_count: İşlemi tamamlamak için gereken olası değerlerin sayısı. Min_count değerinden daha az NA olmayan değer varsa, sonuç NA olacaktır.

İadeler: DataFrame (seviye belirtilmişse) veya Seri.

Örnek # 01: Bir Veri Çerçevesi Sütununun ve Tüm Sütunların Toplamını Belirleyin

İlk önce, veri toplamını bulabileceğimiz geçerli veri türleri, yani int, float, vb., sütun veya sütunlarla bir veri çerçevesi istedik. Veri çerçevesi, pd.DataFrame() işlevi kullanılarak oluşturulacaktır.


Gerekli veri çerçevesini pd.DataFrame() fonksiyonunun içindeki bir python sözlüğünden oluşturduk. Yukarıda oluşturulan veri çerçevesinde, “Ad”, “gün1”, “gün2” ve “gün3” olmak üzere dört sütun vardır. Dört sütundan üç sütun, yani 'gün1', 'gün2' ve 'gün3', veri değerleri (4, 4, 3, 2, 4, 6, 5, 3), (2, 4, sırasıyla 5, 2, 3, 4, 6, 2) ve (7, 4, 3, 5, 6, 2, 1, 4). Sadece bu üç sütunun toplamını bulabiliriz. Her iki serinin (yani bir sütun) ve tüm veri çerçevesinin toplamı, sum() yöntemi kullanılarak belirlenebilir. Pandalar sütunundaki tüm verilerin nasıl toplanacağını öğreterek başlayalım.


Toplamı belirlemek için “day2” sütununda sum() yöntemini kullandık. İşlev, 28 toplam değerini döndürdü. Buna benzer şekilde, her bir Veri Çerçevesi sütununun toplamını belirleyebiliriz. Tüm veri çerçevesinde sadece sum() yöntemini kullanmak bunu başaracaktır.


Görüldüğü gibi “day1” sütununun toplamı 31'dir; 'gün2' için toplam değer 28'dir, oysa 'gün3' sütunu için toplam değer 32'dir.

Örnek # 02: Veri Çerçevesi Sütun Değerlerini Birlikte Özetlemek için sum() İşlevini Kullanma

Önceki örneğin çıktısından da görebileceğiniz gibi, işlev, toplamı oluşturan gerçek veri çerçevesi sütun verilerini döndürmedi. Ancak, bir DataFrame sütununa 'DataFrame.sum()' yöntemini atayarak, toplam sütunu da dahil olmak üzere DataFrame'deki her sütuna erişebilirsiniz. İlk olarak, bu örnek için başka bir veri çerçevesi oluşturuyoruz.


pd.DataFrame() kullanılarak veri çerçevemiz oluşturuldu. Veri çerçevesini üç sütunlu oluşturduk: item, price ve vergi. Dize değerlerini ('kalem', 'işaretleyici', 'cetvel', 'silgi', 'kalem', 'pano', 'zımba', 'iğneler') içeren sütun öğesi, değerleri saklayan sütun fiyatı (20, 15, 10, 3, 5, 30, 35, 10) ve “vergi” sütunu (8, 5, 3, 3, 4, 10, 5, 2) değerlerinden oluşur. Şimdi fiyat ve vergi sütun değerlerini toplayalım ve orijinal veri çerçevesi sütunlarını koruyarak sonuçları yeni bir sütunda saklayalım.


Yeni 'toplam' sütunuyla birlikte fark edilebileceği gibi, verilen veri çerçevesinin orijinal sütunları da işlev tarafından döndürülür. 'Toplam' sütunu, her bir 'madde' verisine karşı 'fiyat' ve 'vergi' sütunlarının değerlerinin toplamını saklar.

Örnek # 03: Belirtilen Veri Çerçevesi Sütunlarının Toplamını Belirlemek için sum() İşlevini Kullanma

Veri çerçevesinin birden çok sütununu birlikte toplamak için, sütun etiketleriyle bir liste belirleyebilir ve ardından toplamı bulmak için listede sum() yöntemini uygulayabiliriz. Önceki örneklerde olduğu gibi, önce veri çerçevesini oluşturacağız.


Veri çerçevemizi “öğrenciler”, “marks1”, “marks2” ve “marks3” olmak üzere dört sütundan oluşturduk. 'Öğrenciler' sütunu verileri ('Larry', 'James', 'Rob', 'Arya', 'Max', 'Ben', 'Gwen', 'Bill') ve 'marks1' sütunu değerler (8, 9, 6, 8, 10, 7, 9, 9), oysa 'marks2' ve 'marks3' sütunları sayısal değerleri (6, 6, 8, 6, 7, 9, 10, 9) saklar. ) ve (7, 6, 9, 7, 8, 7, 10, 10) sırasıyla.


İlk olarak, “öğrenciler”, “marks1” ve “marks3” sütun etiketleriyle bir liste nesnesi oluşturduk. Ardından listeye sum() yöntemi uygulanır. İşlev, yalnızca 'öğrenciler' sütunu sayısal olmadığı için işaret1 ve işaret3 sütunlarının değerlerini topladı, bu nedenle sum() işlevi 'öğrenciler' sütununun değerlerinin toplamını bulamıyor. “Marks1” ve “marks3” sütunlarının değerlerinin toplamını “sum” sütununda sakladık.

Örnek # 04: Belirtilen Koşullara Uygun Panda Veri Çerçevesi Sütunları Ekleme

Bu örnekte, belirtilen koşulu karşılıyorlarsa belirtilen sütunların değerlerini ekleyeceğiz.


Yeni oluşturulan veri çerçevesinde 5 sütun vardır, yani 'şirket', 'hafta1_satış', 'hafta2_satış', 'hafta3_satış' ve 'dallar'. Şimdi, verilen veri çerçevesi satırlarının değerlerinin toplamını toplarken veya bulurken son sütunun değerini eklemek istemediğimizi varsayalım. Diyelim ki, etiketlerinde 'hafta' kelimesi bulunan sütun değerlerini eklemek istedik. Bir sütun etiketinde “hafta” kelimesinin olup olmadığını belirlemek için bir liste kavrama oluşturulabilir.


Şimdi etiketlerinde “hafta” kelimesi bulunan sütunları getirdik. sum() fonksiyonundaki axis=1 argümanını kullanarak “hafta” kelimesini içeren sütunları özetleyebiliriz.


Bu şekilde, istemediğimiz herhangi bir sütun eklemeden, sütunlardaki verileri güvenli bir şekilde satır bazında özetleyebiliriz.

Örnek # 5: Veri Çerçevesinin Verilerini Gruplandırdıktan Sonra Toplamı Belirleyin

Bir veya daha fazla sütunun verilerini grupladıktan sonra veri çerçevesi sütunlarının toplamını da bulabiliriz. Groupby() yöntemi, verileri sütun içindeki kategorilere ayırmak için kullanılacaktır. Sütunlarından birinin verilerini gruplayabilmemiz için bir veri çerçevesi oluşturalım.


Şimdi 'yaş' sütunundaki verileri gruplayacağız ve grubun her kategorisi için 'skor1' ve 'skor2' sütunlarının değerlerini toplayacağız.


Veri değerlerini yaşa göre grupladıktan sonra dataframe'deki verilerin toplanmasının, yaş gruplamalarına bağlı olarak sütun bazında bir toplamla sonuçlandığını görebiliriz.

Çözüm

Bu öğreticide, Pandas toplam yöntemini kullanarak veri çerçeveleri arasındaki toplamı nasıl hesaplayacağınızı size öğretmeye çalıştık. Bu yazının örneklerinde satır ve sütun bazında değerlerin eklenmesini tartıştık. Ek olarak, koşullu sütunları nasıl ekleyeceğinizi ve veri çerçevesinin sütununu grupladıktan sonra değerleri nasıl toplayacağınızı öğrendiniz. Artık veri çerçevesinin sütunlarını birlikte toplayabilir veya veri çerçevesi sütunundaki değerleri kendiniz toplayabilirsiniz.