R DataFrame'de Sütun Sayısı Alın

R Dataframe De Sutun Sayisi Alin



R'de sütun sayısını almak, DataFrames ile çalışırken birçok durumda gerekli olan temel bir işlemdir. Verileri alt gruplara ayırırken, analiz ederken, manipüle ederken, yayınlarken ve görselleştirirken, sütun sayısı bilinmesi gereken çok önemli bir bilgi parçasıdır. Bu nedenle R, belirtilen DataFrame sütunlarının toplamını elde etmek için farklı yaklaşımlar sağlar. Bu yazıda, DataFrame sütunlarının sayısını bulmamıza yardımcı olan yaklaşımlardan bazılarını tartışacağız.

Örnek 1: Ncol() İşlevini Kullanma

ncol(), DataFrame'lerin sütunlarının toplamını almak için en sık kullanılan işlevdir.







df <- data.frame('y1' = c(10, 12, 14, 19),

'y2' = c(15, 22, 24, 29),
'y3' = c(25, 32, 34, 39))


n <- ncol(df)

cat('-----Veri Çerçevesindeki sütun sayısı :', n)

Bu örnekte, önce R'deki data.frame() işlevini kullanarak 'y1', 'y2' ve 'y3' olarak etiketlenmiş üç sütunlu bir 'df' DataFrame oluşturuyoruz. Her sütundaki öğeler kullanılarak belirtilir. bir öğe vektörü oluşturan c() işlevi. Daha sonra “n” değişkeni kullanılarak “df” DataFrame'deki sütunların toplamını belirlemek için ncol() işlevi kullanılır. Son olarak, açıklayıcı mesaj ve 'n' değişkeni ile sağlanan cat() işlevi, sonuçları konsolda yazdırır.



Beklendiği gibi, alınan çıktı, belirtilen DataFrame'in üç sütunu olduğunu gösterir:







Örnek 2: Boş DataFrame için Toplam Sütunları Say

Ardından, toplam sütunların değerlerini de alan ancak bu değer sıfır olan boş DataFrame'e ncol() işlevini uygularız.

empty_df <- data.frame()

n <- ncol(empty_df)

cat('---Veri Çerçevesindeki Sütunlar :', n)

Bu örnekte, herhangi bir sütun veya satır belirtmeden data.frame() öğesini çağırarak boş DataFrame'i “empty_df” oluşturuyoruz. Ardından, DataFrame'deki sütun sayısını bulmak için kullanılan ncol() işlevini kullanıyoruz. Toplam sütunları almak için ncol() işlevi burada 'empty_df' DataFrame ile ayarlanır. “empty_df” DataFrame boş olduğundan herhangi bir kolonu yoktur. Yani, ncol(empty_df)'nin çıktısı 0'dır. Sonuçlar, burada dağıtılan cat() işlevi tarafından görüntülenir.



DataFrame boş olduğu için çıktı beklendiği gibi '0' değerini gösterir.

Örnek 3: Select_If() İşlevini Uzunluk() İşleviyle Kullanma

Belirli bir türdeki sütun sayısını almak istiyorsak, select_if() işlevini R'nin uzunluk() işleviyle birlikte kullanmalıyız. Bu işlevler, her türdeki sütunların toplamını elde etmek için birleştirilir. . Bu işlevleri kullanma kodu aşağıdaki şekilde uygulanır:

kitaplık(dplyr)

x1<-LETTERS[1:10]

x2<-rpois(10,2)

x3<-rpois(10,5)

x4<-sample(c('Yaz','Kış'),10,değiştir=DOĞRU)

df1<-veri.çerçeve(x1,x2,x3,x4)

df1

uzunluk(select_if(df1,is.numeric))

Bu örnekte, select_if() işlevine ve uzunluk() işlevine erişebilmemiz için önce dplyr paketini yüklüyoruz. Ardından, sırasıyla “x1”, “x2”, “x3” ve “x4” olmak üzere dört değişkeni oluşturuyoruz. Burada “x1” İngiliz alfabesinin ilk 10 büyük harfini içermektedir. 'x2' ve 'x3' değişkenleri, sırasıyla 2 ve 5 parametreleriyle 10 rasgele sayıdan oluşan iki ayrı vektör oluşturmak için rpois() işlevi kullanılarak oluşturulur. 'x4' değişkeni c vektöründen ('Yaz', 'Kış') rastgele örneklenen 10 elemanlı bir faktör vektörüdür.

Ardından, data.frame() işlevinde tüm değişkenlerin iletildiği “df1” DataFrame'i oluşturmaya çalışıyoruz. Son olarak, dplyr paketinden select_if() işlevi kullanılarak oluşturulan “df1” DataFrame'in uzunluğunu belirlemek için uzunluk() işlevini çağırıyoruz. select_if() işlevi, bağımsız değişken olarak bir 'df1' DataFrame'den sütunları seçer ve is.numeric() işlevi yalnızca sayısal değerler içeren sütunları seçer. Ardından, length() işlevi, tüm kodun çıktısı olan select_if() tarafından seçilen sütunların toplamını alır.

Sütunun uzunluğu, DataFrame'in toplam sütunlarını gösteren aşağıdaki çıktıda gösterilir:

Örnek 4: Sapply() İşlevini Kullanma

Tersine, yalnızca sütunların eksik değerlerini saymak istiyorsak sapply() işlevine sahibiz. sapply() işlevi, özel olarak çalışmak için DataFrame'in her sütunu üzerinde yinelenir. sapply() işlevi, önce DataFrame ile bir argüman olarak iletilir. Ardından, o DataFrame üzerinde yapılacak işlemi alır. DataFrame sütunlarındaki NA değerlerinin sayısını almak için sapply() fonksiyonunun uygulanması şu şekilde sağlanır:

new_df <- data.frame(c1 = c(10, 11, NA, 13, NA),

c2 = c('N', NA, 'A', 'M', 'E'),
c3 = c(NA, 92, NA, NA, 95))

sapply(new_df, function(x) sum(is.na(x)))

Bu örnekte, 'c1', 'c2' ve 'c3' olmak üzere üç sütunlu 'new_df' DataFrame'i oluşturuyoruz. İlk sütunlar, “c1” ve “c3”, NA ile temsil edilen bazı eksik değerleri içeren sayısal değerleri içerir. İkinci sütun olan 'c2', yine NA ile temsil edilen bazı eksik değerleri içeren karakterleri içerir. Daha sonra “new_df” DataFrame'e sapply() fonksiyonunu uyguluyoruz ve sapply() fonksiyonu içindeki sum() ifadesini kullanarak her bir sütundaki eksik değerlerin sayısını hesaplıyoruz.

is.na() işlevi, sütundaki her öğenin eksik olup olmadığını gösteren mantıksal bir vektör döndüren sum() işlevinde belirtilen ifadedir. sum() işlevi, her sütundaki eksik değerlerin sayısını saymak için DOĞRU değerleri toplar.

Bu nedenle çıktı, sütunların her birinde toplam NA değerlerini görüntüler:

Örnek 5: Dim() İşlevini Kullanma

Ek olarak, DataFrame'in satırlarıyla birlikte toplam sütunları da almak istiyoruz. Ardından, dim() işlevi DataFrame'in boyutlarını sağlar. dim() işlevi, boyutlarını almak istediğimiz nesneyi bir argüman olarak alır. İşte dim() işlevini kullanmak için kod:

d1 <- data.frame(takım=c('t1', 't2', 't3', 't4'),

puan=c(8, 10, 7, 4))

loş(d1)

Bu örnekte, önce iki sütunun 'team' ve 'points' olarak ayarlandığı data.frame() işlevi kullanılarak oluşturulan 'd1' DataFrame'i tanımlıyoruz. Ardından “d1” DataFrame üzerinden dim() fonksiyonunu çağırıyoruz. dim() işlevi, DataFrame'in satır ve sütun sayısını döndürür. Bu nedenle, dim(d1)'i çalıştırdığımızda, iki öğeli bir vektör döndürür - birincisi “d1” DataFrame'deki satır sayısını, ikincisi ise sütun sayısını temsil eder.

Çıktı, DataFrame'in boyutlarını temsil eder; burada '4' değeri toplam sütunları ve '2' değeri satırları temsil eder:

Çözüm

Artık R'deki sütun sayısını saymanın DataFrame üzerinde yapılabilecek basit ve önemli bir işlem olduğunu öğrendik. Tüm işlevler arasında ncol() işlevi en uygun yoldur. Artık, verilen DataFrame'den sütun sayısını almanın farklı yollarına aşinayız.