DataFrame'i R'de sıralayın

Dataframe I R De Siralayin



DataFrame'leri R'de sıralamak, veri analizi ve manipülasyonunda çok önemli bir işlemdir. Önemli bir şekilde R, verileri birden çok sütuna göre sıralamada ve artan veya azalan düzende sıralamada çok fazla esneklik sağlar. R'de, DataFrame'leri sıralamak, çeşitli yöntemler ve işlevler kullanılarak gerçekleştirilebilir. Bu yazıda, DataFrame'i belirtilen sıralardan herhangi birinde sıralamamıza yardımcı olan çeşitli işlevleri inceleyeceğiz.

Örnek 1: R'de Order() Yöntemini Kullanarak DataFrame'i Sıralama

R'deki order() işlevi, DataFrame'leri bir veya birden çok sütuna göre sıralamak için kullanılır. order işlevi, DataFrame'in satırlarını yeniden düzenlemek için sıralanan satırların dizinlerini alır.

emp = veri. çerçeve ( isimler = C ( 'Andy' , 'İşaret' , 'Bonnie' , 'Carolin' , 'John' ) ,

yaş = C ( yirmi bir , 23 , 29 , 25 , 32 ) ,

maaş = C ( 2000 , 1000 , 1500 , 3000 , 2500 ) )

kedi ( ' \N \N Artan Düzende Adlara Göre Sıralanmış Veri Çerçevesi \N ' )

sıralanmış_asc = emp [ ile ( emp , emir ( isimler ) ) , ]

Yazdır ( sıralanmış_asc )

Burada “emp” DataFrame'i farklı değerler içeren üç sütun ile tanımlıyoruz. cat() işlevi, 'emp' DataFrame'in 'adlar' sütununa göre artan düzende sıralanacağını belirten ifadeyi yazdırmak için konuşlandırılır. Bunun için, artan düzende sıralanmış bir vektördeki değerlerin dizin konumlarını döndüren R'deki order() işlevini kullanıyoruz. Bu durumda with() işlevi, 'adlar' sütununun sıralanması gerektiğini belirtir. Sıralanan DataFrame, sıralanan sonuçları yazdırmak için print() işlevinde bir argüman olarak iletilen 'sorted_asc' değişkeninde saklanır.







Bu nedenle, DataFrame'in 'isimler' sütununa göre artan sırada sıralanmış sonuçları aşağıda görüntülenir. Sıralama işlemini azalan düzende yapmak için, önceki order() işlevinde sütun adıyla eksi işaretini belirtebiliriz:





Örnek 2: R'de Order() Yöntem Parametrelerini Kullanarak DataFrame'i Sıralama

Ayrıca order() işlevi, DataFrame'i sıralamak için azalan bağımsız değişkenleri alır. Aşağıdaki örnekte, artan veya azalan düzende sıralama argümanıyla order() işlevini belirtiyoruz:





df = veri. çerçeve (

İD = C ( 1 , 3 , 4 , 5 , 2 ) ,

kurs = C ( 'Piton' , 'Java' , 'C++' , 'MongoDB' , 'R' ) )

Yazdır ( 'Kimliğe göre Azalan düzende sıralandı' )

Yazdır ( df [ emir ( df$id , azalan = DOĞRU ) , ] )

Burada öncelikle data.frame() fonksiyonunun tanımlandığı “df” değişkenini üç farklı kolon ile tanımlıyoruz. Ardından, DataFrame'in 'id' sütununa göre azalan düzende sıralanacağını belirtmek için bir mesaj yazdırdığımız print() işlevini kullanırız. Bundan sonra, sıralama işlemini yürütmek ve bu sonuçları yazdırmak için print() işlevini tekrar konuşlandırıyoruz. print() işlevinin içinde, 'df' DataFrame'i 'kurs' sütununa göre sıralamak için 'order' işlevini çağırıyoruz. 'Azalan' bağımsız değişken, azalan düzende sıralamak için DOĞRU olarak ayarlanır.

Aşağıdaki çizimde, DataFrame'in 'id' sütunu azalan sırada düzenlenmiştir:



Ancak sıralama sonuçlarını artan düzende elde etmek için order() fonksiyonunun azalan argümanını aşağıda gösterildiği gibi FALSE olarak ayarlamalıyız:

Yazdır ( 'Kimliğe göre artan düzende sıralandı' )

Yazdır ( df [ emir ( df$id , azalan = YANLIŞ ) , ] )

Burada DataFrame'in sıralama işleminin 'id' sütununa göre artan sırada çıktısını alıyoruz.

Örnek 3: R'de Arrange() Yöntemini Kullanarak DataFrame'i Sıralama

Ek olarak, bir DataFrame'i sütunlara göre sıralamak için düzenleme() yöntemini de kullanabiliriz. Artan veya azalan düzende de sıralayabiliriz. Aşağıdaki verilen R kodu, ayar() işlevini kullanır:

kütüphane ( 'dplyr' )

öğrenci = veri. çerçeve (

İD = C ( 3 , 5 , 2 , 4 , 1 ) ,

işaretler = C ( 70 , 90 , 75 , 88 , 92 ) )

Yazdır ( 'Id'ye Göre Artan Sipariş Sıralaması' )

Yazdır ( düzenlemek ( öğrenci , İD ) )

Burada, sıralama () yöntemine erişmek için R'nin “dplyr” paketini yüklüyoruz. Ardından, iki sütun içeren ve DataFrame'i “student” değişkenine ayarlayan data.frame() işlevine sahibiz. Daha sonra, verilen DataFrame'i sıralamak için print() işlevindeki 'dplyr' paketindeki düzenleme() işlevini konuşlandırıyoruz. Düzenleme() işlevi, ilk bağımsız değişkeni olarak 'öğrenci' DataFrame'i ve ardından sıralanacak sütunların 'Id'sini alır. Sonunda print () işlevi, sıralanan DataFrame'i konsola yazdırır.

Aşağıdaki çıktıda “Id” sütununun sıralamada nerede sıralandığını görebiliriz:

Örnek 4: DataFrame'i R'de Tarihe Göre Sıralama

R'deki DataFrame, tarih değerlerine göre de sıralanabilir. Bunun için, tarihleri ​​biçimlendirmek için sorted işlevi as.date() işleviyle belirtilmelidir.

etkinlik tarihi = veri. çerçeve ( etkinlik = C ( '3/4/2023' , '2/2/2023' ,

'10/1/2023' , '3/29/2023' ) ,

masraflar = C ( 3100 , 2200 , 1000 , 2900 ) )

etkinlik tarihi [ emir ( gibi . Tarih ( event_date$event , biçim = '%d/%m/%Y' ) ) , ]

Burada, 'ay/gün/yıl' biçimindeki tarih dizileriyle 'olay' sütununu içeren bir 'event_date' DataFrame'imiz var. Bu tarih dizilerini artan düzende sıralamamız gerekiyor. DataFrame'i 'event' sütununa göre artan düzende sıralayan order() işlevini kullanıyoruz. Bunu “event” kolonundaki tarih stringlerini “as.Date” fonksiyonu ile gerçek tarihlere çevirerek ve “format” parametresi ile tarih stringlerinin formatını belirleyerek gerçekleştiriyoruz.

Böylece “olay” tarih sütununa göre sıralanan verileri artan düzende gösteriyoruz.

Örnek 5: R'de Setorder() Yöntemini Kullanarak DataFrame'i Sıralama

Benzer şekilde, setorder() da DataFrame'i sıralamak için başka bir yöntemdir. Argümanı alarak DataFrame'i sıralar, aynen aranjör() metodu gibi. setorder() yöntemi için R kodu şu şekilde verilir:

kütüphane ( 'veri tablosu' )

d1 = veri. çerçeve ( Sipariş Kimliği = C ( 1 , 4 , 2 , 5 , 3 ) ,

sipariş öğesi = C ( 'elma' , 'turuncu' , 'kivi' , 'Mango' , 'muz' ) )

Yazdır ( siparişi ayarla ( d1 , sipariş öğesi ) )

Burada setorder() bu paketin fonksiyonu olduğu için önce data.table kütüphanesini kuruyoruz. Ardından, DataFrame'i oluşturmak için data.frame() işlevini kullanırız. DataFrame, sıralamak için kullandığımız yalnızca iki sütunla belirtilir. Bundan sonra print() fonksiyonu içerisinde setorder() fonksiyonunu set ediyoruz. setorder() işlevi, DataFrame'in sıralandığı ilk parametre olarak 'd1' DataFrame'i ve ikinci parametre olarak 'orderId' sütununu alır. “setorder” işlevi, “orderId” sütunundaki değerlere göre veri tablosunun satırlarını artan sırada yeniden düzenler.

Sıralanan DataFrame, aşağıdaki R konsolundaki çıktıdır:

Örnek 6: R'de Row.Names() Yöntemini Kullanarak DataFrame'i Sıralama

Row.names() yöntemi, R'deki DataFrame'i sıralamanın da bir yoludur. row.names(), DataFrame'leri belirtilen satıra göre sıralar.

df < - veri. çerçeve ( takım = C ( 'X' , 'X' , 'VE' , 'VE' , 'İLE' ) ,

Gol = C ( 91 , 80 , 86 , 83 , 95 ) )

sıra. isimler ( df ) < - C ( 'A' , 'D' , 'C' , 'VE' , 'B' )

df [ emir ( sıra. isimler ( df ) ) , ]

Burada sütunların değerlerle belirtildiği “df” değişkeni içerisinde data.frame() fonksiyonu kurulur. Ardından, DataFrame'in satır adları, row.names() işlevi kullanılarak belirtilir. Bundan sonra, DataFrame'i satır adlarına göre sıralamak için order() işlevini çağırıyoruz. order() işlevi, DataFrame'in satırlarını yeniden düzenlemek için kullanılan sıralanmış satırların dizinlerini döndürür.

Çıktı, sıralanmış DataFrame'i satırlara göre alfabetik olarak gösterir:

Çözüm

R'de DataFrame'leri sıralamak için farklı işlevleri gördük. Yöntemlerin her birinin bir avantajı vardır ve sıralama işlemine ihtiyaç duyar. DataFrame'i R dilinde sıralamak için daha fazla yöntem veya yol olabilir, ancak order(), Arrange() ve setorder() yöntemleri sıralama için en önemli ve kullanımı kolay yöntemlerdir.