Amazon Redshift Veri Türleri nelerdir?

Amazon Redshift Veri Turleri Nelerdir



Amazon Redshift, AWS tarafından sunulan ve veri ambarı amacını yerine getiren bir bulut çözümüdür. Bir veri ambarı, bulutta muazzam miktarda veri depolayan büyük bir alandır. Bir veri ambarı ile veritabanı arasındaki fark, ilkinin yalnızca mevcut verileri değil, aynı zamanda verilerin tüm geçmişini de depolamasıdır.

Bu makale, AWS tarafından sağlanan Amazon Redshift ve bu hizmetin desteklediği veri türleri hakkında bilgi verecektir.







Amazon RedShift nedir?

dayalı veri ambarı için bir bulut çözümüdür. 'PostgreSQL' . adı verilen bir teknoloji kullanır. 'Yoğun Paralel İşleme (MPP)' petabaytlarca veriyi ışık hızında işlemek için. Bu, geçmiş verilere ve akış çözümlerine dayalı gerçek zamanlı tahmin için kolay bir çözüm sağlar.



Aşağıdaki şekilde Amazon Redshift'in çalışma mekanizması gösterilmektedir:







Amazon Redshift'in nasıl çalıştığına dair bu grafik açıklama çok basit ve anlaşılır. Çıktıları oluşturmak ve veri odaklı uygulamalar oluşturmak için verilerin nasıl alındığı ve daha fazla işlendiği hakkında bize bilgi verir.

Amazon Redshift'in veri ambarı mimarisi aşağıdaki şekilde de görülebilir:



Şimdi, bu hizmetin kullanımlarına ve özelliklerine yöneleceğiz.

Özellikler

Daha önce de belirtildiği gibi Amazon Redshift, PostgreSQL'i temel alır ve petabaytlarca veriyi anında işlemesini sağlayan Massively Parallel Processing adlı bir teknoloji kullanır. Bu nedenle, Redshift çok sayıda özellik ve kullanım sunar. Bu özelliklerden bazıları aşağıdadır:

  • Veri Güvenliği ve Şifreleme.
  • İş analitiği.
  • Veriye Dayalı Uygulama Desteği.
  • Öngörü Analizi.
  • Otomatik Görev Tekrarı.
  • Eşzamanlı Veri Ölçeklendirme.
  • Veri depolama.

Bu hizmetin bazı ekstra özellikleri aşağıda verilen şekilde görülebilir:

Redshift'in sunduğu özelliklerin çoğu bunlardı ve şimdi bu hizmet tarafından desteklenen veri türlerine geçeceğiz.

Veri tipleri

Amazon Redshift, çok sayıda özelliğe sahip bir veri ambarı çözümüdür. Hem yapılandırılmış hem de yapılandırılmamış veri türlerini destekler. PostgreSQL'e dayalı olduğu için, veriler basit SQL sorguları aracılığıyla manipüle edilebilir.

Şimdi başka bir soru ortaya çıkıyor, yani bu veri formatları birbirinden nasıl farklı? Bu iki veri formatını tartışalım.

Yapılandırılmış Veri

Makine öğrenimi algoritmaları tarafından kolayca çevrilebilen yüksek düzeyde biçimlendirilmiş bir veri türü, yapılandırılmış veri olarak adlandırılır. Bir SQL veritabanı, yapılandırılmış verilerle çalışır. Yapılandırılmış veriler, ilişkisel veritabanları tarafından kullanılan veriler gibi tablo biçimindedir.

Yaygın olarak kullanılan SQL veritabanı yönetim sistemlerinden biri MYSQL'dir. Mimarisi verilen şekilde aşağıda görülebilir:

Yapılandırılmamış Veri

Yapılandırılmamış veriler, ilişkisel olmayan veritabanlarında kullanılan veriler gibi daha az desenlidir ve daha az biçimlendirilir. MongoDB ünlü bir ilişkisel olmayan veritabanıdır. İlişkisel olmayan veritabanlarında SQL sorguları çalışmaz, bu nedenle bu veritabanlarına NoSQL veritabanları da denir.

Daha önce de belirtildiği gibi, MongoDB yapılandırılmamış bir veritabanı yönetim sistemidir ve mimarisi aşağıda verilen şekilde görülebilir:

Veritabanlarında kullanılan iki temel veri türünü inceledik ve şimdi Amazon Redshift tarafından desteklenen gerçek veri türlerine geçeceğiz. Bu veri türleri şunlardır:

  • Sayısal Veri
  • Karakter Verileri
  • Tarih saat verileri
  • Boole Verileri
  • HLLSKETCH Verileri
  • SÜPER Veri
  • DEĞİŞTİRME Verileri

Bu veri türlerini tartışalım:

Sayısal Veri

Bu veri türü kendi kendini açıklayıcıdır. Tamsayılar, ondalık sayılar, kayan nokta ve diğer sayısal veri türleri biçimindeki verileri destekler.

Tamsayı veri türünün özellikleri aşağıdaki şekilde görülebilir:

Ondalık veri türü, verileri kullanıcıdan gelen kesinliğe göre depolar. Özellikleri aşağıdaki gibidir:

Karakter Verileri

CHAR ve VARCHAR veri türleri, karakter tabanlı veri türleri kategorisine girer. NCHAR ve NVARCHAR da karakter tipi veri tipleridir. CHAR ve VARCHAR'dan farklı olarak, bu iki veri tipi sabit uzunluklu Unicode karakterleri depolar. Bu veri türlerinin özelliklerine bakalım, örneğin:

  • CHAR, CHARACTER, NCHAR 4 KB aralığındadır.
  • VARCHAR, NVARCHAR 64 KB'lik bir aralığa sahiptir.
  • BPCHAR, 256 Baytlık bir aralığa sahiptir.
  • TEXT, 260 Baytlık bir aralığa sahiptir.

Tarih saat verileri

Datetime veri türleri DATE, TIME, TIMETZ,TIMESTAMP, TIMESTAMPTZ'dir. Bu veri türlerinin işlevsel yetenekleri aşağıdaki gibidir:

  • DATE, yalnızca takvim tarihlerini saklar.
  • TIME, herhangi bir saat dilimine atıfta bulunmadan zamanı saklar. Varsayılan olarak UTC'dir.
  • TIMETZ, zamanı saat dilimine göre depolar. Hem kullanıcı tablolarında hem de sistem tablolarında varsayılan olarak UTC'dir.
  • TIMESTAMP yalnızca zamanı değil aynı zamanda tarihleri ​​de içerir. Hem kullanıcı tablolarında hem de sistem tablolarında varsayılan olarak UTC'dir.
  • TIMESTAMPTZ yalnızca zamanı değil aynı zamanda tarihleri ​​de içerir. Varsayılan olarak yalnızca kullanıcı tablolarında UTC'dir.

Boole Verileri

Boolean veri türü, yalnızca iki değer olduğu anlamına gelen ikili bir veri türüdür. Boolean veri türü için özellikler tablosu aşağıdaki şekilde verilmiştir:

HLLSKETCH Verileri

Bu veri tipi eskizleri depolamak için kullanılır. Redshift, eskizleri seyrek veya yoğun biçimde temsil edebilir. Eskizler seyrek olarak başlar ve yoğun bir biçim, bağlantıyı izleyerek daha fazla verimlilik sağladığında giderek yoğunlaşır.

SÜPER Veri

Bu veri türü, diziler, iç içe yapılar veya JSON biçiminde olabilen yapılandırılmamış verilerle ilgilenir. Verilerin modeli veya formatı yoktur. Kullanıcılar bağlantıda gezinerek daha fazla bilgi keşfedebilir.

DEĞİŞTİRME Verileri

Bu veri türü ayrıca karakterleri de saklar. Ancak uzunluk sınırlıdır. Amazon Redshift, VARBYTE verilerinin herhangi bir tamsayı türü veya karakter türü verisine dönüştürülmesine olanak tanır. Bu veri türü hakkında daha fazla bilgi almak için aşağıdaki bağlantıyı izleyin.

Amazon Redshift ve desteklediği veri türlerinin hepsi bu kadar.

Çözüm

Amazon Redshift, temel haliyle bir veri ambarı amacına hizmet eden ancak analitik ve tahmin için çok güçlü ve özellikli bir çözüm olan bir AWS hizmetidir. Bu makalede Redshift ve desteklediği veri türleri ele alınmıştır. Bu veri türleri özellikleri ile birlikte kısaca açıklanmıştır.