Hadoop on sql büyük veri analizinde nasıl yardımcı olabilir?

2026

İçindekiler:

Hadoop'ta SQL Tanımı

Hadoop'taki SQL, SQL tarzı sorgulama ve verilerin işlenmesini en son Hadoop veri çerçevesi elemanları ile birleştiren bir grup analitik uygulama aracıdır. SQL'in Hadoop üzerinde ortaya çıkması, büyük veri işleme için önemli bir gelişmedir, çünkü daha fazla insan grubunun, Hadoop'un işlediği muazzam miktarda büyük veri üzerinde SQL sorguları çalıştırarak Hadoop veri işleme çerçevesiyle başarılı bir şekilde çalışmasını sağlar. Açıkçası, Hadoop çerçevesi daha önce insanlar için, özellikle sorgulama yetenekleri açısından erişilebilir değildi. Gelişmeye dayanarak, büyük verilerin kalite ve hız ile işlenmesi ve analiz edilmesi söz konusu olduğunda işletmelerin verimliliğini artırmayı vaat eden çalışmalarda çeşitli araçlar bulunmaktadır. Geleneksel SQL bilgisinin yapması gerektiği gibi, aracı öğrenmeye de çok fazla yatırım yapmaya gerek yoktur.

Hadoop'ta SQL Tanımı

Hadoop'taki SQL, Hadoop veri işleme çerçevesi tarafından barındırılan büyük verilerde SQL tarzı sorgular çalıştırmanıza izin veren bir uygulama grubudur. Açıkçası, veri sorgulama, alma ve analiz Hadoop üzerinde SQL ilavesi ile daha kolay hale gelmiştir. SQL başlangıçta ilişkisel veritabanları için tasarlandığından, MapReduce ve Hadoop Dağıtılmış Dosya Sistemi'ni (HDFS) içeren Hadoop 1 modeline ve MapReduce ve HDFS içermeyen Hadoop 2 modeline göre değiştirilmesi gerekiyordu.

SQL'i Hadoop ile birleştirmek için yapılan ilk çabalardan biri, Hive veri ambarının SQL stili sorguları MapReduce işlerine çevirebilecek HiveQL yazılımı ile sonuçlanmasıyla sonuçlandı. Bundan sonra benzer işler yapabilen çeşitli uygulamalar geliştirildi. Daha sonraki araçlar arasında Matkap, BigSQL, HAWQ, Impala, Hadapt, Stinger, H-SQL, Splice Machine, Presto, PolyBase, Spark, JethroData, Shark (Hive on Spark) ve Tez (Tez Üzerinde Hive) bulunur.