İçindekiler:
Apache Hadoop uzun zamandır büyük veri uygulamalarının temelini oluşturuyor ve büyük veriyle ilgili tüm teklifler için temel veri platformu olarak kabul ediliyor. Bununla birlikte, bellek içi veritabanı ve hesaplama, daha hızlı performans ve hızlı sonuçlar nedeniyle popülerlik kazanmaktadır. Apache Spark, hızlı işleme sunmak için bellek içi yetenekleri kullanan (Hadoop'tan neredeyse 100 kat daha hızlı) yeni bir çerçevedir. Bu nedenle, Spark ürünü, büyük veri dünyasında ve esas olarak daha hızlı işleme için giderek daha fazla kullanılmaktadır.
Web Semineri: Öneri Gücü: Bir Veri Kataloğu Analistleri Nasıl Güçlendirir? Buradan kaydolun |
Apache Spark Nedir?
Apache Spark, büyük hacimli verileri (büyük veri) hızlı ve basit bir şekilde işlemek için açık kaynaklı bir çerçevedir. Büyük verilere dayanan analiz uygulamaları için uygundur. Spark, tek başına veya bulutta bir Hadoop ortamıyla kullanılabilir. California Üniversitesi'nde geliştirilmiş ve daha sonra Apache Yazılım Vakfı'na sunulmuştur. Bu nedenle, açık kaynak topluluğuna aittir ve çok düşük maliyetli olabilir, bu da amatör geliştiricilerin kolaylıkla çalışmasına izin verir. (Hadoop'un açık kaynağı hakkında daha fazla bilgi için bkz. Açık Kaynak'ın Apache Hadoop Ekosistemine Etkisi Nedir?)
Spark'ın temel amacı, geliştiricilere ortalanmış bir veri yapısı etrafında çalışan bir uygulama çerçevesi sunmasıdır. Kıvılcım da son derece güçlüdür ve çok miktarda veriyi kısa sürede hızlı bir şekilde işleme tabi tutma özelliğine sahiptir, böylece son derece iyi performans sunar. Bu onu en yakın rakibi Hadoop olduğu söylenenden çok daha hızlı yapar.