İçindekiler:
- Tanımı - Açık Kaynaklı Büyük Veri Analitiği ne demektir?
- Techopedia Açık Kaynaklı Büyük Veri Analitiğini Açıklıyor
Tanımı - Açık Kaynaklı Büyük Veri Analitiği ne demektir?
Açık kaynaklı büyük veri analizi, bir kuruluşun iş hedeflerini ilerletmek için kullanabileceği ilgili ve işlem yapılabilir bilgileri toplamak amacıyla çok miktarda veriyi analiz etmek için açık kaynaklı yazılım ve araçların kullanılmasını ifade eder. Açık kaynaklı büyük veri analizindeki en büyük oyuncu, Apache'nin Hadoop'udur - paralellik için dağıtılmış bir işlem kullanarak bir bilgisayar kümesinde muazzam veri kümelerini işlemek için en yaygın kullanılan yazılım kütüphanesidir.
Techopedia Açık Kaynaklı Büyük Veri Analitiğini Açıklıyor
Açık kaynaklı büyük veri analizi, veri analizi sürecindeki farklı görevler için tüm bir yazılım platformunu veya çeşitli açık kaynaklı araçları kullanarak büyük veri analitiğini yürütmek için açık kaynaklı yazılım ve araçlardan yararlanır. Apache Hadoop, büyük veri analizi için en iyi bilinen sistemdir, ancak gerçek bir analiz sisteminin bir araya getirilmesinden önce diğer bileşenlere ihtiyaç vardır.
Hadoop, Google ve Yahoo tarafından öncülük edilen MapReduce algoritmasının açık kaynaklı uygulamasıdır, bu nedenle günümüzde çoğu analiz sisteminin temelini oluşturmaktadır. Birçok büyük veri analizi aracı, büyük veri uygulamaları ve diğerleri için çok uygun olan açık kaynaklı MongoDB gibi güçlü veritabanı sistemleri de dahil olmak üzere açık kaynak kullanır.
Açık kaynaklı büyük veri analizi hizmetleri şunları içerir:
- Veri toplama sistemi
- Kümeleri yönetmek ve izlemek için kontrol merkezi
- Makine öğrenimi ve veri madenciliği kütüphanesi
- Uygulama koordinasyon hizmeti
- Hesaplama motoru
- Yürütme çerçevesi
