S:
Büyük verileri analiz etmek için Hadoop kullanmayı nasıl öğrenebilirim?
A:Hadoop olarak bilinen Apache yazılım seti, büyük veri setleriyle uğraşmak için çok popüler bir kaynak haline geliyor. Bu tür veri işleme yazılımı çerçevesi, bazı veri projelerini daha verimli hale getirebilecek tasarımlara dayanarak verilerin belirli şekillerde toplanmasına yardımcı olmak için oluşturulmuştur. Bununla birlikte, Hadoop büyük veri setlerini işlemek için birçok araçtan sadece bir tanesidir.
Hadoop ile büyük veri analizi hakkında bilgi edinmenin ilk ve en temel yollarından biri, Hadoop'un en üst düzey bileşenlerinden bazılarını ve ne yaptığını anlamaktır. Bunlar arasında, belirli ağ kurulumlarına uygulanabilen bir Hadoop YARN "kaynak yönetimi platformu" ve büyük veri kümeleri için geçerli olan bir Hadoop MapReduce işlevi seti bulunur. Ayrıca, verileri hızlı ve verimli bir şekilde dizine eklenmesi veya alınması için dağıtılmış sistemler arasında depolanmasına yardımcı olan bir Hadoop dağıtılmış dosya sistemi (HDFS) de vardır.
Bunun ötesinde, Hadoop'a daha fazla aşina olmak isteyenler, yazılımı göreli bir düzeyde açıklayan profesyoneller için bireysel olarak yayınlanan kaynaklara bakabilirler. Kişisel bir blogda Chris Stucchio'nun bu örneği, Hadoop ve veri ölçeği hakkında mükemmel bir dizi nokta sunuyor. Temel çıkarımlardan biri, Hadoop'un gerekenden daha yaygın olarak kullanılabilmesi ve bireysel bir proje için en iyi çözüm olmamasıdır. Bu tür kaynakları gözden geçirmek, profesyonellerin herhangi bir senaryoda Hadoop'u kullanma ayrıntılarını daha iyi tanımasına yardımcı olacaktır. Stucchio ayrıca Hadoop'un işlevlerini belirli fiziksel görevlerle ilişkilendirmek için metaforlar sağlar. Burada örnek, bir kitaplıktaki kitap sayısını saymakla birlikte, bir Hadoop işlevi bu kitaplığı bölümlere ayırabilir ve tek bir toplu veri sonucuyla harmanlanmış ayrı sayımlar sağlayabilir.
Profesyonellerin Hadoop ve onun büyük verilere uygulanması hakkında daha fazla bilgi edinebilmelerinin daha derinlemesine bir yolu, özel eğitim kaynakları ve programlarıdır. Örneğin, uzaktan eğitim oturumlarının önde gelen sağlayıcısı olan çevrimiçi öğrenme şirketi Cloudera, Hadoop kullanımı ve benzer veri işleme türleri hakkında bir dizi ilginç seçeneğe sahiptir.