İçindekiler:
- Efsane: Büyük verileri benimsemede herkes önümüzde.
- Efsane: Çok fazla veri var; her küçük veri hatası için endişelenmemize gerek yok.
- Söylenti: Büyük veri teknolojisi veri entegrasyonu ihtiyacını ortadan kaldıracaktır.
- Efsane: Gelişmiş analitik için bir veri ambarı kullanmak anlamsızdır.
- Efsane: Veri gölleri veri ambarının yerini alacak.
- Büyük Veri Çalışmaları - Yeni Veri İşleme Yöntemleri Yapılamayabilir
Mayıs 2014'te Forrester Research, büyük verileri çevreleyen hype hakkında bazı sonuçlar çıkaran iki rapor yayınladı. Araştırma firması 250'den fazla pazarlama ve iş geliştirme yöneticisini araştırdı. Raporun yazarlarına göre, büyük veri retoriği her zaman en yüksek seviyededir ve teknoloji satıcıları, inanılmaz iddialar gibi görünen ürünlerle dolaşıyorlar.
Gartner Forrester Research ile aynı fikirde; önemli hype büyük verileri çevreler. Eylül 2014 raporunda, Gartner en büyük veri efsanelerinden beşini çürütüyor ve Gartner analistleri büyük veriler ve manipülasyonu hakkında yanlış anlaşılan şeyler hakkında görüşlerini sunuyor. Peki büyük verilerin en büyük efsaneleri nelerdir? Bir bakalım.
Efsane: Büyük verileri benimsemede herkes önümüzde.
Gartner, büyük verilere ilginin tüm zamanların en yüksek seviyesinde olduğunu söylüyor. Buna rağmen, ankete katılanların yüzde 13'ünün çalışma sistemleri var. Nedeni: Çoğu şirket, büyük veri havuzlarından herhangi bir değerin nasıl çıkarılacağını henüz bulamadı. Burada, Gartner'ın anketi Forrester raporundan daha iyimser. Bu ankete katılanların sadece yüzde 9'u gelecek yıl büyük veri teknolojileri uygulamayı planladıklarını söyledi. (Büyük verilerin sunabileceği çok şey vardır. Büyük Verilerin Çözebileceği 5 Gerçek Dünya Probleminde daha fazla bilgi edinin.)Efsane: Çok fazla veri var; her küçük veri hatası için endişelenmemize gerek yok.
Gartner, insanların sahip olduğu bir foibledan endişe duyuyor: "Çok fazla var, kötü olanın önemi yok." Gartner'ın başkan yardımcısı ve seçkin analisti Ted Friedman, bunun duruma bakmak için yanlış yol olduğuna inanıyor.
Friedman, "Gerçekte, her bir hata, tüm veri kümesi üzerinde daha az veri olduğunda olduğundan daha küçük bir etkiye sahip olsa da, daha fazla veri olduğu için eskisinden daha fazla kusur var." Dedi. "Bu nedenle, düşük kaliteli verilerin tüm veri kümesi üzerindeki genel etkisi aynı kalır."
Friedman endişe için başka bir neden daha ekliyor. Büyük veri yakalama genellikle işletmenin dışından gelen ve bu nedenle bilinmeyen yapı ve kökene sahip olan verileri içerir. Bu hata olasılığını artırır.
Söylenti: Büyük veri teknolojisi veri entegrasyonu ihtiyacını ortadan kaldıracaktır.
Büyük verilere uygulanabilecek iki temel veri analizi stratejisi vardır: "yazma şeması" veya "okuma şeması". Yakın zamana kadar, kullanılan şema tek kullanılan yöntemdi. Okuma şeması, veritabanı yönetimindeki mevcut çılgınlıktır. Yapılandırılmış bir format gerektiren yazma şemasının aksine, veriler okunan şema veritabanlarına ham biçiminde yüklenir. Daha sonra Hadoop gibi yapılandırılmamış veritabanı platformlarını kullanan geliştiriciler, farklı verileri kullanılabilir bir biçime büküyor. Okuma şemasının belirgin avantajları vardır, ancak Gartner'ın belirttiği gibi, veri entegrasyonunun bir noktada gerçekleşmesi gerekir.Efsane: Gelişmiş analitik için bir veri ambarı kullanmak anlamsızdır.
Bir veri ambarı oluşturmak için zaman harcamak, özellikle yeni yakalanan veriler veri ambarındaki verilerden farklı olduğunda, birçok bilgi yöneticisine anlamsız gelir. Bununla birlikte, Gartner yine gelişmiş veri analitiğinin veri ambarlarını ve yeni verileri kullanacağı konusunda uyarıyor, yani veri entegratörleri:- Analiz için uygun hale getirmek için yeni veri türlerini hassaslaştırın
- Hangi verilerin alakalı olduğuna ve gereken veri kalitesi düzeyine karar verin
- Verilerin nasıl toplanacağını belirleme
- Veri ambarının veri ambarı dışındaki yerlerde gerçekleşebileceğini anlayın
Efsane: Veri gölleri veri ambarının yerini alacak.
Veri gölleri, verilerin yapılandırılmış bir formatta olduğu veri ambarlarının aksine, farklı verilerin depolarıdır. Bir veri gölü oluşturmak, veri ambarlarına kıyasla çok az çaba gerektirir (verileri biçimlendirmeye gerek yoktur), bu nedenle veri gölleri ilgi çekicidir.
Gartner, verilere sahip olmanın mesele olmadığını vurgulamaktadır - yakalanan verileri bilinçli karar verme için manipüle edebilmek önemlidir. Ayrıca, karar vermeyi kolaylaştırmak için (bir şekilde kanıtlanmamış) veri gölleri kullanmak sorunludur.
Gartner araştırma direktörü Nick Heudecker, "Veri ambarları zaten bir kuruluşta çok çeşitli kullanıcıları destekleyebilecek özelliklere sahip." Dedi. "Bilgi yönetimi liderleri veri göllerinin yetişmesini beklemek zorunda değiller." (Benimsemeden Önce Büyük Veriler Hakkında Bilmeniz Gereken 7 Şey'de büyük verileri kabul etme hakkında daha fazla bilgi edinin.)
Büyük Veri Çalışmaları - Yeni Veri İşleme Yöntemleri Yapılamayabilir
Gartner'ın "büyük veri mitleri" yerine "en büyük veri mitleri" söylemesinin nedeni, raporu okuduktan sonra netleşiyor. Gartner büyük veriyi temkinli değildir. Gartner, büyük verileri işlemenin daha yeni yöntemlerinin "prime time" için hazır olduğunu düşünenlerin temkinli.