Teknoloji girişimleri arasında, veri bilimcisi, geleneksel olarak ayrı veri istihbaratının işlevsel alanlarını köprüleyebilen veri meraklılarına atıfta bulunmak için kullanılan yaygın bir terimdir. Bir veri bilimcisi, veri istihbarat projelerinin çeşitli yönlerini (hepsi olmasa da) gerçekleştirmekte rahat olan kişidir:
- Veri Toplama: Bu, geleneksel olmayan veri kaynakları için belirli web hizmetlerini veya API'ları hedefleyen özel ayrıştırıcılar ve web tarayıcıları veya komut dosyaları yazmayı gerektirebilir.
- Veri Yönetimi: Veritabanlarında, anahtar / değer depolarında veya Hadoop'taki verileri ETL, yönetme, sorgulama ve koruma.
- Bilgi Görselleştirme: Statik görselleştirme araç takımları ve / veya Flash, JavaScript veya İşleme tabanlı etkileşimli platformlar kullanılarak kalıpların ortaya çıkarılması.
- Analytics: Bu, çok değişkenli istatistiklerde, makine öğreniminde ve NLP'de basitten karmaşık tekniklere kadar değişebilir.
- İçgörü: Temel bulguları geniş bir kitleye çıkarın, özetleyin ve sunun.
Birçok araç, beceri ve teknik detay vardır ve yukarıda listelenen öğelerin her birinde ustalaşmak için yıllar geçirebilirsiniz. Bir veri bilimcisi hiçbir alanda gerçek uzman bilgisine sahip olmasa da, ileri geri atlama ve hepsinde temel görevleri yerine getirme konusunda rahattır. Sonuç, bir veri projesini hızlı bir şekilde araştıracak ve yönetimden (üst düzey) sorulara cevaplar üretecek kadar çevik bir veri meraklısıdır. (Veri Bilimcilerindeki veri bilimcileri hakkında: Teknoloji Dünyasının Yeni Rock Yıldızları.)
Veri bilimcilerini beslemek için şirketlerin kültür ve organizasyon yapısına daha fazla odaklanması gerekiyor. Birçok veri çalışanı, veri zekasının birçok alanında hızla üretken olmak için yeterli beceri ve eğitime sahiptir. Sorun şu ki, çoğu onları veri bilimcisi olmaya teşvik eden ortamlarda çalışmaz. Silolara yapışmış ve bir veya iki veri zekası alanıyla sınırlı. Genellikle, yöneticileri tarafından "onaylanmış" araçlar kullanmakla sınırlandırılırlar.