İçindekiler:
Tanım - Veri Madenciliği ne demektir?
Veri madenciliği, veri analizi gibi ortak alanlarda toplanan ve bir araya getirilen, verimli analiz, veri madenciliği algoritmaları, iş karar vermeyi kolaylaştırmak ve diğer bilgileri kolaylaştırmak için gizli veri modellerini farklı bakış açılarına göre farklı bakış açılarına göre analiz etme sürecidir. nihayetinde maliyetleri düşürmek ve geliri artırmak için gereksinimler.
Veri madenciliği, veri keşfi ve bilgi keşfi olarak da bilinir.
Techopedia Veri Madenciliğini Açıklıyor
Veri madenciliği sürecinde yer alan başlıca adımlar şunlardır:
- Verileri bir veri ambarına çıkarın, dönüştürün ve yükleyin
- Çok boyutlu veritabanlarında veri depolama ve yönetme
- Uygulama yazılımını kullanarak iş analistlerine veri erişimi sağlama
- Analiz edilen verileri grafikler gibi kolayca anlaşılabilir formlarda sunma
Veri madenciliğinde ilk adım, işletmeler için kritik önem taşıyan verileri toplamaktır. Şirket verileri, işlemsel, işlem dışı veya meta verilerdir. İşlem verileri satış, envanter ve maliyet gibi günlük işlemlerle ilgilenir. İşlem dışı veriler normalde tahmin edilirken, meta veriler mantıksal veritabanı tasarımı ile ilgilidir. Veri öğeleri arasındaki desenler ve ilişkiler, kurumsal geliri artırabilecek ilgili bilgileri oluşturur. Güçlü bir tüketici odaklı kuruluşlar, satılan ürünlerin net fiyatlarını, fiyatını, rekabetini ve müşteri demografisini sağlayan veri madenciliği teknikleri ile ilgilenmektedir.
Örneğin, perakende devi Wal-Mart tüm ilgili bilgilerini terabayt veri içeren bir veri ambarına iletir. Bu verilere, müşterilerin satın alma alışkanlıklarını tespit etmelerini sağlayan tedarikçiler tarafından kolayca erişilebilir. Alışveriş alışkanlıkları, en çok alışveriş yapılan günler, en çok aranan ürünler ve veri madenciliği tekniklerini kullanan diğer veriler üzerinde kalıplar oluşturabilirler.
Veri madenciliğinde ikinci adım uygun bir algoritma - veri madenciliği modeli üreten bir mekanizma seçmektir. Algoritmanın genel çalışması, bir veri kümesindeki eğilimleri belirlemeyi ve çıktıyı parametre tanımı için kullanmayı içerir. Veri madenciliği için kullanılan en popüler algoritmalar, veri öğeleri arasındaki ilişkileri tanımlamak için kullanılan sınıflandırma algoritmaları ve regresyon algoritmalarıdır. Oracle ve SQL gibi büyük veritabanı satıcıları, veri madenciliği talebini karşılamak için kümeleme ve regresyon gerilimi gibi veri madenciliği algoritmaları kullanır.