İçindekiler:
- Tanımı - Veritabanlarında Bilgi Keşfi (KDD) ne anlama geliyor?
- Techopedia Veritabanlarında Bilgi Keşfini (KDD) açıklıyor
Tanımı - Veritabanlarında Bilgi Keşfi (KDD) ne anlama geliyor?
Veritabanlarında bilgi keşfi (KDD) bir veri topluluğundan faydalı bilgileri keşfetme sürecidir. Bu yaygın olarak kullanılan veri madenciliği tekniği, veri hazırlama ve seçme, veri temizleme, veri kümeleri hakkında önceden bilgi içeren ve gözlemlenen sonuçlardan doğru çözümleri yorumlayan bir süreçtir.
Başlıca KDD uygulama alanları pazarlama, sahtekarlık tespiti, telekomünikasyon ve imalattır.
Techopedia Veritabanlarında Bilgi Keşfini (KDD) açıklıyor
Geleneksel olarak, veri madenciliği ve bilgi keşfi elle yapıldı. Zaman geçtikçe, birçok sistemdeki veri miktarı terabayt boyutundan daha büyük bir boyuta ulaştı ve artık manuel olarak tutulamıyordu. Ayrıca, herhangi bir işletmenin başarılı bir şekilde var olması için, verilerdeki temel örüntülerin keşfedilmesi esastır. Sonuç olarak, gizli verileri keşfetmek ve yapay zekanın bir parçasını oluşturan varsayımlar yapmak için çeşitli yazılım araçları geliştirildi.
KDD süreci son 10 yılda zirveye ulaştı. Şimdi, tümevarımsal öğrenme, Bayesci istatistik, semantik sorgu optimizasyonu, uzman sistemler için bilgi edinimi ve bilgi teorisi gibi birçok farklı keşif yaklaşımına ev sahipliği yapmaktadır. Nihai hedef, düşük seviyeli verilerden üst düzey bilgi elde etmektir.
KDD, multidisipliner faaliyetleri içerir. Bu, veri depolama ve erişimi, devasa veri setlerine ölçekleme algoritmalarını ve sonuçları yorumlamayı kapsar. Veri depolamada yer alan veri temizleme ve veri erişim süreci KDD sürecini kolaylaştırır. Yapay zeka ayrıca deney ve gözlemlerden gelen ampirik yasaları keşfederek KDD'yi destekler. Verilerde tanınan örüntüler yeni veriler üzerinde geçerli olmalı ve bir dereceye kadar kesinliğe sahip olmalıdır. Bu kalıplar yeni bilgi olarak kabul edilir. KDD sürecinin tamamında yer alan adımlar şunlardır:
- KDD sürecinin amacını müşterinin bakış açısından tanımlayın.
- İlgili uygulama alanlarını ve gerekli bilgileri anlayın
- Keşfin gerçekleştirileceği hedef veri kümesini veya veri örneklerinin alt kümesini seçin.
- Eksik alanları işlemek ve verileri gereksinimlere göre değiştirmek için stratejilere karar vererek verileri temizleyin ve önişleyin.
- İstenmeyen değişkenleri kaldırarak veri kümelerini basitleştirin. Ardından, hedefe veya göreve bağlı olarak verileri temsil etmek için kullanılabilecek yararlı özellikleri analiz edin.
- Gizli kalıpları önermek için KDD hedeflerini veri madenciliği yöntemleriyle eşleştirin.
- Gizli kalıpları keşfetmek için veri madenciliği algoritmalarını seçin. Bu işlem, genel KDD işlemi için hangi modellerin ve parametrelerin uygun olabileceğine karar vermeyi içerir.
- Sınıflandırma kuralları veya ağaçlar, regresyon ve kümelenmeyi içeren belirli bir temsili formda ilgi kalıplarını arayın.
- Temel bilgileri mayınlı kalıplardan yorumlar.
- Bilgiyi kullanın ve daha fazla işlem için başka bir sisteme dahil edin.
- Belgelendirin ve ilgili taraflar için raporlar hazırlayın.