S:
Makine öğrenmede özellik seçimi neden bu kadar önemlidir?
A:Özellik seçimi, makine öğreniminde son derece önemlidir, çünkü değişkenlerin kullanımını belirli bir makine öğrenim sistemi için en verimli ve etkili olana yönlendirmek için temel bir teknik görevi görür.
Uzmanlar, boyutsallığın lanetini en aza indirmek veya aşırı takma ile başa çıkmaya yardımcı olmak için özellik seçimi ve özellik çıkarmanın nasıl çalıştığından bahsediyorlar - bunlar aşırı karmaşık modelleme fikrini ele almanın farklı yolları.
Ücretsiz İndirme: Makine Öğrenmesi ve Neden Önemlidir |
Bunu söylemenin başka bir yolu, özellik seçiminin geliştiricilere, makine öğrenimi eğitim setlerinde yalnızca en alakalı ve yararlı verileri kullanmaları için araçlar sağlamaya yardımcı olması ve maliyetleri ve veri hacmini önemli ölçüde azaltmasıdır.
Buna bir örnek, karmaşık bir şekli ölçekli ölçme fikridir. Program ölçeklendikçe daha fazla sayıda veri noktasını belirler ve sistem çok daha karmaşık hale gelir. Ancak karmaşık bir şekil, bir makine öğrenme sisteminin kullandığı tipik veri seti değildir. Bu sistemler, farklı değişkenler arasında oldukça farklı varyans seviyelerine sahip veri kümelerini kullanabilir. Örneğin, türlerin sınıflandırılmasında mühendisler özellik seçimini yalnızca kendilerine en çok hedeflenen sonuçları verecek değişkenleri incelemek için kullanabilirler. Grafikteki her hayvan aynı sayıda göze veya bacağa sahipse, bu veriler kaldırılabilir veya daha alakalı başka veri noktaları çıkarılabilir.
Özellik seçimi, mühendislerin makine öğrenme sistemlerini bir hedefe yönlendirdiği ayrımcı süreçtir. Karmaşıklığı ölçekli sistemlerden kaldırma fikrine ek olarak, özellik seçimi, uzmanların makine öğreniminde "önyargı varyans ödünleşimi" olarak adlandırdıkları yönlerin optimize edilmesinde de yararlı olabilir.
Özellik seçiminin yanlılık ve varyans analizine yardımcı olmasının nedenleri daha karmaşıktır. Cornell Üniversitesi'nden özellik seçimi, sapma sapması ve torbalama üzerine bir çalışma, özellik seçiminin projelere nasıl yardımcı olduğunu göstermeye hizmet ediyor.
Yazarlara göre, makale "özellik seçiminin denetimli öğrenmenin doğruluğunu geliştirdiği mekanizmayı inceliyor."
Çalışma ayrıca şunları belirtmektedir:
Özellik seçimi ilerledikçe ampirik bir sapma / sapma analizi, en doğru özellik kümesinin, öğrenme algoritması için en iyi sapma-sapma dengeleme noktasına karşılık geldiğini gösterir.
Güçlü veya zayıf alaka düzeyinin kullanımını tartışırken, yazarlar özellik seçiminden "bir varyans azaltma yöntemi" olarak bahseder - bu, varyansı belirli bir değişkendeki varyasyon miktarı olarak düşündüğünüzde mantıklıdır. Varyans yoksa, veri noktası veya dizi temelde işe yaramaz olabilir. Çok yüksek bir varyans varsa, mühendislerin "gürültü" veya makine öğrenme sisteminin yönetmesi zor olan alakasız, keyfi sonuçlar olarak düşünebilecekleri şeylere dönüşebilir.
Bunun ışığında, özellik seçimi, makine öğreniminde tasarımın temel bir parçasıdır.