Ev Ses Makine öğreniminde torbalama neden varyansı azaltır?

Makine öğreniminde torbalama neden varyansı azaltır?

Anonim

S:

Makine öğreniminde torbalama neden varyansı azaltır?

A:

Makine öğreniminde önyükleme toplama veya "torbalama", daha gelişmiş karmaşık veri kümeleri modelleri oluşturarak varyansı azaltır. Özellikle, torbalama yaklaşımı, verileri daha ilgili bir şekilde modellemek için genellikle çakışan alt kümeler oluşturur.

Torbalamanın nasıl uygulanacağına dair ilginç ve açık bir fikir, bir dizi rastgele örnek almak ve basit ortalamayı çıkarmaktır. Daha sonra, aynı örnek kümesini kullanarak, sonuç sonuçlarını değiştirmek için karar ağaçları olarak oluşturulmuş düzinelerce alt küme oluşturun. İkinci ortalama, bu münferit örneklerin değer açısından birbirleriyle nasıl ilişkilendiğine dair daha net bir resim göstermelidir. Aynı fikir, herhangi bir veri noktası kümesinin herhangi bir özelliğine uygulanabilir.

Ücretsiz İndirme: Makine Öğrenmesi ve Neden Önemlidir

Bu yaklaşım, keşfi daha tanımlanmış sınırlar içinde birleştirdiğinden, varyansı azaltır ve fazla takmaya yardımcı olur. Biraz dağıtılmış veri noktalarına sahip bir dağılım grafiği düşünün; bir torbalama yöntemi kullanarak, mühendisler karmaşıklığı küçültür ve keşif hatlarını daha akıcı parametrelere yönlendirir.

Bazıları torbalamanın değeri “böl ve fethet” ya da bir tür “yardımlı buluşsal yöntem” olarak bahseder. Fikir, rastgele ormanların kullanımı gibi topluluk modellemesi yoluyla, torbalama yöntemini teknik olarak kullananların varyans olarak daha düşük veri sonuçları alabilmesidir. Karmaşıklığı azaltma açısından, torbalama da aşırı sığdırmaya yardımcı olabilir. Çok fazla veri noktasına sahip bir model düşünün: örneğin, 100 hizalanmamış nokta içeren bir bağlantı noktaları. Ortaya çıkan görsel veri hattı pürüzlü, dinamik, uçucu olacaktır. Sonra değerlendirme kümelerini bir araya getirerek varyansı "ütüleyin". Topluluk öğrenmesinde, bunun genellikle "güçlü öğrenme" işbirliğine dayalı bir sonuç sağlamak için birkaç "zayıf öğreniciye" katılması olarak düşünülür. Sonuç, daha yumuşak, daha konturlu bir veri hattı ve modelde daha az vahşi varyanstır.

Torbalama fikrinin kurumsal BT sistemlerine nasıl uygulanabileceğini görmek kolaydır. İş liderleri genellikle ürünler, müşteriler, vb. İle ilgili neler olduğunu "kuşbakışı görmek" ister. Aşırı donanımlı bir model daha az sindirilebilir veri ve torbalamanın bir modeli "stabilize edebileceği" ve daha kullanışlı hale getirebileceği daha "dağınık" sonuçlar verebilir son kullanıcılara.

Makine öğreniminde torbalama neden varyansı azaltır?