Ev Ses Maksimum havuzlama, alexnet'i görüntü işleme için mükemmel bir teknoloji haline getirmeye nasıl yardımcı olur?

Maksimum havuzlama, alexnet'i görüntü işleme için mükemmel bir teknoloji haline getirmeye nasıl yardımcı olur?

Anonim

S:

Maksimum havuzlama, AlexNet'i görüntü işleme için mükemmel bir teknoloji haline getirmeye nasıl yardımcı olur?

A:

Yenilikçi bir evrişimli sinir ağı olan AlexNet'te, maksimum havuzlama kavramı, kısmen sinir ağının uzmanların dediği görüntülerle çalışmasında uydurmaya yardımcı olmak ve işleri kolaylaştırmak amacıyla, birden fazla evrişimsel katmana sahip karmaşık bir modele yerleştirilir. “doğrusal olmayan bir altörnekleme stratejisi”.

AlexNet, makine öğrenimi ve sinir ağı gelişimi için bir havza etkinliği olarak görülen 2012 ILSVRC'yi (ImageNet Büyük Ölçekli Görsel Tanıma Mücadelesi) kazanan oldukça büyük bir CNN olarak kabul edilmektedir (bazıları buna bilgisayar vizyonunun “Olimpiyatları” demektedir) ).

Eğitimin iki GPU'ya bölündüğü ağ çerçevesinde beş evrişimsel katman, üç tam bağlantılı katman ve bir miktar maksimum havuzlama uygulaması vardır.

Esasen, maksimum havuzlama, çıktıların “havuzunu” bir nöron koleksiyonundan alır ve bunları bir sonraki katmanın değerlerine uygular. Bunu anlamanın bir başka yolu, maksimum havuzlama yaklaşımının, modeli daha uygun bir şekilde takma uğruna değerleri pekiştirebilmesi ve basitleştirebilmesidir.

Maksimum havuzlama, degradelerin hesaplanmasına yardımcı olabilir. “Hesaplama yükünü azaltır” ya da “aşırı sığmayı daraltır” diyebiliriz - aşağı örnekleme yoluyla, maksimum havuzlama “boyutsallık azalması” olarak adlandırılan şeye bağlanır.

Boyut azalması, sinir ağı üzerinden yürütülmesi zor olan karmaşık bir modele sahip olma konusunu ele alır. Birçok küçük pürüzlü konturla ve bu çizginin her küçük parçasının bir veri noktasıyla temsil edildiği karmaşık bir şekil düşünün. Boyutsal azaltma ile mühendisler, modeli bir bütün olarak daha basit hale getirmek için makine öğrenme programının daha az veri noktasını "uzaklaştırmasına" veya örneklemesine yardımcı oluyor. Bu nedenle, maksimum havuzlama katmanına ve çıktısına bakarsanız, bazen boyutsallık azaltma stratejisine karşılık gelen daha basit bir pikselleşme görebilirsiniz.

AlexNet ayrıca rektifiye edilmiş doğrusal birimler (ReLU) adı verilen bir işlev kullanır ve maksimum havuzlama, görüntüleri CNN yoluyla işlemede bu tekniği tamamlayıcı olabilir.

Uzmanlar ve projeye dahil olanlar, AlexNet'in belirli yapısını göstermek için bol miktarda görsel model, denklem ve diğer detaylar sundular, ancak genel anlamda, maksimum havuzlamayı çoklu yapay nöronların çıktısını birleştirmek veya birleştirmek olarak düşünebilirsiniz. Bu strateji, en yeni makine görüşü ve görüntü sınıflandırması ile eşanlamlı hale gelen CNN'nin genel yapısının bir parçasıdır.

Maksimum havuzlama, alexnet'i görüntü işleme için mükemmel bir teknoloji haline getirmeye nasıl yardımcı olur?