İçindekiler:
Tanımı - Takviye Öğrenimi ne demektir?
Takviye öğrenme, yapay zeka bağlamında, bir ödül ve ceza sistemi kullanarak algoritmaları eğiten bir tür dinamik programlamadır.
Bir takviye öğrenme algoritması veya aracısı çevresi ile etkileşerek öğrenir. Temsilci, doğru bir şekilde yerine getirerek ödüller ve yanlış bir şekilde yerine getirilmesi halinde ceza alır. Temsilci ödülü en üst düzeye çıkararak ve cezasını en aza indirerek bir insanın müdahalesi olmadan öğrenir.
Techopedia Takviye Öğrenimini Açıklıyor
Takviye öğrenme, davranışçı psikolojiden esinlenen makine öğrenimine bir yaklaşımdır. Bir çocuğun yeni bir görev yapmayı nasıl öğrendiğine benzer. Takviye öğrenimi, diğer makine öğrenimi yaklaşımlarıyla çelişir, çünkü algoritmaya açıkça bir görevin nasıl gerçekleştirileceği anlatılmaz, ancak kendi başına problem üzerinde çalışır.
Kendi kendine giden bir araba veya satranç oynayan bir program olabilecek bir ajan olarak çevresi ile etkileşime girer, güvenli bir şekilde hedefe sürmek veya bir oyun kazanmak gibi nasıl performans gösterdiğine bağlı olarak bir ödül durumu alır. Aksine, aracı yoldan çıkma veya kontrol altına alma gibi hatalı bir performans için ceza alır.
Ajan zaman içinde dinamik programlama kullanarak ödülünü en üst düzeye çıkarmak ve cezasını en aza indirmeye karar verir. Yapay zekaya bu yaklaşımın avantajı, bir AI programının bir programcının bir ajanın görevi nasıl yerine getirmesi gerektiğini yazmadan öğrenmesine izin vermesidir.
