Ev gelişme Markov karar süreci (MDP) nedir? - techopedia nedir?

Markov karar süreci (MDP) nedir? - techopedia nedir?

İçindekiler:

Anonim

Tanımı - Markov Karar Süreci (MDP) ne anlama geliyor?

Markov karar süreci (MDP), profesyonellerin “ayrık zamanlı stokastik kontrol süreci” olarak adlandırdığı bir şeydir. Rus akademisyen Andrey Markov'un 19. yüzyılın sonlarında ve 20. yüzyılın başlarında öncülük ettiği matematiğe dayanıyor.

Techopedia, Markov Karar Süreci'ni (MDP) açıklıyor

Bir Markov karar sürecini ve ilişkili Markov zincirlerini açıklamanın bir yolu, bunların yüz yıl önce Rus bilim adamı tarafından daha basit matematiksel araştırmalara dayanan modern oyun teorisinin unsurları olmasıdır. Bir Markov karar sürecinin tanımı, bir sistemin belirli bir eyalet kümesinde olduğu bir senaryoyu incelemesi ve bir karar vericinin kararlarına dayanarak başka bir duruma geçmesidir.

Model olarak bir Markov zinciri, belirli bir olayın olasılığının önceden elde edilmiş bir duruma bağlı olduğu bir dizi olayı gösterir. Profesyoneller Markov karar sürecini tanımlarken “sayılabilir bir devlet alanı” hakkında konuşabilirler - bazıları Markov karar modeli fikrini bir “rastgele yürüyüş” modeli ya da olasılıklara dayanan diğer rasgele yürüyüş modeli (genellikle duvara atıfta bulunulan rastgele yürüyüş modeli) ile ilişkilendirir. Street, piyasa olasılığı bağlamında bir özkaynak hareketini yukarı veya aşağı modeller).

Genel olarak, Markov karar süreçleri genellikle profesyonellerin bugün üzerinde çalıştığı en gelişmiş teknolojilerden bazılarına, örneğin robotik, otomasyon ve araştırma modellerinde uygulanır.

Markov karar süreci (MDP) nedir? - techopedia nedir?