By visiting our site, you agree to our privacy policy regarding cookies, tracking statistics, etc.
Šis modulis pēta pastiprinājuma mācīšanos, mašīnmācīšanās veidu, kurā aģenti apgūst lēmumu pieņemšanu, mijiedarbojoties ar vidi, lai maksimāli palielinātu uzkrāto atlīdzību. Tas aptver galvenos jēdzienus, piemēram, Markova lēmumu procesu, politikas optimizāciju un uz vērtībām balstītas metodes, kā arī pielietojumus tādās jomās kā spēļu izstrāde, robotika un autonomās sistēmas.
Loading…