{"id":624,"count":4,"description":"Modu\u0142 ten bada uczenie ze wzmocnieniem, rodzaj uczenia maszynowego, w kt\u00f3rym agenci ucz\u0105 si\u0119 podejmowa\u0107 decyzje poprzez interakcj\u0119 ze \u015brodowiskiem w celu maksymalizacji skumulowanej nagrody. Obejmuje on kluczowe koncepcje, takie jak proces decyzyjny Markowa, optymalizacja polityki i metody oparte na warto\u015bciach, wraz z zastosowaniami w obszarach takich jak gry, robotyka i systemy autonomiczne.","link":"https:\/\/virtual-routes.org\/pl\/portal-category\/artificial-intelligence\/reinforcement-learning\/","name":"Uczenie ze wzmocnieniem","slug":"uczenie-ze-wzmocnieniem","taxonomy":"portal-category","parent":619,"meta":[],"acf":[],"_links":{"self":[{"href":"https:\/\/virtual-routes.org\/pl\/wp-json\/wp\/v2\/portal-category\/624","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/virtual-routes.org\/pl\/wp-json\/wp\/v2\/portal-category"}],"about":[{"href":"https:\/\/virtual-routes.org\/pl\/wp-json\/wp\/v2\/taxonomies\/portal-category"}],"up":[{"embeddable":true,"href":"https:\/\/virtual-routes.org\/pl\/wp-json\/wp\/v2\/portal-category\/619"}],"wp:post_type":[{"href":"https:\/\/virtual-routes.org\/pl\/wp-json\/wp\/v2\/portal-item?portal-category=624"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}