{"id":624,"count":4,"description":"Deze module behandelt reinforcement learning, een vorm van machine learning waarbij agents leren beslissingen te nemen door interactie met een omgeving om de cumulatieve beloning te maximaliseren. Het behandelt belangrijke concepten zoals het Markov-beslissingsproces, beleidsoptimalisatie en op waarde gebaseerde methoden, samen met toepassingen op gebieden zoals gaming, robotica en autonome systemen.","link":"https:\/\/virtual-routes.org\/nl\/portaalcategorie\/kunstmatige-intelligentie\/versterkend-leren\/","name":"Versterkend leren","slug":"versterkend-leren","taxonomy":"portal-category","parent":619,"meta":[],"acf":[],"_links":{"self":[{"href":"https:\/\/virtual-routes.org\/nl\/wp-json\/wp\/v2\/portal-category\/624","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/virtual-routes.org\/nl\/wp-json\/wp\/v2\/portal-category"}],"about":[{"href":"https:\/\/virtual-routes.org\/nl\/wp-json\/wp\/v2\/taxonomies\/portal-category"}],"up":[{"embeddable":true,"href":"https:\/\/virtual-routes.org\/nl\/wp-json\/wp\/v2\/portal-category\/619"}],"wp:post_type":[{"href":"https:\/\/virtual-routes.org\/nl\/wp-json\/wp\/v2\/portal-item?portal-category=624"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}