{"id":14884,"date":"2020-10-27T17:06:42","date_gmt":"2020-10-27T16:06:42","guid":{"rendered":"http:\/\/www.iic.uam.es\/en\/?page_id=14884"},"modified":"2020-10-27T17:06:42","modified_gmt":"2020-10-27T16:06:42","slug":"reinforcement-learning","status":"publish","type":"page","link":"https:\/\/www.iic.uam.es\/en\/artificial-intelligence\/reinforcement-learning\/","title":{"rendered":"Reinforcement Learning"},"content":{"rendered":"[vc_row bg_image=&#8221;14731&#8243; text_color=&#8221;light&#8221; text_align=&#8221;center&#8221; top_padding=&#8221;60&#8243; bottom_padding=&#8221;60&#8243;][vc_column column_padding=&#8221;padding-4&#8243; width=&#8221;1\/1&#8243;][vc_column_text]\n<h1 style=\"font-size: 55px; text-align: center;\">Reinforcement Learning and Optimization<\/h1>\n[\/vc_column_text][vc_column_text]\n<p style=\"font-size: 28px; line-height: 30px; text-align: center;\">Las mejores estrategias a partir de los datos<\/p>\n[\/vc_column_text][\/vc_column][\/vc_row][vc_row top_padding=&#8221;30&#8243;][vc_column column_padding=&#8221;padding-1&#8243; width=&#8221;1\/1&#8243;][vc_column_text]\n<p style=\"text-align: center; font-size: 21px;\">El Big Data, la Inteligencia Artificial o el Machine Learning se orientan hacia <strong>la automatizaci\u00f3n y el apoyo en la toma de decisiones<\/strong>, pero se puede ir m\u00e1s all\u00e1. Con el conocimiento que proporcionan los datos, se pueden planear estrategias y optimizar tareas, procesos y servicios.<\/p>\n[\/vc_column_text][\/vc_column][\/vc_row][vc_row equal_height=&#8221;yes&#8221; content_placement=&#8221;top&#8221; type=&#8221;full_width_section&#8221; top_padding=&#8221;0&#8243; bottom_padding=&#8221;0&#8243;][vc_column bg_color=&#8221;#3591c4&#8243; column_padding=&#8221;padding-3&#8243; column_center=&#8221;true&#8221; text_color=&#8221;light&#8221; width=&#8221;1\/2&#8243; delay=&#8221;0&#8243;]<div class=\"single_image wpb_content_element align-center \" data-animation=\"none\" data-delay=\"\"><img decoding=\"async\" src=\"https:\/\/www.iic.uam.es\/wp-content\/uploads\/2020\/10\/aprendizaje-automatico.jpg\" alt=\"aprendizaje autom\u00e1tico\" \/><\/div>[vc_column_text]\n<h2 style=\"text-align: center;\">\u00bfQu\u00e9 es el aprendizaje por refuerzo?<\/h2>\n[\/vc_column_text][vc_column_text]\n<p style=\"font-size: 19px; text-align: justify;\">El aprendizaje por refuerzo (o Reinforcement Learning) es una variedad del <a href=\"\/inteligencia-artificial\/machine-learning-deep-learning\/\"><u>Machine Learning<\/u><\/a> que permite a una <strong>Inteligencia Artificial<\/strong> planear estrategias efectivas en base a la experimentaci\u00f3n con los datos.<\/p>\n[\/vc_column_text][vc_column_text]\n<p style=\"text-align: justify; font-size: 16px;\">Se trata de una forma de optimizaci\u00f3n basada en datos. La m\u00e1quina aprende a partir de su propia experiencia, interaccionando con el entorno hasta dar con el comportamiento ideal. A partir de la informaci\u00f3n disponible, emprender\u00e1 acciones que repetir\u00e1 y \u201creforzar\u00e1\u201d seg\u00fan las recompensas que obtenga, que pueden ser positivas o negativas.<\/p>\n[\/vc_column_text]<div class=\"spacer\" style=\"height: 40px;\"><\/div>[\/vc_column][vc_column bg_color=&#8221;#f3f3f3&#8243; column_padding=&#8221;padding-3&#8243; column_center=&#8221;true&#8221; width=&#8221;1\/2&#8243;]<div class=\"single_image wpb_content_element align-center \" data-animation=\"none\" data-delay=\"\"><img decoding=\"async\" src=\"https:\/\/www.iic.uam.es\/wp-content\/uploads\/2020\/10\/funcion-aprendizaje-automatico.png\" alt=\"funci\u00f3n aprendizaje\" \/><\/div>[vc_column_text]\n<h2 style=\"text-align: center;\">\u00bfC\u00f3mo funciona el aprendizaje por refuerzo?<\/h2>\n[\/vc_column_text][vc_column_text]\n<p style=\"font-size: 19px; text-align: justify; color: #333333;\">M\u00e1s que tomar decisiones o hacer predicciones, el aprendizaje por refuerzo genera estrategias autom\u00e1ticamente. Esto permite, entre otras aplicaciones, un mantenimiento predictivo o la personalizaci\u00f3n de experiencias de cliente.<\/p>\n[\/vc_column_text][vc_column_text]Una de las caracter\u00edsticas fundamentales de los sistemas de aprendizaje por refuerzo es la iniciativa.<\/p>\n<ol>\n<li style=\"padding-bottom: 10px;\">Es el propio sistema el que explota los datos, analizando las estrategias que han funcionado en el pasado y repiti\u00e9ndolas cuando se presenten situaciones similares en el futuro.<\/li>\n<li style=\"padding-bottom: 10px;\">Adem\u00e1s, explora nuevas acciones o estrategias, evaluando la efectividad de las mismas y consiguiendo as\u00ed mejorar las pasadas y prepararse ante nuevos escenarios.<\/li>\n<li style=\"padding-bottom: 10px;\">Con esta informaci\u00f3n, se puede planear una nueva estrategia de negocio.<\/li>\n<\/ol>\n[\/vc_column_text][\/vc_column][\/vc_row][vc_row top_padding=&#8221;30&#8243; bottom_padding=&#8221;30&#8243;][vc_column width=&#8221;1\/1&#8243;][vc_column_text]\n<p style=\"text-align: center; font-size: 20px;\"><span style=\"color: #333333;\">Un paso m\u00e1s en este tipo de aprendizaje ser\u00eda el Deep Reinforcement Learning o aprendizaje profundo por refuerzo<\/span><\/p>\n[\/vc_column_text][vc_row_inner][vc_column_inner width=&#8221;1\/4&#8243;][\/vc_column_inner][vc_column_inner width=&#8221;1\/2&#8243;]<div class=\"iconbox  wpb_content_element iconbox-style-4 icon-color-accent color-dark clearfix\"><div class=\"iconbox-icon\"><img src='https:\/\/www.iic.uam.es\/wp-content\/uploads\/2020\/09\/marchine-learning.png' class='iconimg' \/><\/div><div class=\"iconbox-content\"><h3>DEEP REINFORCEMENT LEARNING<\/h3><p>El aprendizaje profundo por refuerzo es el campo que unifica Deep Learning y Reinforcement Learning para crear estrategias complejas, que optimicen procesos a partir de datos no estructurados como im\u00e1genes o textos.<\/p><\/div><\/div><a href=\"\/aprendizaje-profundo-por-refuerzo\/\" target=\"_self\" class=\"button color-2 full \" style=\"border-radius: 2px;\">Aprendizaje profundo por refuerzo<\/a>[\/vc_column_inner][vc_column_inner width=&#8221;1\/4&#8243;][\/vc_column_inner][\/vc_row_inner][\/vc_column][\/vc_row][vc_row content_placement=&#8221;top&#8221; bg_image=&#8221;10637&#8243; bg_repeat=&#8221;no-repeat&#8221; parallax_bg=&#8221;true&#8221; text_color=&#8221;light&#8221; text_align=&#8221;center&#8221; top_padding=&#8221;40&#8243; bottom_padding=&#8221;40&#8243;][vc_column width=&#8221;1\/1&#8243;][vc_column_text]\n<h3 style=\"text-align: center;\">Te ayudamos a plantear estrategias basadas en datos con el aprendizaje por refuerzo<\/h3>\n[\/vc_column_text]<a href=\"\/big-data-inteligencia-artificial\/informacion-big-data-inteligencia-artificial\/\" target=\"_self\" class=\"button blue large \" style=\"border-radius: 2px;\">\u00a1TE AYUDAMOS!<\/a>[\/vc_column][\/vc_row][vc_row equal_height=&#8221;yes&#8221; content_placement=&#8221;top&#8221; type=&#8221;full_width_section&#8221; top_padding=&#8221;0&#8243; bottom_padding=&#8221;0&#8243;][vc_column bg_color=&#8221;#3591c4&#8243; column_padding=&#8221;padding-3&#8243; column_center=&#8221;true&#8221; text_color=&#8221;light&#8221; width=&#8221;1\/2&#8243; delay=&#8221;0&#8243;]<div class=\"single_image wpb_content_element align-center \" data-animation=\"none\" data-delay=\"\"><img decoding=\"async\" src=\"https:\/\/www.iic.uam.es\/wp-content\/uploads\/2020\/10\/optimizacion.jpg\" alt=\"optimizaci\u00f3n\" \/><\/div>[vc_column_text]\n<h2 style=\"text-align: center;\">\u00bfQu\u00e9 es la optimizaci\u00f3n?<\/h2>\n[\/vc_column_text][vc_column_text]\n<p style=\"font-size: 19px; text-align: justify;\">La <strong>optimizaci\u00f3n<\/strong> consiste en planificar estrategias para mejorar un proceso empresarial hasta cierto objetivo: reducir los costes, minimizar los riesgos o aumentar los beneficios.<\/p>\n[\/vc_column_text][vc_column_text]\n<p style=\"text-align: justify; font-size: 16px;\">Suele nutrirse del <strong>an\u00e1lisis del Big Data<\/strong> y, mediante el aprendizaje por refuerzo u otras t\u00e9cnicas de <strong>Inteligencia Artificial<\/strong>, es una forma de implementar la llamada anal\u00edtica prescriptiva, para que nos gu\u00ede en las decisiones a tomar.<\/p>\n<p style=\"text-align: justify; font-size: 16px;\">Un <strong>sistema de optimizaci\u00f3n<\/strong> analiza los costes y beneficios previstos de cada una de las posibles decisiones, sugiriendo aquellas con mayor rentabilidad. Para realizar estas previsiones de forma certera emplea simulaciones y modelos predictivos, construidos en base a datos hist\u00f3ricos y reglas de negocio.<\/p>\n[\/vc_column_text]<div class=\"spacer\" style=\"height: 40px;\"><\/div>[\/vc_column][vc_column bg_color=&#8221;#f3f3f3&#8243; column_padding=&#8221;padding-3&#8243; column_center=&#8221;true&#8221; width=&#8221;1\/2&#8243;]<div class=\"single_image wpb_content_element align-center \" data-animation=\"none\" data-delay=\"\"><img decoding=\"async\" src=\"https:\/\/www.iic.uam.es\/wp-content\/uploads\/2020\/10\/beneficio-optimizacion.png\" alt=\"beneficios optimizaci\u00f3n\" \/><\/div>[vc_column_text]\n<h2 style=\"text-align: center;\">\u00bfQu\u00e9 beneficios aporta la optimizaci\u00f3n?<\/h2>\n[\/vc_column_text]<div class=\"iconbox  wpb_content_element iconbox-style-1 icon-color-accent color-dark\"><h3><i class=\"fa sl-settings boxicon\" style=\"\"><\/i>Planificaci\u00f3n data-driven<\/h3><p>El <strong>an\u00e1lisis de datos<\/strong> permite crear estrategias a medida para cualquier empresa o sector.<\/p><\/div><div class=\"iconbox  wpb_content_element iconbox-style-1 icon-color-accent color-dark\"><h3><i class=\"fa sl-shuffle boxicon\" style=\"\"><\/i>Mayor eficiencia y calidad de los servicios<\/h3><p>La <a href=\"\/big-data\/analitica-prescriptiva\/\">anal\u00edtica prescriptiva<\/a> recomienda acciones para conseguir una mayor productividad, una mejor selecci\u00f3n de candidatos o una mayor satisfacci\u00f3n de los clientes<\/p><\/div><div class=\"iconbox  wpb_content_element iconbox-style-1 icon-color-accent color-dark\"><h3><i class=\"fa sl-layers boxicon\" style=\"\"><\/i>Gesti\u00f3n y ahorro de recursos<\/h3><p>Con la <strong>predicci\u00f3n de la demanda<\/strong> o de las necesidades, por ejemplo, se puede mejorar la gesti\u00f3n de recursos en hospitales y otros centros sociosanitarios o en el sector energ\u00e9tico.<\/p><\/div><div class=\"iconbox  wpb_content_element iconbox-style-1 icon-color-accent color-dark\"><h3><i class=\"fa sl-clock boxicon\" style=\"\"><\/i>Reducci\u00f3n de tiempo y costes<\/h3><p>Con t\u00e9cnicas de <a href=\"\/inteligencia-artificial\/machine-learning-deep-learning\/\">Machine Learning<\/a>, se pueden optimizar procesos log\u00edsticos y de distribuci\u00f3n de productos en el sector retail.<\/p><\/div>[\/vc_column][\/vc_row][vc_row top_padding=&#8221;30&#8243; bottom_padding=&#8221;40&#8243;][vc_column width=&#8221;1\/1&#8243;][vc_column_text]\n<h3 style=\"text-align: left;\"><span style=\"font-size: 0.9em;\">Contacta con nosotros<\/span><\/h3>\n[\/vc_column_text]\n<div class=\"wpcf7 no-js\" id=\"wpcf7-f5933-o1\" lang=\"es-ES\" dir=\"ltr\" data-wpcf7-id=\"5933\">\n<div class=\"screen-reader-response\"><p role=\"status\" aria-live=\"polite\" aria-atomic=\"true\"><\/p> <ul><\/ul><\/div>\n<form action=\"\/en\/wp-json\/wp\/v2\/pages\/14884#wpcf7-f5933-o1\" method=\"post\" class=\"wpcf7-form init\" aria-label=\"Formulario de contacto\" novalidate=\"novalidate\" data-status=\"init\">\n<div style=\"display: none;\">\n<input type=\"hidden\" name=\"_wpcf7\" value=\"5933\" \/>\n<input type=\"hidden\" name=\"_wpcf7_version\" value=\"6.0.1\" \/>\n<input type=\"hidden\" name=\"_wpcf7_locale\" value=\"es_ES\" \/>\n<input type=\"hidden\" name=\"_wpcf7_unit_tag\" value=\"wpcf7-f5933-o1\" \/>\n<input type=\"hidden\" name=\"_wpcf7_container_post\" value=\"0\" \/>\n<input type=\"hidden\" name=\"_wpcf7_posted_data_hash\" value=\"\" \/>\n<\/div>\n<div style=\"width:45%; float:left;\">\n\t<p><span class=\"wpcf7-form-control-wrap\" data-name=\"text-449\"><input size=\"40\" maxlength=\"400\" class=\"wpcf7-form-control wpcf7-text wpcf7-validates-as-required\" aria-required=\"true\" aria-invalid=\"false\" placeholder=\"Nombre\" value=\"\" type=\"text\" name=\"text-449\" \/><\/span>\n\t<\/p>\n\t<p><span class=\"wpcf7-form-control-wrap\" data-name=\"text-3\"><input size=\"40\" maxlength=\"400\" class=\"wpcf7-form-control wpcf7-text\" aria-invalid=\"false\" placeholder=\"Empresa\" value=\"\" type=\"text\" name=\"text-3\" \/><\/span>\n\t<\/p>\n\t<p><span class=\"wpcf7-form-control-wrap\" data-name=\"email-857\"><input size=\"40\" maxlength=\"400\" class=\"wpcf7-form-control wpcf7-email wpcf7-validates-as-required wpcf7-text wpcf7-validates-as-email\" aria-required=\"true\" aria-invalid=\"false\" placeholder=\"Email\" value=\"\" type=\"email\" name=\"email-857\" \/><\/span>\n\t<\/p>\n\t<p><span class=\"wpcf7-form-control-wrap\" data-name=\"tel-138\"><input size=\"40\" maxlength=\"400\" class=\"wpcf7-form-control wpcf7-tel wpcf7-text wpcf7-validates-as-tel\" aria-invalid=\"false\" placeholder=\"Tel\u00e9fono\" value=\"\" type=\"tel\" name=\"tel-138\" \/><\/span>\n\t<\/p>\n\t<p><span class=\"wpcf7-form-control-wrap\" data-name=\"textarea-431\"><textarea cols=\"40\" rows=\"10\" maxlength=\"2000\" class=\"wpcf7-form-control wpcf7-textarea\" aria-invalid=\"false\" placeholder=\"Estoy interesado en:\" name=\"textarea-431\"><\/textarea><\/span><br \/>\n<span class=\"wpcf7-form-control-wrap\" data-name=\"acceptance-235\"><span class=\"wpcf7-form-control wpcf7-acceptance\"><span class=\"wpcf7-list-item\"><input type=\"checkbox\" name=\"acceptance-235\" value=\"1\" aria-invalid=\"false\" \/><\/span><\/span><\/span> He le\u00eddo y acepto las <a href=\"\/condiciones-de-uso\/\">condiciones de uso<\/a> y la <a href=\"\/politica-de-privacidad\/\">pol\u00edtica de privacidad<\/a>*.\n\t<\/p>\n\t<p><span class=\"wpcf7-form-control-wrap\" data-name=\"your-fruit\"><span class=\"wpcf7-form-control wpcf7-checkbox wpcf7-exclusive-checkbox\"><span class=\"wpcf7-list-item first last\"><input type=\"checkbox\" name=\"your-fruit\" value=\"S\u00ed deseo recibir comunicaciones comerciales.\" \/><span class=\"wpcf7-list-item-label\">S\u00ed deseo recibir comunicaciones comerciales.<\/span><\/span><\/span><\/span>\n\t<\/p>\n\t<p><script src=\"https:\/\/www.google.com\/recaptcha\/api.js\" async defer><\/script>\n\t\t\t<div class=\"g-recaptcha\" data-sitekey=\"6Lff0BcTAAAAAA_IUkrgUZWZ3HSrtMu7oRutI-rd\"><\/div>\n<span class=\"wpcf7-form-control-wrap grecaptcha\"><input type=\"text\" name=\"grecaptcha\" value=\"dsk\" size=\"1\" class=\"wpcf7-form-control wpcf7-text\" style=\"display:none;\" \/><\/span>\n\t<\/p>\n\t<p><input class=\"wpcf7-form-control wpcf7-submit has-spinner\" type=\"submit\" value=\"Enviar\" \/>\n\t<\/p>\n\t<p>&nbsp;\n\t<\/p>\n<\/div>\n<div style=\"width:45%; float:right;\">\n\t<p style=\"font-size:11px;\">Informaci\u00f3n b\u00e1sica sobre Protecci\u00f3n de Datos\n\t<\/p>\n\t<ul>\n\t\t<li style=\"font-size:11px;\">\n\t\t\t<p>Responsable: Asociaci\u00f3n para el Desarrollo de la Ingenier\u00eda del Conocimiento.\n\t\t\t<\/p>\n\t\t<\/li>\n\t\t<li style=\"font-size:11px;\">\n\t\t\t<p>Direcci\u00f3n: Ctra. de Colmenar Viejo, km.15, Calle Francisco Tom\u00e1s y Valiente 11; EPS, Edificio B, 5\u00aa planta; 28049 Madrid.\n\t\t\t<\/p>\n\t\t<\/li>\n\t\t<li style=\"font-size:11px;\">\n\t\t\t<p>Tel\u00e9fono: 914972323\n\t\t\t<\/p>\n\t\t<\/li>\n\t\t<li style=\"font-size:11px;\">\n\t\t\t<p>Correo electr\u00f3nico: <a href=\"contacto.iic@iic.uam.es\">contacto.iic@iic.uam.es<\/a>\n\t\t\t<\/p>\n\t\t<\/li>\n\t\t<li style=\"font-size:11px;\">\n\t\t\t<p>Delegado de Protecci\u00f3n de Datos: <a href=\"mailto:dpd@iic.uam.es\">dpd@iic.uam.es<\/a>\n\t\t\t<\/p>\n\t\t<\/li>\n\t<\/ul>\n\t<p style=\"font-size:11px;text-align:justify;\"><br \/>\nEn nombre de Asociaci\u00f3n para el Desarrollo de la Ingenier\u00eda del Conocimiento, tratamos la informaci\u00f3n que nos facilita con el fin de dar respuesta a la solicitud realizada por usted en relaci\u00f3n con los servicios que prestamos y los productos que suministramos. Los datos proporcionados se conservar\u00e1n mientras se mantenga el contacto, siendo eliminados una vez finalizada la solicitud. Los datos no se ceder\u00e1n a terceros salvo en los casos en que exista una obligaci\u00f3n legal. Usted tiene derecho a obtener confirmaci\u00f3n sobre si en Asociaci\u00f3n para el Desarrollo de la Ingenier\u00eda del Conocimiento estamos tratando sus datos personales, por tanto, tiene derecho a acceder a sus datos personales, rectificar los datos inexactos o solicitar su supresi\u00f3n cuando los datos ya no sean necesarios. Asimismo, podr\u00e1 oponerse al tratamiento de sus datos, solicitar la limitaci\u00f3n al tratamiento y la portabilidad de sus datos. Si considera que sus datos personales no han sido tratados conforme a la normativa, puede contactar con <a href=\"mailto:derechosrgpd@iic.uam.es\">derechosrgpd@iic.uam.es<\/a>. Asimismo, podr\u00e1 presentar una reclamaci\u00f3n ante la Agencia Espa\u00f1ola de Protecci\u00f3n de Datos, especialmente cuando no haya obtenido la satisfacci\u00f3n en el ejercicio de sus derechos, a trav\u00e9s de la sede electr\u00f3nica en <a href=\"http:\/\/www.aepd.es\">www.aepd.es<\/a>.\n\t<\/p>\n\t<p style=\"font-size:11px;\"><br \/>\nAsimismo, se desean utilizar sus datos para ofrecerle productos y servicios relacionados con los solicitados por Usted, por cualquier medio, incluido el electr\u00f3nico, incluso una vez terminada la relaci\u00f3n negocial\/contractual.\n\t<\/p>\n<\/div><p style=\"display: none !important;\" class=\"akismet-fields-container\" data-prefix=\"_wpcf7_ak_\"><label>&#916;<textarea name=\"_wpcf7_ak_hp_textarea\" cols=\"45\" rows=\"8\" maxlength=\"100\"><\/textarea><\/label><input type=\"hidden\" id=\"ak_js_1\" name=\"_wpcf7_ak_js\" value=\"78\"\/><script>document.getElementById( \"ak_js_1\" ).setAttribute( \"value\", ( new Date() ).getTime() );<\/script><\/p><div class=\"wpcf7-response-output\" aria-hidden=\"true\"><\/div>\n<\/form>\n<\/div>\n[\/vc_column][\/vc_row]\n","protected":false},"excerpt":{"rendered":"<p>[vc_row bg_image=&#8221;14731&#8243; text_color=&#8221;light&#8221; text_align=&#8221;center&#8221; top_padding=&#8221;60&#8243; bottom_padding=&#8221;60&#8243;][vc_column column_padding=&#8221;padding-4&#8243; width=&#8221;1\/1&#8243;][vc_column_text] Reinforcement Learning and Optimization [\/vc_column_text][vc_column_text] Las mejores estrategias a partir de los datos [\/vc_column_text][\/vc_column][\/vc_row][vc_row top_padding=&#8221;30&#8243;][vc_column column_padding=&#8221;padding-1&#8243; width=&#8221;1\/1&#8243;][vc_column_text] El Big Data, la Inteligencia Artificial o el Machine Learning se orientan hacia la automatizaci\u00f3n y el apoyo en la toma de decisiones, pero se puede ir m\u00e1s all\u00e1. Con el conocimiento que proporcionan los datos, se pueden planear estrategias y optimizar tareas, procesos y servicios. [\/vc_column_text][\/vc_column][\/vc_row][vc_row equal_height=&#8221;yes&#8221; content_placement=&#8221;top&#8221; type=&#8221;full_width_section&#8221; top_padding=&#8221;0&#8243; bottom_padding=&#8221;0&#8243;][vc_column bg_color=&#8221;#3591c4&#8243; column_padding=&#8221;padding-3&#8243; column_center=&#8221;true&#8221; text_color=&#8221;light&#8221; width=&#8221;1\/2&#8243; delay=&#8221;0&#8243;][vc_column_text] \u00bfQu\u00e9 es el aprendizaje por refuerzo? [\/vc_column_text][vc_column_text] El aprendizaje por refuerzo (o Reinforcement Learning) es una variedad del Machine Learning que permite a una Inteligencia Artificial planear estrategias efectivas en base a la experimentaci\u00f3n con los datos. [\/vc_column_text][vc_column_text] Se trata de una forma de optimizaci\u00f3n basada en datos. La m\u00e1quina aprende a partir de su propia experiencia, interaccionando con el entorno hasta dar con el comportamiento ideal. A partir de la informaci\u00f3n disponible, emprender\u00e1 acciones que repetir\u00e1 y \u201creforzar\u00e1\u201d seg\u00fan las recompensas que obtenga, que pueden ser positivas o negativas. [\/vc_column_text][\/vc_column][vc_column bg_color=&#8221;#f3f3f3&#8243; column_padding=&#8221;padding-3&#8243; column_center=&#8221;true&#8221; width=&#8221;1\/2&#8243;][vc_column_text] \u00bfC\u00f3mo funciona el aprendizaje por refuerzo? [\/vc_column_text][vc_column_text] M\u00e1s que tomar decisiones o hacer predicciones, el aprendizaje por refuerzo genera estrategias autom\u00e1ticamente. Esto [&hellip;]<\/p>\n","protected":false},"author":4,"featured_media":0,"parent":14873,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"footnotes":""},"class_list":["post-14884","page","type-page","status-publish","hentry"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v23.5 - https:\/\/yoast.com\/wordpress\/plugins\/seo\/ -->\n<title>Reinforcement Learning - IIC<\/title>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/www.iic.uam.es\/en\/artificial-intelligence\/reinforcement-learning\/\" \/>\n<meta property=\"og:locale\" content=\"en_US\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Reinforcement Learning - IIC\" \/>\n<meta property=\"og:description\" content=\"[vc_row bg_image=&#8221;14731&#8243; text_color=&#8221;light&#8221; text_align=&#8221;center&#8221; top_padding=&#8221;60&#8243; bottom_padding=&#8221;60&#8243;][vc_column column_padding=&#8221;padding-4&#8243; width=&#8221;1\/1&#8243;][vc_column_text] Reinforcement Learning and Optimization [\/vc_column_text][vc_column_text] Las mejores estrategias a partir de los datos [\/vc_column_text][\/vc_column][\/vc_row][vc_row top_padding=&#8221;30&#8243;][vc_column column_padding=&#8221;padding-1&#8243; width=&#8221;1\/1&#8243;][vc_column_text] El Big Data, la Inteligencia Artificial o el Machine Learning se orientan hacia la automatizaci\u00f3n y el apoyo en la toma de decisiones, pero se puede ir m\u00e1s all\u00e1. Con el conocimiento que proporcionan los datos, se pueden planear estrategias y optimizar tareas, procesos y servicios. [\/vc_column_text][\/vc_column][\/vc_row][vc_row equal_height=&#8221;yes&#8221; content_placement=&#8221;top&#8221; type=&#8221;full_width_section&#8221; top_padding=&#8221;0&#8243; bottom_padding=&#8221;0&#8243;][vc_column bg_color=&#8221;#3591c4&#8243; column_padding=&#8221;padding-3&#8243; column_center=&#8221;true&#8221; text_color=&#8221;light&#8221; width=&#8221;1\/2&#8243; delay=&#8221;0&#8243;][vc_column_text] \u00bfQu\u00e9 es el aprendizaje por refuerzo? [\/vc_column_text][vc_column_text] El aprendizaje por refuerzo (o Reinforcement Learning) es una variedad del Machine Learning que permite a una Inteligencia Artificial planear estrategias efectivas en base a la experimentaci\u00f3n con los datos. [\/vc_column_text][vc_column_text] Se trata de una forma de optimizaci\u00f3n basada en datos. La m\u00e1quina aprende a partir de su propia experiencia, interaccionando con el entorno hasta dar con el comportamiento ideal. A partir de la informaci\u00f3n disponible, emprender\u00e1 acciones que repetir\u00e1 y \u201creforzar\u00e1\u201d seg\u00fan las recompensas que obtenga, que pueden ser positivas o negativas. [\/vc_column_text][\/vc_column][vc_column bg_color=&#8221;#f3f3f3&#8243; column_padding=&#8221;padding-3&#8243; column_center=&#8221;true&#8221; width=&#8221;1\/2&#8243;][vc_column_text] \u00bfC\u00f3mo funciona el aprendizaje por refuerzo? [\/vc_column_text][vc_column_text] M\u00e1s que tomar decisiones o hacer predicciones, el aprendizaje por refuerzo genera estrategias autom\u00e1ticamente. Esto [&hellip;]\" \/>\n<meta property=\"og:url\" content=\"https:\/\/www.iic.uam.es\/en\/artificial-intelligence\/reinforcement-learning\/\" \/>\n<meta property=\"og:site_name\" content=\"Instituto de Ingenier\u00eda del Conocimiento\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:site\" content=\"@iiconocimiento\" \/>\n<meta name=\"twitter:label1\" content=\"Est. reading time\" \/>\n\t<meta name=\"twitter:data1\" content=\"5 minutes\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"WebPage\",\"@id\":\"https:\/\/www.iic.uam.es\/en\/artificial-intelligence\/reinforcement-learning\/\",\"url\":\"https:\/\/www.iic.uam.es\/en\/artificial-intelligence\/reinforcement-learning\/\",\"name\":\"Reinforcement Learning - IIC\",\"isPartOf\":{\"@id\":\"https:\/\/www.iic.uam.es\/#website\"},\"datePublished\":\"2020-10-27T16:06:42+00:00\",\"dateModified\":\"2020-10-27T16:06:42+00:00\",\"breadcrumb\":{\"@id\":\"https:\/\/www.iic.uam.es\/en\/artificial-intelligence\/reinforcement-learning\/#breadcrumb\"},\"inLanguage\":\"en-US\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/www.iic.uam.es\/en\/artificial-intelligence\/reinforcement-learning\/\"]}]},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/www.iic.uam.es\/en\/artificial-intelligence\/reinforcement-learning\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Portada\",\"item\":\"https:\/\/www.iic.uam.es\/en\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Artificial Intelligence\",\"item\":\"https:\/\/www.iic.uam.es\/en\/artificial-intelligence\/\"},{\"@type\":\"ListItem\",\"position\":3,\"name\":\"Reinforcement Learning\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/www.iic.uam.es\/#website\",\"url\":\"https:\/\/www.iic.uam.es\/\",\"name\":\"Instituto de Ingenier\u00eda del Conocimiento\",\"description\":\"IIC\",\"publisher\":{\"@id\":\"https:\/\/www.iic.uam.es\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/www.iic.uam.es\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"en-US\"},{\"@type\":\"Organization\",\"@id\":\"https:\/\/www.iic.uam.es\/#organization\",\"name\":\"Instituto de Ingenier\u00eda del Conocimiento\",\"url\":\"https:\/\/www.iic.uam.es\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"en-US\",\"@id\":\"https:\/\/www.iic.uam.es\/#\/schema\/logo\/image\/\",\"url\":\"https:\/\/www.iic.uam.es\/wp-content\/uploads\/2017\/12\/IIC_logoP.png\",\"contentUrl\":\"https:\/\/www.iic.uam.es\/wp-content\/uploads\/2017\/12\/IIC_logoP.png\",\"width\":400,\"height\":283,\"caption\":\"Instituto de Ingenier\u00eda del Conocimiento\"},\"image\":{\"@id\":\"https:\/\/www.iic.uam.es\/#\/schema\/logo\/image\/\"},\"sameAs\":[\"https:\/\/x.com\/iiconocimiento\",\"https:\/\/www.linkedin.com\/company\/instituto-de-ingenieria-del-conocimiento-iic\",\"https:\/\/www.youtube.com\/IIConocimiento\",\"https:\/\/es.wikipedia.org\/wiki\/Instituto_de_Ingeniera_del_Conocimiento\"]}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Reinforcement Learning - IIC","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/www.iic.uam.es\/en\/artificial-intelligence\/reinforcement-learning\/","og_locale":"en_US","og_type":"article","og_title":"Reinforcement Learning - IIC","og_description":"[vc_row bg_image=&#8221;14731&#8243; text_color=&#8221;light&#8221; text_align=&#8221;center&#8221; top_padding=&#8221;60&#8243; bottom_padding=&#8221;60&#8243;][vc_column column_padding=&#8221;padding-4&#8243; width=&#8221;1\/1&#8243;][vc_column_text] Reinforcement Learning and Optimization [\/vc_column_text][vc_column_text] Las mejores estrategias a partir de los datos [\/vc_column_text][\/vc_column][\/vc_row][vc_row top_padding=&#8221;30&#8243;][vc_column column_padding=&#8221;padding-1&#8243; width=&#8221;1\/1&#8243;][vc_column_text] El Big Data, la Inteligencia Artificial o el Machine Learning se orientan hacia la automatizaci\u00f3n y el apoyo en la toma de decisiones, pero se puede ir m\u00e1s all\u00e1. Con el conocimiento que proporcionan los datos, se pueden planear estrategias y optimizar tareas, procesos y servicios. [\/vc_column_text][\/vc_column][\/vc_row][vc_row equal_height=&#8221;yes&#8221; content_placement=&#8221;top&#8221; type=&#8221;full_width_section&#8221; top_padding=&#8221;0&#8243; bottom_padding=&#8221;0&#8243;][vc_column bg_color=&#8221;#3591c4&#8243; column_padding=&#8221;padding-3&#8243; column_center=&#8221;true&#8221; text_color=&#8221;light&#8221; width=&#8221;1\/2&#8243; delay=&#8221;0&#8243;][vc_column_text] \u00bfQu\u00e9 es el aprendizaje por refuerzo? [\/vc_column_text][vc_column_text] El aprendizaje por refuerzo (o Reinforcement Learning) es una variedad del Machine Learning que permite a una Inteligencia Artificial planear estrategias efectivas en base a la experimentaci\u00f3n con los datos. [\/vc_column_text][vc_column_text] Se trata de una forma de optimizaci\u00f3n basada en datos. La m\u00e1quina aprende a partir de su propia experiencia, interaccionando con el entorno hasta dar con el comportamiento ideal. A partir de la informaci\u00f3n disponible, emprender\u00e1 acciones que repetir\u00e1 y \u201creforzar\u00e1\u201d seg\u00fan las recompensas que obtenga, que pueden ser positivas o negativas. [\/vc_column_text][\/vc_column][vc_column bg_color=&#8221;#f3f3f3&#8243; column_padding=&#8221;padding-3&#8243; column_center=&#8221;true&#8221; width=&#8221;1\/2&#8243;][vc_column_text] \u00bfC\u00f3mo funciona el aprendizaje por refuerzo? [\/vc_column_text][vc_column_text] M\u00e1s que tomar decisiones o hacer predicciones, el aprendizaje por refuerzo genera estrategias autom\u00e1ticamente. Esto [&hellip;]","og_url":"https:\/\/www.iic.uam.es\/en\/artificial-intelligence\/reinforcement-learning\/","og_site_name":"Instituto de Ingenier\u00eda del Conocimiento","twitter_card":"summary_large_image","twitter_site":"@iiconocimiento","twitter_misc":{"Est. reading time":"5 minutes"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"WebPage","@id":"https:\/\/www.iic.uam.es\/en\/artificial-intelligence\/reinforcement-learning\/","url":"https:\/\/www.iic.uam.es\/en\/artificial-intelligence\/reinforcement-learning\/","name":"Reinforcement Learning - IIC","isPartOf":{"@id":"https:\/\/www.iic.uam.es\/#website"},"datePublished":"2020-10-27T16:06:42+00:00","dateModified":"2020-10-27T16:06:42+00:00","breadcrumb":{"@id":"https:\/\/www.iic.uam.es\/en\/artificial-intelligence\/reinforcement-learning\/#breadcrumb"},"inLanguage":"en-US","potentialAction":[{"@type":"ReadAction","target":["https:\/\/www.iic.uam.es\/en\/artificial-intelligence\/reinforcement-learning\/"]}]},{"@type":"BreadcrumbList","@id":"https:\/\/www.iic.uam.es\/en\/artificial-intelligence\/reinforcement-learning\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Portada","item":"https:\/\/www.iic.uam.es\/en\/"},{"@type":"ListItem","position":2,"name":"Artificial Intelligence","item":"https:\/\/www.iic.uam.es\/en\/artificial-intelligence\/"},{"@type":"ListItem","position":3,"name":"Reinforcement Learning"}]},{"@type":"WebSite","@id":"https:\/\/www.iic.uam.es\/#website","url":"https:\/\/www.iic.uam.es\/","name":"Instituto de Ingenier\u00eda del Conocimiento","description":"IIC","publisher":{"@id":"https:\/\/www.iic.uam.es\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/www.iic.uam.es\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"en-US"},{"@type":"Organization","@id":"https:\/\/www.iic.uam.es\/#organization","name":"Instituto de Ingenier\u00eda del Conocimiento","url":"https:\/\/www.iic.uam.es\/","logo":{"@type":"ImageObject","inLanguage":"en-US","@id":"https:\/\/www.iic.uam.es\/#\/schema\/logo\/image\/","url":"https:\/\/www.iic.uam.es\/wp-content\/uploads\/2017\/12\/IIC_logoP.png","contentUrl":"https:\/\/www.iic.uam.es\/wp-content\/uploads\/2017\/12\/IIC_logoP.png","width":400,"height":283,"caption":"Instituto de Ingenier\u00eda del Conocimiento"},"image":{"@id":"https:\/\/www.iic.uam.es\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/x.com\/iiconocimiento","https:\/\/www.linkedin.com\/company\/instituto-de-ingenieria-del-conocimiento-iic","https:\/\/www.youtube.com\/IIConocimiento","https:\/\/es.wikipedia.org\/wiki\/Instituto_de_Ingeniera_del_Conocimiento"]}]}},"_links":{"self":[{"href":"https:\/\/www.iic.uam.es\/en\/wp-json\/wp\/v2\/pages\/14884"}],"collection":[{"href":"https:\/\/www.iic.uam.es\/en\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/www.iic.uam.es\/en\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/www.iic.uam.es\/en\/wp-json\/wp\/v2\/users\/4"}],"replies":[{"embeddable":true,"href":"https:\/\/www.iic.uam.es\/en\/wp-json\/wp\/v2\/comments?post=14884"}],"version-history":[{"count":0,"href":"https:\/\/www.iic.uam.es\/en\/wp-json\/wp\/v2\/pages\/14884\/revisions"}],"up":[{"embeddable":true,"href":"https:\/\/www.iic.uam.es\/en\/wp-json\/wp\/v2\/pages\/14873"}],"wp:attachment":[{"href":"https:\/\/www.iic.uam.es\/en\/wp-json\/wp\/v2\/media?parent=14884"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}