Machine Learning Spain - Machine Learning Spain XXXI
Thursday 13 September 2018, 18:30 - 19:30
Calle de Manzanares, 1, Madrid, España
Hola, Machine Learners!! ¡Cómo os estamos echando de menos! Estamos deseando arrancar el nuevo curso después de 2 meses de descanso para volver a compartir todas las ideas, dudas, inquietudes, risas y conversaciones top level que se generan en este meetup. Así que estamos encantados de anunciar ya la próxima fecha para un nuevo meetup de ML Spain: será el miércoles día 13 de septiembre a las 18:30h en Campus Madrid. Juantomás y Soraya os darán la bienvenida con cerveza bien fresquita y una sonrisa :) 18:30 - Hello&Beers 19:00 - 19:45 Reinforcement Learning: Aprendiendo de nuestras acciones, por Nerea Luis ( PhD candidate en Inteligencia Artificial (Planificación Automática Multi Agente, Universidad Carlos III de Madrid) y Moisés Martínez (Postdoctoral researcher, King´s College London) Nerea LuisEstá terminando su tesis doctoral en planificación automática multi agente, el campo de la inteligencia artificial que se encarga de estudiar el razonamiento, la coordinación y la resolución de conflictos. Hace 6 años fundó T3chFest, evento tecnológico que ha organizado cada año desde entonces poniendo siempre el foco en compartir conocimiento y unir los distintos mundos del sector tecnológico-científico. En 2016 Google le otorgó la Anita Borg scholarship y recientemente COTEC la ha incluído en su lista de expertos como experta en Tecnología, Talento y Género. Moisés MartínPhD en Inteligencia Artificial por la Universidad Carlos III de Madrid (especializado en Planificación Automática, Aprendizaje Automático y Sistemas de Control). Investigador en King´s College London, mentor, speaker, orgulloso organizador de T3chFest y amante de la tecnología. ResumenLas técnicas de Aprendizaje Automático (Machine Learning) se han vuelto muy populares en los últimos años debido a la aparición de nuevos frameworks, herramientas y plataformas que han permitido democratizar el uso de estas técnicas y aplicarlas pare resolver diversos problemas relacionados con banca, medicina, robótica, recomendación, etc a través del Big Data. Pero en la mayor parte de los casos las técnicas de Aprendizaje utilizadas se limitan a Aprendizaje Supervisado y en algunos casos Aprendizaje no Supervisado, pero existen algo más aparte de las técnicas ofrecidas por estos paradigmas. En esta charla vamos a introducir el concepto de Aprendizaje por refuerzo (Reinforcement Learning) que intenta imitar el "modelo de aprendizaje de los seres vivos". Este paradigma de aprendizaje se diferencia del resto de paradigmas en el uso de acciones y estados en vez de ejemplos y clases. De forma que los algoritmos de Aprendizaje por refuerzo intentan construir modelos o políticas que permitan determinar la acción a aplicar en un entorno en base a algún tipo de "noción" de recompensa o refuerzo. Esto convierte al Aprendizaje por Refuerzo en una técnica perfecta para la construcción de sistemas de control para robots, videojuegos, agentes interactivos, etc. En esta charla realizaremos una descripción teórica de como funciona el Aprendizaje por Refuerzo, presentaremos el principal algoritmo de Aprendizaje por Refuerzo y describiremos como modelarlo usando TensorFlow. Además presentaremos un caso práctico de como definir los elementos básicos para construir un controlador para jugar a StarCraft: Brood war utilizando Reinforcement Learning con TensorFlow y los diferentes problemas que nos hemos encontrado al intentar hacerlo. 19:45 TBC 20:15 Despedida y networking Si queréis proponer vuestras propias charlas para futuros eventos, podéis hacerlo en este cuestionario ( https://docs.google.com/forms/d/e/1FAIpQLSfKXUIz4R2aNWUP8WUrEEijidARGmvkllfgwBnfMZuUR30AKA/viewform?c=0&w=1) y también podéis enviarnos un mensaje por aquí. Mantendremos siempre abierto el C4P para recoger las charlas más interesantes. La evolución del evento y algunas fotos estarán en la cuenta de Twitter @ml_spain ( https://twitter.com/ml_spain ) Nos vemos en Campus Madrid.
Publicado por: Betabeers