Exploration Policies for On-the-Fly Controller Synthesis: A Reinforcement Learning Approach :: SILO. Sistema nacional de repositorios digitales. Uruguay

Conferencia Enviado

Exploration Policies for On-the-Fly Controller Synthesis: A Reinforcement Learning Approach

Delgado, Tomás - Sánchez Sorondo, Marco - Braberman, Víctor - Uchitel, Sebastián

Resumen:

In this work, we propose a new method for obtaining heuristics based on Reinforcement Learning (RL). The synthesis algorithm is thus framed as an RL task with an unbounded action space and a modified version of DQN is used. With a simple and general set of features that abstracts both states and actions, we show that it is possible to learn heuristics on small versions of a problem that generalize to the larger instances, effectively doing zero-shot policy transfer. Our agents learn from scratch in a highly partially observable RL task and outperform the existing heuristic overall, in instances unseen during training.

Detalles Bibliográficos
Fecha de publicación:	2023
Financiadores:	Agencia Nacional de Promoción de la Investigación, el Desarrollo Tecnológico y la Innovación Universidad de Buenos Aires Agencia Nacional de Investigación e Innovación
Temas:	Artificial intelligence Controller synthesis Ciencias Naturales y Exactas Ciencias de la Computación e Información Ciencias de la Computación
Idioma	Inglés
Institución:	Agencia Nacional de Investigación e Innovación
Repositorio:	REDI
Enlace(s):	https://hdl.handle.net/20.500.12381/3418 https://doi.org/10.48550/arXiv.2210.05393
Nivel de acceso:	Acceso abierto
Licencia:	Reconocimiento 4.0 Internacional. (CC BY)

Resultados similares

A Congruence-based Approach to Active Automata Learning from Neural Language Models
Autor(es):: Mayr, Franz
Fecha de publicación:: (2023)

On-the-fly Black-Box Probably Approximately Correct Checking of Recurrent Neural Networks
Autor(es):: Mayr, Franz
Fecha de publicación:: (2020)

Towards Efficient Active Learning of PDFA
Autor(es):: Mayr, F.
Fecha de publicación:: (2022)

Results of Neural-Checker Toolbox in Taysir 2023 Competition
Autor(es):: Mayr, Franz
Fecha de publicación:: (2023)

Property Checking with Interpretable Error Characterization for Recurrent Neural Networks
Autor(es):: Mayr, Franz
Fecha de publicación:: (2020)

Analyzing constrained LLM through PDFA-learning
Autor(es):: Carrasco, Matías
Fecha de publicación:: (2024)

Exploring Attention Patterns and Neural Activations in Transformer Architectures for Sequence Classification in Context Free Grammars
Autor(es):: Molinolo, Matías
Fecha de publicación:: (2024)

Active Learning of Regular Languages as an Approach to Neural Language Models Verification
Autor(es):: Mayr, Franz
Fecha de publicación:: (2024)

Application of private aggregation of teacher ensembles framework for malicious web request detection
Autor(es):: Sosa, Sebastián
Fecha de publicación:: (2021)

“It will surely fall”: Exploring Teachers’ Perspectives on Commercial Robots for Preschoolers
Autor(es):: Bakala, Ewelina
Fecha de publicación:: (2023)

Aprendiendo políticas de exploración generales para escalar la síntesis de controladores discretos
Autor(es):: Delgado, Tomás
Fecha de publicación:: (2023)

La técnica que permite saber todo sobre los clientes sin poner en riesgo su privacidad
Autor(es):: Universidad ORT Uruguay
Fecha de publicación:: (2021)

Active Learning Over Large Alphabets
Autor(es):: Vilensky, Federico
Fecha de publicación:: (2022)

Analysis, Evaluation and Improvement of Active Regular Inference Algorithms for Neural Sequence Acceptors
Autor(es):: da Silva, Juan Pedro
Fecha de publicación:: (2024)

FLEA: Aprendizaje Federado aplicado a Analíticas de Aprendizaje
Autor(es):: Bermolen, Paola
Fecha de publicación:: (2022)

Machine learning in healthcare toward early risk prediction: A case study of liver transplantation
Autor(es):: Chatterjee, Parag
Fecha de publicación:: (2020)

Software basado en Pyfhel para garantizar privacidad de datos en un contexto de machine learning as a service
Autor(es):: Imbert, Walter
Fecha de publicación:: (2022)

Diseño e implementación de una plataforma para garantizar privacidad de datos en un contexto de machine learning as a service
Autor(es):: Wagner, Gonzalo
Fecha de publicación:: (2022)

Application of PATE to Sensible Data
Autor(es):: Mayr, Franz
Fecha de publicación:: (2021)

¿Cómo compartir datos de manera efectiva y privada?
Autor(es):: Yovine, Sergio
Fecha de publicación:: (2022)

Implementación en PySyft de "An Assessment of the Application of Private Aggregation of Ensemble Models to Sensible Data"
Autor(es):: Pisani, Mikaela
Fecha de publicación:: (2022)

Can AI democratize healthcare? TEDxUTN
Autor(es):: Chatterjee, Parag
Fecha de publicación:: (2019)

Prueba de concepto del framework de OpenMined para modelos de Machine Learning
Autor(es):: Ampuero, Pablo
Fecha de publicación:: (2021)

Internet of Things and Artificial Intelligence in Healthcare During COVID-19 Pandemic—A South American Perspective
Autor(es):: Chatterjee, Parag
Fecha de publicación:: (2020)

Verification of webassembly programs
Autor(es):: Ocampo Herrera, Diego Ignacio
Fecha de publicación:: (2019)

Sessionizator: una herramienta para la reconstrucción de sesiones a partir de logs Apache
Autor(es):: Pisabarro, Mauricio
Fecha de publicación:: (2020)

Informe final del proyecto: Herramienta de privatización de datos secuenciales para su aplicación en la detección de anomalías colectivas en ciberseguridad
Autor(es):: Yovine, Sergio
Fecha de publicación:: (2022)

Learning for Optimization with Virtual Savant
Autor(es):: Massobrio, Renzo
Fecha de publicación:: (2021)

Informe final del proyecto: Anonimización de datos basada en redes generativas antagónicas
Autor(es):: Yovine, Sergio
Fecha de publicación:: (2021)

Comparison of LSTM and Transformer Neural Network on multiple approaches for weblogs attack detection
Autor(es):: Martínez Varsi, Nicolás
Fecha de publicación:: (2022)

Web Attack Generation
Autor(es):: Pisani, Mikaela
Fecha de publicación:: (2022)

Prototipo de “Application of Private Aggregation of Ensemble Models to Sensible Data” en la plataforma PySyft de OpenMined
Autor(es):: Pisani, Mikaela
Fecha de publicación:: (2022)

Docker deployment of DVWA vulnerable site
Autor(es):: Pisani, Mikaela
Fecha de publicación:: (2022)

DP-GEM
Autor(es):: Visca, Ramiro
Fecha de publicación:: (2021)

WebRequests
Autor(es):: Biardo, Deborah
Fecha de publicación:: (2020)

Nonlinear Systems in Healthcare towards Intelligent Disease Prediction
Autor(es):: Chatterjee, Parag
Fecha de publicación:: (2019)

Normal web traffic generator
Autor(es):: Pisani, Mikaela
Fecha de publicación:: (2022)

Sesionización de Logs Apache
Autor(es):: Pisabarro, Mauricio
Fecha de publicación:: (2020)

¿Hacía dónde va el Ciesc?
Autor(es):: Rosa, Sylvia da
Fecha de publicación:: (2009)

Whole genome sequencing reveals a frameshift mutation and a large deletion in YY1AP1 in a girl with a panvascular artery disease
Autor(es):: Raggio, Víctor
Fecha de publicación:: (2021)