Thiago D. Simão

Citado por

	Todos	Desde 2019
Citações	384	380
Índice h	10	10
Índice i10	11	11

180

135

2016201720182019202020212022202320242 1 7 8 29 67 161 107

Acesso público

Ver tudo

20 artigos

0 artigos

disponível

não disponível

Com base em autorizações de financiamento

Coautores

Matthijs T. J. SpaanDelft University of TechnologyEmail confirmado em tudelft.nl
Nils JansenProfessor of Artificial Intelligence and Formal Methods, Ruhr-University BochumEmail confirmado em rub.de
Qisong YangDelft University of TechnologyEmail confirmado em tudelft.nl
Simon TindemansTU DelftEmail confirmado em tudelft.nl
Marnix SuilenPhD Candidate, Radboud UniversityEmail confirmado em science.ru.nl
Remi Tachet des CombesEmail confirmado em alpacaml.com
Romain LarocheMicrosoft ResearchEmail confirmado em polytechnique.org
David ParkerProfessor of Computer Science, University of OxfordEmail confirmado em cs.ox.ac.uk
Danial KamranInstitute for Measurement and Control Systems, Karlsruhe Institute of TechnologyEmail confirmado em kit.edu
Canmanie Teresa PonnambalamTNOEmail confirmado em tno.nl
Alessandro FarinelliFull professor of Computer Science, University of VeronaEmail confirmado em univr.it
Alberto CastelliniUniversità degli studi di VeronaEmail confirmado em univr.it
Edoardo ZorziUniversità di VeronaEmail confirmado em univr.it
Federico BianchiUniversity of VeronaEmail confirmado em univr.it
Merlijn KralePhD, Radboud University NijmegenEmail confirmado em ru.nl
Thom BadingsPhD Candidate, Radboud UniversityEmail confirmado em ru.nl
Tal KachmanRadboud UniversityEmail confirmado em donders.ru.nl
Martin LauerKarlsruhe Institute of TechnologyEmail confirmado em kit.edu
Johannes FischerKarlsruhe Institute of Technology (KIT)Email confirmado em kit.edu
Sebastian JungesAssistant Professor, Radboud University, NijmegenEmail confirmado em ru.nl

Seguir

Thiago D. Simão

Assistant Professor at Eindhoven University of Technology

Email confirmado em tue.nl - Página inicial

decision making under uncertainty safe reinforcement learning offline reinforcement learning


Título Ordenar por citações Ordenar por ano Ordenar por título	Citado por Citado por	Ano
WCSAC: Worst-Case Soft Actor Critic for Safety-Constrained Reinforcement Learning Q Yang, TD Simão, SH Tindemans, MTJ Spaan AAAI, 10639-10646, 2021	119	2021
AlwaysSafe: Reinforcement learning without safety constraint violations during training TD Simão, N Jansen, MTJ Spaan AAMAS, 1226-1235, 2021	48	2021
Safety-constrained reinforcement learning with a distributional safety critic Q Yang, TD Simão, SH Tindemans, MTJ Spaan Machine Learning 112 (3), 859-887, 2023	39	2023
Safe Policy Improvement with an Estimated Baseline Policy TD Simão, R Laroche, R Tachet des Combes AAMAS, 1269-1277, 2020	33*	2020
Safe Policy Improvement with Baseline Bootstrapping in Factored Environments TD Simão, MTJ Spaan AAAI, 4967-4974, 2019	32	2019
Robust anytime learning of Markov decision processes M Suilen, TD Simão, D Parker, N Jansen NeurIPS, 28790-28802, 2022	24	2022
Decision-making under uncertainty: beyond probabilities: Challenges and perspectives T Badings, TD Simão, M Suilen, N Jansen International Journal on Software Tools for Technology Transfer 25 (3), 375-391, 2023	12	2023
Safe policy improvement for POMDPs via finite-state controllers TD Simão, M Suilen, N Jansen AAAI, 15109-15117, 2023	12	2023
Structure Learning for Safe Policy Improvement TD Simão, MTJ Spaan IJCAI, 3453-3459, 2019	11	2019
Reinforcement Learning by Guided Safe Exploration Q Yang, TD Simão, N Jansen, SH Tindemans, MTJ Spaan ECAI, 2858-2865, 2023	10*	2023
Safe Reinforcement Learning From Pixels Using a Stochastic Latent Representation Y Hogewind, TD Simão, T Kachman, N Jansen ICLR, 2023	10	2023
A Modern Perspective on Safe Automated Driving for Different Traffic Dynamics Using Constrained Reinforcement Learning D Kamran, TD Simão, Q Yang, CT Ponnambalam, J Fischer, MTJ Spaan, ... ITSC, 4017-4023, 2022	9	2022
Scalable Safe Policy Improvement via Monte Carlo Tree Search A Castellini, F Bianchi, E Zorzi, TD Simão, A Farinelli, MTJ Spaan ICML, 3732-3756, 2023	5	2023
More for Less: Safe Policy Improvement With Stronger Performance Guarantees P Wienhöft, M Suilen, TD Simão, C Dubslaff, C Baier, N Jansen IJCAI, 4406-4415, 2023	5	2023
Act-then-measure: reinforcement learning for partially observable environments with active measuring M Krale, TD Simão, N Jansen ICAPS, 212-220, 2023	5	2023
Recursive small-step multi-agent A* for dec-POMDPs W Koops, N Jansen, S Junges, TD Simão IJCAI, 5402-5410, 2023	2	2023
Planejamento probabilístico com becos sem saída TD Simão Universidade de São Paulo, 2017	2	2017
Utilização de algoritmos genéticos para otimização de soluções para o timetabling escolar TD SIMÃO Tese apresentada ao Departamento de Ciência da Computação da Universidade …, 2013	2	2013
Risk-aware curriculum generation for heavy-tailed task distributions C Koprulu, TD Simão, N Jansen, U Topcu UAI, 1132-1142, 2023	1	2023
Safe and Sample-Efficient Reinforcement Learning Algorithms for Factored Environments. TD Simão IJCAI, 6460-6461, 2019	1	2019

O sistema não pode efectuar a operação agora. Tente mais tarde.

Artigos 1–20

Citações por ano

Citações duplicadas

Citações unidas

Adicionar coautoresCoautores

Seguir

Citado por

Coautores