Literatur vom gleichen Autor/der gleichen Autor*in
plus bei Google Scholar

Bibliografische Daten exportieren
 

Adaptive Thompson Sampling Stacks for Memory Bounded Open-Loop Planning

Titelangaben

Phan, Thomy ; Gabor, Thomas ; Müller, Robert ; Roch, Christoph ; Linnhoff-Popien, Claudia:
Adaptive Thompson Sampling Stacks for Memory Bounded Open-Loop Planning.
In: Proceedings of the Twenty-Eighth International Joint Conference on Artificial Intelligence (IJCAI-19). - s.l. : International Joint Conferences on Artificial Intelligence Organization , 2019 . - S. 5607-5613
ISBN 978-0-9992411-4-1
DOI: https://doi.org/10.24963/ijcai.2019/778

Volltext

Link zum Volltext (externe URL): Volltext

Angaben zu Projekten

Projekttitel:
Offizieller Projekttitel
Projekt-ID
Innovationszentrum Mobiles Internet (InnoMI)
Ohne Angabe

Projektfinanzierung: Bayerisches Staatsministerium für Wirtschaft, Infrastruktur, Verkehr und Technologie

Abstract

We propose Stable Yet Memory Bounded Open-Loop (SYMBOL) planning, a general memory bounded approach to partially observable open-loop planning. SYMBOL maintains an adaptive stack of Thompson Sampling bandits, whose size is bounded by the planning horizon and can be automatically adapted according to the underlying domain without any prior domain knowledge beyond a generative model. We empirically test SYMBOL in four large POMDP benchmark problems to demonstrate its effectiveness and robustness w.r.t. the choice of hyperparameters and evaluate its adaptive memory consumption. We also compare its performance with other open-loop planning algorithms and POMCP.

Weitere Angaben

Publikationsform: Aufsatz in einem Buch
Begutachteter Beitrag: Ja
Keywords: Planning Algorithms; Planning under Uncertainty; POMDP
Institutionen der Universität: Fakultäten > Fakultät für Mathematik, Physik und Informatik > Institut für Informatik
Titel an der UBT entstanden: Nein
Themengebiete aus DDC: 000 Informatik,Informationswissenschaft, allgemeine Werke > 004 Informatik
Eingestellt am: 17 Nov 2025 09:42
Letzte Änderung: 17 Nov 2025 09:42
URI: https://eref.uni-bayreuth.de/id/eprint/95248