Titelangaben
Phan, Thomy ; Gabor, Thomas ; Müller, Robert ; Roch, Christoph ; Linnhoff-Popien, Claudia:
Adaptive Thompson Sampling Stacks for Memory Bounded Open-Loop Planning.
In:
Proceedings of the Twenty-Eighth International Joint Conference on Artificial Intelligence (IJCAI-19). -
s.l.
: International Joint Conferences on Artificial Intelligence Organization
,
2019
. - S. 5607-5613
ISBN 978-0-9992411-4-1
DOI: https://doi.org/10.24963/ijcai.2019/778
Angaben zu Projekten
| Projekttitel: |
Offizieller Projekttitel Projekt-ID Innovationszentrum Mobiles Internet (InnoMI) Ohne Angabe |
|---|---|
| Projektfinanzierung: |
Bayerisches Staatsministerium für Wirtschaft, Infrastruktur, Verkehr und Technologie |
Abstract
We propose Stable Yet Memory Bounded Open-Loop (SYMBOL) planning, a general memory bounded approach to partially observable open-loop planning. SYMBOL maintains an adaptive stack of Thompson Sampling bandits, whose size is bounded by the planning horizon and can be automatically adapted according to the underlying domain without any prior domain knowledge beyond a generative model. We empirically test SYMBOL in four large POMDP benchmark problems to demonstrate its effectiveness and robustness w.r.t. the choice of hyperparameters and evaluate its adaptive memory consumption. We also compare its performance with other open-loop planning algorithms and POMCP.
Weitere Angaben
| Publikationsform: | Aufsatz in einem Buch |
|---|---|
| Begutachteter Beitrag: | Ja |
| Keywords: | Planning Algorithms; Planning under Uncertainty; POMDP |
| Institutionen der Universität: | Fakultäten > Fakultät für Mathematik, Physik und Informatik > Institut für Informatik |
| Titel an der UBT entstanden: | Nein |
| Themengebiete aus DDC: | 000 Informatik,Informationswissenschaft, allgemeine Werke > 004 Informatik |
| Eingestellt am: | 17 Nov 2025 09:42 |
| Letzte Änderung: | 17 Nov 2025 09:42 |
| URI: | https://eref.uni-bayreuth.de/id/eprint/95248 |

bei Google Scholar