Literatur vom gleichen Autor/der gleichen Autor*in
plus bei Google Scholar

Bibliografische Daten exportieren
 

Adaptive Step Sizes for Preconditioned Stochastic Gradient Descent

Titelangaben

Köhne, Frederik ; Kreis, Leonie ; Schiela, Anton ; Herzog, Roland:
Adaptive Step Sizes for Preconditioned Stochastic Gradient Descent.
Bayreuth ; Heidelberg , 2023 . - 31 S.
DOI: https://doi.org/10.48550/arXiv.2311.16956

Volltext

Link zum Volltext (externe URL): Volltext

Angaben zu Projekten

Projekttitel:
Offizieller Projekttitel
Projekt-ID
Multilevel Architectures and Algorithms in Deep Learning
464103607

Projektfinanzierung: Deutsche Forschungsgemeinschaft

Abstract

This paper proposes a novel approach to adaptive step sizes in stochastic gradient descent (SGD) by utilizing quantities that we have identified as numerically traceable --- the Lipschitz constant for gradients and a concept of the local variance in search directions.
Our findings yield a nearly hyperparameter-free algorithm for stochastic optimization, which has provable convergence properties when applied to quadratic problems and exhibits truly problem adaptive behavior on classical image classification tasks.
Our framework enables the potential inclusion of a preconditioner, thereby enabling the implementation of adaptive step sizes for stochastic second-order optimization methods.

Weitere Angaben

Publikationsform: Preprint, Postprint
Begutachteter Beitrag: Ja
Keywords: stochastic gradient descent; adaptive learning rates; preconditioning; quadratic problems
Institutionen der Universität: Fakultäten
Fakultäten > Fakultät für Mathematik, Physik und Informatik
Fakultäten > Fakultät für Mathematik, Physik und Informatik > Mathematisches Institut
Fakultäten > Fakultät für Mathematik, Physik und Informatik > Mathematisches Institut > Lehrstuhl Mathematik V (Angewandte Mathematik)
Fakultäten > Fakultät für Mathematik, Physik und Informatik > Mathematisches Institut > Lehrstuhl Angewandte Mathematik (Angewandte Mathematik)
Fakultäten > Fakultät für Mathematik, Physik und Informatik > Mathematisches Institut > Lehrstuhl Angewandte Mathematik (Angewandte Mathematik) > Lehrstuhl Angewandte Mathematik (Angewandte Mathematik) - Univ.-Prof. Dr. Anton Schiela
Profilfelder
Profilfelder > Advanced Fields
Profilfelder > Advanced Fields > Nichtlineare Dynamik
Titel an der UBT entstanden: Ja
Themengebiete aus DDC: 500 Naturwissenschaften und Mathematik > 510 Mathematik
Eingestellt am: 30 Nov 2023 06:13
Letzte Änderung: 30 Nov 2023 06:13
URI: https://eref.uni-bayreuth.de/id/eprint/87944