Literatur vom gleichen Autor/der gleichen Autor*in
plus bei Google Scholar

Bibliografische Daten exportieren
 

Process Mining Between the Lines : Extracting Object-Centric Event Logs From Textual Data

Titelangaben

Buss, Alina ; Kecht, Christoph ; Kratsch, Wolfgang ; Röglinger, Maximilian ; Sadeghianasl, Sareh ; Wynn, Moe T.:
Process Mining Between the Lines : Extracting Object-Centric Event Logs From Textual Data.
In: Information Systems. Bd. 140 (2026) . - 102713.
ISSN 0306-4379
DOI: https://doi.org/10.1016/j.is.2026.102713

Volltext

Link zum Volltext (externe URL): Volltext

Angaben zu Projekten

Projektfinanzierung: QUAPRO

Abstract

Organizations generate vast amounts of unstructured textual data – a valuable source of information that frequently remains underutilized for process mining. However, textual descriptions often record exceptions and manual activities absent from structured data, and therefore, enable a better understanding of deviations from the expected business process behavior. Importantly, unstructured sources typically retain the object-centric characteristics of real-world processes – information that gets flattened or lost in case-centric event logs. Yet, existing approaches primarily target structured data sources or produce case-centric event logs. To address this gap, we present an automated approach to derive object-centric event logs directly from unstructured textual descriptions. The approach comprises two subcomponents: a collector that identifies events and objects (including their attributes and relationships), and a refiner that consolidates and cleans the extracted information. We instantiate each subcomponent in heuristic and generative implementations and create four pairwise combinations of collector and refiner instances to assess the effectiveness of heuristic natural language processing and generative artificial intelligence techniques. We compare these variants quantitatively and qualitatively in a controlled, artificial setting based on synthesized texts and demonstrate the practical utility on two naturally occurring corpora (fire status updates and a legal judgment). Our results show that the configurations with a generative collector achieve the highest extraction quality. In particular, the fully generative variant produces coherent and standardized event and object labels. Overall, this study fills a notable research gap by enabling the incorporation of textual information into process mining applications.

Weitere Angaben

Publikationsform: Artikel in einer Zeitschrift
Begutachteter Beitrag: Ja
Keywords: Process mining; Object-centric event logs; Natural language processing; Large language models; Generative artificial intelligence
Institutionen der Universität: Fakultäten > Rechts- und Wirtschaftswissenschaftliche Fakultät > Fachgruppe Betriebswirtschaftslehre
Fakultäten > Rechts- und Wirtschaftswissenschaftliche Fakultät > Fachgruppe Betriebswirtschaftslehre > Lehrstuhl Betriebswirtschaftslehre XVII - Wirtschaftsinformatik und Wertorientiertes Prozessmanagement
Fakultäten > Rechts- und Wirtschaftswissenschaftliche Fakultät > Fachgruppe Betriebswirtschaftslehre > Lehrstuhl Betriebswirtschaftslehre XVII - Wirtschaftsinformatik und Wertorientiertes Prozessmanagement > Lehrstuhl Betriebswirtschaftslehre XVII - Wirtschaftsinformatik und Wertorientiertes Prozessmanagement - Univ.-Prof. Dr. Maximilian Röglinger
Forschungseinrichtungen
Forschungseinrichtungen > Institute in Verbindung mit der Universität
Forschungseinrichtungen > Institute in Verbindung mit der Universität > Institutsteil Wirtschaftsinformatik des Fraunhofer FIT
Forschungseinrichtungen > Institute in Verbindung mit der Universität > FIM Forschungsinstitut für Informationsmanagement
Titel an der UBT entstanden: Ja
Themengebiete aus DDC: 000 Informatik,Informationswissenschaft, allgemeine Werke > 004 Informatik
300 Sozialwissenschaften > 330 Wirtschaft
Eingestellt am: 07 Apr 2026 12:34
Letzte Änderung: 07 Apr 2026 12:34
URI: https://eref.uni-bayreuth.de/id/eprint/96604