Titelangaben
Egger, Andreas:
New Data Sources for Process Mining.
Bayreuth
,
2024
. - VI, 68 S.
(
Dissertation,
2024, Universität Bayreuth)
Abstract
Process mining is situated between process science and data science, with the objective of discovering, monitoring, and improving processes. As a technique in business process management, process mining uses event logs as input and enables building a view of reality by making process executions tangible, facilitating the identification of bottlenecks, providing new insights, and anticipating problems in business processes. The process mining discipline has undergone a notable evolution over recent decades, both in academic research and in practice. The development of innovative algorithms and algorithmic extensions is an ongoing process, with previously unused data sources being explored to enhance the existing body of knowledge. Traditionally, the predominant data sources for process mining are information systems, such as enterprise resource planning systems. However, process information can also be extracted from alternative sources and utilized for process mining. The majority of available data is unstructured, thereby offering a substantial opportunity to provide valuable contextual insights into business processes. This can facilitate a more comprehensive representation and analysis of real-world processes, as well as the reduction of blind spots, i.e., parts of processes that were previously unable to be captured in event logs. The overarching objective of this dissertation is to contribute to the advancement of process mining by enabling the use of new data sources. This objective is pursued by facilitating the integration of sensor, video, bot, and text data, as well as providing a systematic overview of approaches to unstructured data in process mining. In line with design science research principles, multiple artifacts are developed that contribute to process mining in both research and practice. This dissertation comprises five research articles addressing three opportunities that aim to expand the scope of process mining analysis. First, the integration of unstructured data into process mining is addressed by initial research. However, a systematic overview that presents a comprehensive summary of the approaches employed has yet to be provided. Research Article 1 addresses this opportunity by providing a systematic literature review of the current state of research on the use of unstructured data in process mining. In light of the findings, a research agenda is put forth that identifies both open challenges and potential avenues for future research. Second, data derived from video and sensor data could facilitate the detection of previously hidden but relevant process activities, thus enabling a more transparent process picture. Accordingly, Research Article 2 presents a reference architecture that offers guidance on the utilization of unstructured data sources and traditional event logs for object-centric process mining. Moreover, an instantiation of the proposed architecture is provided, demonstrating the specific use of video and sensor data for object-centric process mining. Additionally, Research Article 3 proposes a reference architecture for the unsupervised exploration of video data. This architecture enables the extraction of actual process activities from video data without the need for predefined activities, serving as a starting point for process discovery. Third, the conjunction of several emerging technologies with process mining has facilitated the integration of additional data sources. As the use of Robotic Process Automation (RPA) bots becomes more prevalent in business processes, there is a need to integrate the steps performed by bots into process mining analysis. Accordingly, Research Article 4 presents an approach that makes bot logs from RPA software usable for process mining and develops process mining measures that analyze bot logs and process event logs in an integrated manner. Chatbots represent a further type of bot that is deployed in scenarios where it is essential to align with the underlying business processes and comply with regulatory requirements. Consequently, there is a need to integrate textual conversation data from chatbots to investigate whether chatbots achieve process-compliant behavior. Research Article 5 addresses this opportunity by providing an approach that converts textual conversation data from chatbots to event logs for process mining and quantifies chatbots’ ability to learn and adhere to organizations’ business processes. Overall, this dissertation, comprising the five research articles, contributes to the advancement of process mining by enabling the use of new data sources. The conducted literature review provides new insights to systematically advance research at the intersection of unstructured data and process mining. The dissertation presents two artifacts that provide guidance for incorporating video and sensor data as new data sources for process mining, completed by a generic architecture on the use of unstructured data for object-centric process mining. Finally, two artifacts that integrate data from emerging technologies are presented. Both artifacts facilitate a more holistic process view by incorporating data from chatbots and RPA bots as new data sources for process mining.
Abstract in weiterer Sprache
Process Mining ist zwischen der Prozesswissenschaft und der Datenwissenschaft angesiedelt und hat das Ziel, Prozesse zu entdecken, zu überwachen und zu verbessern. Als eine Technik des Geschäftsprozessmanagements verwendet Process Mining Ereignisprotokolle als Input und ermöglicht es, ein Bild der Realität zu erstellen, indem es Prozessausführungen greifbar macht, die Identifizierung von Engpässen erleichtert, neue Erkenntnisse liefert und Probleme in Geschäftsprozessen vorhersieht. Die Disziplin des Process Mining hat in den letzten Jahrzehnten sowohl in der Forschung als auch in der Praxis eine bemerkenswerte Entwicklung durchlaufen. Die Entwicklung innovativer Algorithmen und algorithmischer Erweiterungen ist ein fortlaufender Prozess, bei dem auch bisher ungenutzte Datenquellen erforscht werden, um den vorhandenen Wissensbestand zu erweitern. Traditionell sind die vorherrschenden Datenquellen für Process Mining Informationssysteme wie z.B. Warenwirtschaftssysteme. Prozessinformationen können jedoch auch aus anderen Quellen extrahiert und für das Process Mining genutzt werden. Der Großteil der verfügbaren Daten ist unstrukturiert und bietet somit eine große Chance, wertvolle kontextbezogene Einblicke in Geschäftsprozesse zu gewinnen. Dies kann eine umfassendere Darstellung und Analyse von realen Prozessen ermöglichen und Teile von Prozessen beleuchten, die bisher nicht in Ereignisprotokollen erfasst werden konnten. Das übergreifende Ziel dieser Dissertation ist es, einen Beitrag zur Weiterentwicklung der Process Mining Disziplin zu leisten, indem die Nutzung neuer Datenquellen ermöglicht wird. Dieses Ziel wird durch die Erleichterung der Integration von Sensor-, Video-, Bot- und Textdaten sowie durch die Bereitstellung eines systematischen Überblicks über Ansätze für unstrukturierte Daten im Process Mining verfolgt. Im Einklang mit Paradigmen der gestaltungsorientierten Forschung werden mehrere Artefakte entwickelt, die sowohl in der Forschung als auch in der Praxis zum Process Mining beitragen. Diese Dissertation umfasst fünf Forschungsartikel, die sich mit drei Chancen befassen den Anwendungsbereich der Process Mining Analyse zu erweitern. Erstens wird die Integration unstrukturierter Daten in das Process Mining in ersten Forschungsarbeiten behandelt. Allerdings steht eine systematische Übersicht, die eine umfassende Zusammenfassung der verwendeten Ansätze bietet, noch aus. Forschungsartikel 1 greift diese Chance auf, indem ein systematischer Literaturüberblick über den aktuellen Stand der Forschung zur Nutzung unstrukturierter Daten im Process Mining gegeben wird. Basierend auf diesen Ergebnissen wird eine Forschungsagenda aufgestellt, die sowohl offene Herausforderungen als auch potenzielle Wege für zukünftige Forschung aufzeigt. Zweitens könnten aus Video- und Sensordaten abgeleitete Daten die Erkennung von zuvor verborgenen, aber relevanten Prozessaktivitäten erleichtern und so ein transparenteres Prozessbild ermöglichen. Dementsprechend wird in Forschungsartikel 2 eine Referenzarchitektur vorgestellt, die Orientierung für die Nutzung unstrukturierter Datenquellen und traditioneller Ereignisprotokolle für objektzentriertes Process Mining gibt. Darüber hinaus wird eine Instanziierung der vorgeschlagenen Architektur bereitgestellt, die die spezifische Verwendung von Video- und Sensordaten für objektzentriertes Process Mining demonstriert. In Forschungsartikel 3 wird eine Referenzarchitektur für die unüberwachte Exploration von Videodaten entwickelt. Diese Architektur ermöglicht die Extraktion tatsächlicher Prozessaktivitäten aus Videodaten, ohne dass vordefinierte Aktivitäten erforderlich sind, und dient als Ausgangspunkt für die Prozesserkennung. Drittens hat die Verbindung mehrerer neuer Technologien mit Process Mining die Integration zusätzlicher Datenquellen erleichtert. Da der Einsatz von Robotic Process Automation (RPA) Bots in Geschäftsprozessen immer häufiger vorkommt, besteht die Notwendigkeit, die von Bots durchgeführten Schritte in die Process Mining Analyse zu integrieren. Dementsprechend stellt Forschungsartikel 4 einen Ansatz vor, der Bot-Logs aus RPA-Software für Process Mining nutzbar macht. Zudem werden Kennzahlen entwickelt, die Bot-Logs und Prozess-Ereignisprotokolle in einem integrierten Ansatz analysieren. Chatbots stellen eine weitere Art von Bots dar, welche in Szenarien eingesetzt werden, in denen eine Ausrichtung an die zugrunde liegenden Geschäftsprozesse und die Einhaltung gesetzlicher Vorschriften unerlässlich ist. Folglich besteht die Notwendigkeit, textuelle Konversationsdaten von Chatbots ins Process Mining zu integrieren, um zu untersuchen, ob Chatbots prozesskonformes Verhalten erreichen. Forschungsartikel 5 befasst sich mit dieser Chance, indem ein Ansatz entwickelt wird, der textuelle Konversationsdaten von Chatbots in Ereignisprotokolle fürs Process Mining umwandelt und die Fähigkeit von Chatbots, Geschäftsprozesse zu erlernen und diese einzuhalten, quantifiziert. Insgesamt trägt diese Dissertation mit den fünf Forschungsartikeln zur Weiterentwicklung der Process Mining Disziplin bei, indem sie die Nutzung neuer Datenquellen ermöglicht. Die durchgeführte Literaturanalyse liefert neue Erkenntnisse, um die Forschung an der Schnittstelle von unstrukturierten Daten und Process Mining systematisch voranzutreiben. Die Dissertation stellt zwei Artefakte vor, die Orientierung für die Einbeziehung von Video- und Sensordaten als neue Datenquellen für das Process Mining bieten, ergänzt durch eine generische Architektur zur Nutzung unstrukturierter Daten für das objektzentrierte Process Mining. Des Weiteren werden zwei Artefakte zur Integration von Daten aus neuen Technologien vorgestellt. Beide Artefakte ermöglichen eine ganzheitlichere Prozessbetrachtung durch das Einbeziehen von Daten aus Chatbots und RPA-Bots als neue Datenquellen für das Process Mining.