Trabajo de grado - Doctorado
Automated discovery of business process simulation models from event logs: a hybrid process mining and deep learning approach
Fecha
2021-11-11Registro en:
instname:Universidad de los Andes
reponame:Repositorio Institucional Séneca
Autor
Camargo Chávez, Manuel Alejandro
Institución
Resumen
Modern organizations need to constantly adjust their business processes in order to adapt to internal and external changes, such as new competitors, new regulations, changes in customer expectations, or changes in strategic objectives. For example, due to a pandemic, a retailer might experience a 50% increase in their number of online orders while, during the same time, their volume of in-store purchases declines by 30%. To adjust to these changes, the managers may decide to re-deploy employees from the retail stores to the warehouses of the company and the company's online customer service department. To inform their decisions, the managers need to have an accurate estimate of the impact of the above changes on the delivery and customer service response times. A common approach to make such estimates is to use Business Process Simulation (BPS). BPS refers to the use of computers to explore the dynamics of a business process over time. BPS has long proven to be a useful approach to answer what-if questions in the context of business process redesign. At the same time, the predictions made by BPS models are known to be relatively inaccurate due to the way they are usually applied. Traditionally, domain experts create simulation models manually by using manual data gathering techniques (e.g. interviews, observations, and sampling). This approach makes the creation of simulation models time-consuming and error-prone. In real-life, business processes tend to be more complex than what domain experts can capture in a manually designed simulation model. Yet, any omission in the simulation model can significantly affect the accuracy and reliability of a simulation. Other limitations of current BPS approaches arise from fundamental assumptions that business process simulation engines make. For example, business process simulation engines assume that human workers work in a robotic (or factory-line) style- meaning that they conduct their work continuously during working hours, without any distractions, without multitasking, and without fatigue. In other words, current business process simulation approaches are not able to capture and reproduce the complexity of human behavior. In this context, this thesis investigates the following overarching question: How to automatically create accurate business process simulation models based on data extracted from enterprise information systems? Previous research on this question has demonstrated the viability of using a family of techniques for the analysis of business process execution data, known as process mining, to semi-automatically extract BPS models from execution data. Such techniques are fall under the banner of Data-Driven Simulation (DDS). This thesis starts by noting that existing techniques in the field of DDS require manual intervention and fine-tuning to produce accurate simulation models. To address this gap, the thesis presents and evaluates a fully automated technique for DDS capable of discovering and fine-tuning BPS models through process mining techniques. The core idea of the technique is to assess the accuracy of a BPS model automatically using a similarity measure that considers both the ordering of activities and their execution times. On this basis, the proposed technique employs a Bayesian optimization algorithm to maximize the similarity between the behavior generated by the BPS model and the behavior observed in the execution data. The thesis, thus, shows that the proposed DDS technique generates models that accurately reflect the ordering of activities. However, the proposed technique often falls short when it comes to predicting the timing of each activity. This phenomenon is due to the assumptions that BPS techniques make about the behavior of resources in the process. To tackle this shortcoming, the thesis combines DDS techniques based on process mining, with generative modeling techniques based on deep learning. In this respect, the thesis makes two contributions. First, it proposes an approach to learn generative deep learning models that are able to produce timestamped sequences of activities (with associated resources) based on historical execution data. Second, it proposes an approach to combine DDS techniques based on process mining, with generative deep learning modeling techniques. The thesis shows that this hybrid approach to learn BPS models leads to simulations that more closely reflect the observed sequences of activities and their timings compared to a DDS technique based purely on process mining and techniques based purely on deep learning. Las organizaciones modernas necesitan ajustar constantemente sus procesos de negocio para adaptarse a cambios en su entorno interno y externo, tales como, nuevos competidores, nuevas regulaciones, cambios en las expectativas de los clientes o cambios en los objetivos estratégicos. Por ejemplo, debido a una pandemia, un minorista puede experimentar un aumento del 50% en su número de pedidos en línea, mientras que, durante el mismo tiempo, su volumen de compras en la tienda disminuye en un 30%. Para adaptarse a estos cambios, los gerentes pueden decidir reasignar a los empleados de las tiendas minoristas a los almacenes de la empresa y al departamento de atención al cliente en línea de la empresa. Para tomar decisiones informadas, los gerentes necesitan una estimación precisa del impacto de los cambios anteriores en los tiempos de respuesta de entrega y servicio al cliente. Un enfoque común para realizar tales estimaciones es utilizar Simulación de Procesos de Negocio (BPS por sus siglas en inglés). BPS se refiere al uso de computadoras para explorar la dinámica de un proceso comercial a lo largo del tiempo. BPS ha demostrado durante mucho tiempo ser un enfoque útil para responder preguntas hipotéticas en el contexto del rediseño de procesos comerciales. Al mismo tiempo, se sabe que las predicciones efectuadas por los modelos de BPS son relativamente inexactas debido a la forma en que se aplican habitualmente. Tradicionalmente, los expertos en el dominio crean modelos de simulación manualmente empleando técnicas de recopilación de datos manuales (por ejemplo, entrevistas, observaciones y muestreo). Este enfoque hace que la creación de modelos de simulación requiera mucho tiempo y sea propensa a errores. En la vida real, los procesos de negocio tienden a ser más complejos de lo que los expertos en el dominio pueden capturar en un modelo de simulación diseñado manualmente. Sin embargo, cualquier omisión en el modelo de simulación puede afectar significativamente la precisión y confiabilidad de una simulación. Otras limitaciones de los enfoques actuales de BPS surgen de supuestos fundamentales que hacen los motores de simulación de procesos de negocio. Por ejemplo, los motores de simulación asumen que los trabajadores humanos trabajan en un estilo robótico (o de línea de fábrica), lo que significa que realizan su trabajo continuamente durante las horas de trabajo, sin distracciones, sin realizar múltiples tareas y sin fatiga. En otras palabras, los enfoques de simulación de procesos comerciales actuales no pueden capturar y reproducir la complejidad del comportamiento humano. En este contexto, esta tesis investiga la siguiente pregunta general: ¿Cómo crear automáticamente modelos precisos de simulación de procesos de negocio basados en datos extraídos de los sistemas de información empresarial? Investigaciones anteriores sobre esta cuestión han demostrado la viabilidad de utilizar una familia de técnicas para el análisis de datos de ejecución de procesos comerciales, conocida como minería de procesos, para extraer semiautomáticamente modelos BPS de los datos de ejecución. Estas técnicas se encuentran bajo el nombre de Simulación Basada en Datos (DDS por sus siglas en inglés). Esta tesis comienza señalando que las técnicas existentes en el campo de DDS requieren una intervención manual y un ajuste fino para producir modelos de simulación precisos. Para abordar esta brecha, la tesis presenta y evalúa una técnica totalmente automatizada para DDS capaz de descubrir y ajustar modelos BPS empleando técnicas de minería de procesos. La idea central de la técnica es evaluar la precisión de un modelo BPS automáticamente mediante una medida de similitud que considera tanto el orden de sus actividades como sus tiempos de ejecución. Sobre esta base, la técnica propuesta utiliza un algoritmo de optimización bayesiano para maximizar la similitud entre el comportamiento generado por el modelo BPS y el comportamiento observado en los datos de ejecución. La tesis muestra que la técnica DDS propuesta genera modelos que reflejan con precisión el orden de las actividades. Sin embargo, dicha técnica a menudo se queda corta cuando se trata de predecir el momento de cada actividad. Este fenómeno se debe a los supuestos que hacen las técnicas de BPS sobre el comportamiento de los recursos en el proceso. Para abordar esta deficiencia, la tesis combina técnicas de DDS basadas en minería de procesos, con modelos generativos de Deep Learning. En este sentido, la tesis hace dos aportes. Primero, propone un enfoque para aprender modelos generativos de Deep Learning que pueden producir secuencias de actividades con marcas de tiempo (y recursos asociados) basadas en datos de ejecución históricos. En segundo lugar, propone un enfoque para combinar técnicas de DDS basadas en minería de procesos, con técnicas de modelado generativo de Deep Learning. La tesis muestra que este enfoque híbrido para aprender modelos BPS conduce a simulaciones que reflejan más de cerca las secuencias de actividades observadas y sus tiempos en comparación con una técnica DDS basada puramente en la minería de procesos o técnicas basadas puramente en Deep Learning. Kaasaegsed organisatsioonid peavad oma äriprotsesse pidevalt muutma, et kohaneda erinevate sisemiste ja välimiste muutustega nagu näiteks uued konkurendid, uued regulatsioonid, muutused klientide ootustes või muutused strateegilistes eesmärkides. Näiteks pandeemia oludes võib jaemüüja internetikaubanduse maht suureneda 50%, samas kui kohapeal sooritatud ostude maht langeb näiteks 30%. Sellise muutunud olukorraga kohanemiseks võib jaemüüja otsustada töötajate ümberpaigutamise jaekauplustest ettevõtte ladudesse ja veebipõhise klienditeeninduse osakonda. Seda tüüpi otsuste teadlikuks vastuvõtmiseks on jaemüüjal vaja täpset hinnangut selle kohta, millist mõju antud otsus avaldaks kaupade kohaletoimetamise ja klientide päringutele vastamise aegadele. Tavapärane lähenemine selliste hinnangute andmiseks on kasutada äriprotsesside simuleerimist. Äriprotsesside simuleerimine viitab äriprotsesside ajalise dünaamika arvuti abil uurimisele ja tegemist on kasuliku lähenemisega vastamaks "mis-oleks-kui" tüüpi küsimustele äriprotsesside ümberdisainimise kontekstis. Samas, tulenevalt sellest kuidas äriprotsesside simuleerimist tavaliselt rakendatakse, on selle lähenemisega saadud ennustused teadaolevalt suhteliselt ebatäpsed. Äriprotsesside simuleerimisel kasutatavad simulatsioonimudelid luuakse tavaliselt valdkonna ekspertide poolt käsitsi, kasutades manuaalseid andmekogumismeetodeid (intervjuud, vaatlused, valikulised andmete väljavõtted), mis omakorda muudab simulatsioonimudelite loomise ajamahukaks ja veaaltiks. Reaalsuses on äriprotsesside käitumine sageli oluliselt keerukam sellest, mida valdkonna eksperdid suudaksid käsitsi koostatud simulatsioonimudelites kajastada. Samas iga simulatsioonimudelist välja jäänud detail võib oluliselt mõjutada äriprotsesside simuleerimise täpsust ja usaldusväärsust. Teised olemasolevate äriprotsesside simuleerimise lähenemiste puudujäägid tulenevad äriprotsesside simulatsioonimootorite poolt tehtavatest põhimõttelistest eeldustest. Näiteks eeldus et inimesed töötavad robotitele (või tehase tööliinidele) sarnasel viisil, ehk et tööd tehakse töötundide jooksul järjepidevalt, püsiva tähelepanuga, kõrvalistele töödele aega kulutamata ja väsimatult. Ehk teisisõnu, olemasolevad äriprotsesside simuleerimise lähenemised ei ole võimelised kajastama ja seega ka taaslooma inimkäitumise keerukust. Ülaltoodust lähtuvalt uurib käesolev doktoritöö järgnevat üleüldist küsimust: Kuidas automatiseeritult luua täpseid äriprotsesside simulatsioonimudeleid tuginedes ettevõttete infosüsteemidest kogutud andmetele? Antud küsimusega seonduv varasem teadustöö on näidanud, et äriprotsessi käitlemisandmete analüüsitehnikaid, mida tervikuna nimetatakse protsessikaeveks, on võimalik edukalt kasutada äriprotsesside simulatsioonimudelite pool-automatiseeritult loomiseks ning vastavate tehnikate kohta kasutatakse üldnimetust andmepõhine simuleerimine. Käesolev doktoritöö juhib kõigepealt tähelepanu tõsiasjale, et täpsete simulatsioonimudelite loomine, kasutades olemasolevaid andmepõhise simuleerimise tehnikaid, nõuab käsitsi sekkumist ja peenhäälestamist. Selle puudujäägi lahendamiseks esitatakse ja hinnatakse käesolevas doktoritöös andmepõhise simuleerimise täielikult automatiseeritud lahendus, mis suudab tuvastada ja peenhäälestada simulatsioonimudeleid rakendades protsessikaeve tehnikaid. Lahenduse tuumikidee on automatiseeritult hinnata simulatsioonimudeli täpsust, arvestades nii tegevuste järjekorda kui ka tegevuste kestuseid. Täpsuse hinnangule tuginedes rakendatakse antud lähenemises Bayesi optimeerimisalgoritmi eesmärgiga saavutada maksimaalne sarnasus simulatsioonimudeli poolt genereeritud käitumise ja äriprotsessi käitlemisandmete vahel. Seejärel näitab käesolev doktoritöö, et esitatud andmepõhise simuleerimise tehnika loob simulatsioonimudeleid, mis peegeldavad tegevuste järgnevusi täpselt, aga samas ei suuda sageli täpselt ennustada tegevuste kestust. Antud puudujääk on põhjustatud andmepõhise simuleerimise tehnikates tehtavatest eeldustest seoses ressursside käitumisega äriprotsessides. Antud puudujäägi lahendamiseks kombineeritakse käesolevas doktoritöös protsessikaevel tuginevaid andmepõhise simuleerimise tehnikaid ja generatiivseid süvaõppepõhiseid modelleerimise tehnikaid. Selles osas esitab käesolev doktoritöö kaks teaduslikku panust. Esiteks, lähenemine generatiivsete süvaõppe mudelite loomiseks, mis võimaldavad protsessi ajalooliste käitlemisandmete põhjal genereerida ajatembeldatud sündmuste järgnevusi koos sündmustele vastavate ressurssidega. Teiseks, lähenemine protsessikaevel tuginevate andmepõhise simuleerimise tehnikate ja generatiivsete süvaõppepõhiste modelleerimise tehnikate kombineerimiseks. Käesolev doktoritöö näitab, et sellise hübriidlähenemisega loodud simulatsioonimudelid võimaldavad luua simulatsioone, mis peegeldavad protsessi käitlemisandmetes sisalduvaid sündmuste järgnevusi ja kestuseid täpsemalt kui ainult andmepõhisele simulatsioonile tuginevad tehnikad ja täpsemalt kui ainult süvaõppele tuginevad tehnikad.