본문 바로가기

Data Analysis/process mining

프로세스 마이닝이란?

728x90
반응형

프로세스 마이닝 (Process Mining) : 프로세스 마이닝이란 말 그대로 프로세스에 대한 데이터 마이닝, 즉 프로세스를 대상으로 데이터를 수집하고 분석하여 분석 대상이 되는 프로세스에 대해 잘 이해하고, 파악하며 개선을 수행하는 일련의 활동을 의미한다.

  • 정의 : 정보시스템을 이용하는 과정에서 기록된 데이터 중 특히 프로세스 수행 과정에서 기록되는 데이터(이벤트 로그 데이터)에 초점을 맞추어 이를 바탕으로 프로세스에 대한 의미 있는 정보를 찾아내는 분석 기법
    • 프로세스 : 제품과 서비스를 전달함으로써 가치를 창출할 수 있는 활동들을 조직화한 구성체
  • 목적
    • 시스템 상에서 일어난 현상과 발생 원인 파악
    • 미래의 시스템에는 어떤 일이 일어날 것인지 예측
    • 프로세스를 보다 더 잘 제어하기 위한 방안 탐색
    • 프로세스 성능 향상을 위한 프로세스 재설계 방안 탐색
  • 프로세스 마이닝 분석 방식 3가지

분석 방식 목적 입력 데이터 결과물
프로세스 모델 도출
(Discovery)
프로세스 모델 발견 이벤트 로그 프로세스 모델
순응도 평가
(Conformance checking)
프로세스 모델 품질 평가 이벤트 로그
프로세스 모델
진단
(로그-모델 간 비교)
프로세스 모델 개선
(Enhancement)
프로세스 모델 개선 이벤트 로그
프로세스 모델
개선, 확장된 새로운 프로세스 모델

 

  • 프로세스 모델 도출 분석의 중요성 : 3가지 방식의 프로세스 마이닝 분석 중, 가장 주가 되는 것은 프로세스 모델 도출인데 프로세스 모델 도출은 다음과 같은 이유로 중요한 의의를 갖습니다.
    • 좋은 프로세스 모델은 프로세스를 이해하는 바탕이 됨
    • 프로세스 모델을 통해 현실 세계의 프로세스에 대한 정량적 분석 가능
    • 도출된 프로세스 모델은 모든 프로세스 마이닝 분석의 기초가 됨
  • 이벤트 로그 : 프로세스 마이닝 분석을 위해서는 이벤트 로그라고 하는 특정 형태의 입력 데이터가 필요한데 이벤트 로그는 다음 그림과 같은 형태를 갖습니다.
    • 이벤트 로그는 하나의 프로세스를 수행한 여러 케이스가 모여 생성
    • 하나의 케이스 : 여러 개의 액티비티가 순서대로 기록되어 있음                                 

 

  • 프로세스 모델(Process model) : 현실 세계의 프로세스를 쉽게 이해하기 위해 액티비티 간의 연관관계를 시각화한 것입니다. 프로세스 모델은 다시 결정적 프로세스 모델과 확률적 프로세스 모델로 나눌 수 있습니다.

 

  • 결정적 프로세스 모델(Deterministic process model) : 확률 정보(작업 수행 확률, 작업 수행 시간)를 포함하지 않은 프로세스 모델
    • 페트리넷 기반 프로세스 모델 : 토큰, 플레이스, 트랜지션, 아크를 이용한 프로세스 모델, 토큰이 트랜지션을 통해 한 플레이스에서 아크로 연결된 다른 플레이스로 이동하는 것으로 표 
      • 한계점 : deadlock이나 livelock과 같은 비정상 행동 발생 가능성이 존재하는 불완전 모델(Unsound model)의 특성을 가짐

 

 

 

 

 

  • 확률적 프로세스 모델(Stochastic process model) : 확률 요소(액티비티 수행 시간 분포 등)을 포함한 프로세스 모델
    • 확률적 페트리 넷(Stochastic petri net) : 결정적 페트리넷의 플레이스 사이에 액티비티 간 시간 간격 분포가 표현된 트랜지션을 추가한 페트리넷, 여러 트랜지션이 동시에 발생 가능한 경우 트랜지션 확률을 weight로 표현, 다만, 페트리넷의 구조적 한계를 공유함으로서 비정상 행동이 발생하는 불완전 모델이 발생 가능합니다.

 

반응형