지난호 보기
특집

이상치 탐지와 디지털 트윈 기술

글 : 장규창 교수(제주대학교) / kyuchang@jejunu.ac.kr

조회수298



 1. 이상치 탐지 정의와 다양한 산업군 적용 사례


  이상치 탐지(Anomaly detection)란 정상 범주에 속하지 않는 데이터를 탐지하기 위한 과정을 의미한다. 이상치 탐지를 위해서 이상치를 정의하는 과정이 선행된다. 이상치는 전통적으로 다른 매커니즘에 의해 생성된 것으로 의심될 정도의 데이터[1] 또는 발생할 확률이 극히 낮은 데이터라고 일컬어 지는데, 이상치 패턴에 따라 세 가지 유형으로 분류된다[1]. 이상치의 유형을 데이터의 비교 범위나 데이터 타입(type)에 따라 나누기도 하는데, 본 칼럼에서는 이상치 패턴을 기준으로 분류하는 방법을 소개한다. 


[그림 1. 세가지 유형의 이상치]



   첫번째는 점 이상(Point anomalies)[2]이며, 단일 데이터 포인트가 복수의 정상 데이터들의 범주에서 벗어난 경우를 의미한다[2]. [그림 1]의 (a)를 통해서 확인할 수 있듯이 다수의 데이터 포인트가 뭉쳐있는 그룹을 벗어난 개별적인 데이터 포인트를 점 이상으로 정의할 수 있다. 두번째 유형의 이상치는 맥락적 이상(Contextual, Conditional anomalies)으로 특정한 상황에서 데이터의 일부 집합이 정상과 다른 경향을 보이는 데이터를 의미한다. 연속적인 상황과 행동에서 특이한 패턴이 발생하는 경우를 의미하며 [그림 1]의 (b)에서와 같이 시간에 흐름에 따른 신호의 패턴이 일반적인 상황에서 나타나는 주기성을 벗어난 경우가 그 예시이다. 세번째 유형은 집단적 이상(Collective, Group Anomalies)으로, 복수의 개체 그룹이 전체 데이터의 일반적인 패턴과 다른 경우를 의미한다. [그림 1]의 (c)에서 빨강 점들의 묶음과 같이 일련의 이상치 데이터들이 서로 높은 연관성을 갖고 있음을 확인할 수 있다. 


  4차 산업혁명의 촉발로 IoT(Internet of Things) 기반의 센서 시스템을 통해서 다양한 산업군의 데이터가 실시간으로 수집되고 있다. 실시간으로 수집되는 데이터를 통해서 시스템이 정상적으로 동작하고 있는지 확인하기 위한 모니터링 과정이 수행되는데, 이 때 데이터에서 특이한 이벤트나 패턴이 발생하는 경우에 이를 식별할 수 있는 이상치 탐지를 수행하고 결과적으로 문제를 조기에 발견하고 적절한 대응을 할 수 있다. 제조, 의료, 금융, 보안, 항공 등 다양한 분야에서 활용될 수 있으며 각각의 분야에서 아래 [그림 2]와 같이 시계열 데이터, 이미지 데이터, 생산 프로세스 데이터, 로그 데이터 등 다양한 데이터가 발생하고 이에 적합한 이상치 탐지 방법론이 적용되고 있다. 


 

[그림 2. 산업군에서 발생하는 다양한 타입의 데이터



   첫째, 제조산업에서 이상치 탐지 기술을 활용하여 제품 및 설비의 결함을 검출하고 품질의 예측이나 설비의 유지보수를 수행한다. 반도체 디퓨전(Diffusion) 공정 설비에서 수집되는 센서 데이터를 활용해서 설비의 이상을 탐지하는 연구사례가 있으며, 동제련 공정에서 제품의 품질을 예측하기 위해 이미지 영상을 촬영해서 문제가 있는지 여부를 판별하기도 한다[4]. 또한 디지털 트윈(Digital twin)의 가상환경에서 생산 프로세스에서 스케줄링에 문제가 있는 이상 상황을 탐지하는 연구도 수행되었다[5]. 제조 데이터에 이상치 탐지 방법론을 적용하면 설비의 고장이나 결함, 제품의 품질이상을 조기에 감지하고 이를 예방하기 위한 예지 정비(Predictive maintenance)를 실시할 때 관련 부품을 교체할 최적의 시점을 결정할 수 있다. 결과적으로 공정의 생산성을 개선하고 품질을 향상시킬 수 있는 기반이 된다. 

   의료 분야에서도 이상치 탐지 기술이 활발히 사용된다. 환자의 나이, 성별, 증상, 감염이력, 검진결과 등의 데이터는 환자가 앓고 있는 질병의 병세를 파악하거나 새로운 질병의 발병 가능성을 예측하는데 활용할 수 있다. 심전도 데이터를 활용하여 심장병 여부를 판단하고 미세한 심장 박동의 이상 상황을 통해서 추후 발병할 수 있는 심장병을 예측하는 연구, X-ray, MRI, CT 등 의학 장비로부터 확보한 이미지 데이터로부터 이상치 데이터인 발병 여부를 조기에 탐지하는 연구, 의료 영상, 임상 뇌파기록 데이터를 분석하는 연구 등이 수행되었다. 발병 데이터를 충분히 확보하기 어려운 상황에서 고도화된 이상치 탐지 알고리즘이 꼭 필요한 분야라고 볼 수 있다. 

   그 외에도 보안 분야에서 네트워크 트래픽의 의심스러운 활동을 발견하기 위한 IDS(Intrusion Detection System) 구축 연구[6], 전자 상거래 분야에서 부정 및 범법 행위를 발견하는 사기탐지(Fraud Detection) 연구, 소프트웨어 정의 네트워킹(SDN)을 대상으로 수행된 연구, 시스템 로그 데이터를 대상으로 수행된 연구 등이 있다. 교통 및 항공 분야, 금융 분야, 우주 분야 등 다양한 산업군에서 개별 도메인에 특화된 이상치 탐지 알고리즘 연구가 활발히 진행되고 있다. 


 2. 이상치 탐지 모델의 분류 체계

 

   이상치 탐지 모델을 분류하는 다양한 체계가 존재한다.


   데이터 정답(label)의 존재 유무에 따라 지도학습 기반/ 반지도학습 기반/ 비지도 학습 기반의 방법론으로 나누기도 한다. 반지도학습 방법론은 정상 데이터만을 가지고 모델을 학습한다는 점에서 현실적인 모델이지만 학습 데이터에 과적합(overfitting) 될 위험이 존재한다. 비지도 학습 기반의 방법은 대부분의 데이터가 정상 상태라는 전제로 모델 학습을 수행한다. 인공지능 모델의 활용을 기준으로 머신러닝 기반/ 딥러닝 기반/ 하이브리드 기반의 방법론으로 나누기도 하는데, 최근에는 고도화된 딥러닝의 활용도가 높아지는 추세이다. [그림 3]은 딥러닝을 이용한 이상치 탐지 모델의 분류체계를 나타낸 것이다[7]. 

 


[그림 3. 딥러닝 기반 이상치 탐지 모델의 3가지 분류 체계][7]



   [그림 3] (a)는 이상치 점수를 산출(anomaly scoring)하거나 특질을 추출하는 과정에서 사전 훈련된(pre-trained) CNN 구조를 사용할 수 있다. 기 개발된 VGG, ResNet 모델을 활용해서 이상치 탐지를 위한 정보를 추출할 뿐만 아니라 차원을 감소시키는 효과가 있다. [그림 3]의 (b)에는 오토인코더, GAN(Generative Adversarial Networks) 등의 생성 모델을 사용하여 재구축 오차(reconstuction error)를 계산하는 방식이 포함된다. 다양한 종류의 변형 오토인코더를 사용하여 그 강점을 활용할 수 있으나 노이즈(noise)에 민감한 특징이 있다.


   GAN 기반의 방법은 특히 이미지 데이터가 대해서 잠재 공간에서 제대로 재구성되지 않는 비정상 이미지를 효과적으로 탐지할 수 있으나 학습이 어려운 문제가 있다. 정상값들은 몇 개의 군집에 모여있고 이상값은 군집에 속하지 않는 특징을 이용하는 클러스터링 기반 이상탐지, 정상 데이터의 특질 표현 경계선(feature representation boundary)을 학습하여 영역 밖의 데이터를 탐지하는 OC-SVM(One class-Supprot Vector Machine) 알고리즘도 이에 해당한다. [그림 3] (c)의 경우 기존의 신경망 모델과 이상치 측정을 결합한 방식으로 이상 점수(anomaly score)를 산출하기 위해서 모델의 손실 함수(loss function)를 새롭게 고안한 것이 특징이다. 이상 점수를 직접 최적화 할 수 있으나 이상 징후에 대한 사전정보(labeling)가 필요하다는 한계가 있기도 하다. OmniAnomaly(A Stochastic RNN for MTS Anomaly Detection) 방법론이 End-to-end 이상점수를 학습하는 방식으로 이상치를 탐지하는 대표적인 방법론이다[8]. 



 3. 디지털 트윈과 이상치 탐지


   이상치 탐지 연구는 많은 산업군에서 관심을 갖고 수행되고 있으며, 디지털 트윈(Digital twin) 기술과 이상치 탐지 연구가 접목된 사례 연구도 등장하고 있다. Yibing는 초기 계획과 실제 공정에서의 실행 결과 간의 편차(deviation)를 줄이기 위한 디지털 트윈 기반의 이상치 탐지 및 동적 스케줄링 프레임 워크를 제안하였다[5]. 이를 통해 실시간으로 최적화 전략을 탐색하고 결과적으로 스케줄링 방식을 적시에 개선하고 반복적인(iterative) 최적화를 달성하였다. [그림 4]는 디지털 트윈 기반의 이상탐지 기법을 활용하여 스케줄링을 최적화하기 위한 매커니즘을 나타낸 것이다[5].

 


[그림 4. 디지털 트윈 기반의 잡샵 스케줄링 메커니즘]



[그림 4]에서와 같이 실제 작업장에서 자재, 인력, 기계 등의 작업 정보를 획득하고 이를 토대로 자원을 효과적으로 관리할 수 있는 일정계획을 수립하고 이를 가상 환경의 시뮬레이션 상에서 잠재적인 문제를 찾기 위한 점검과정을 거치게 된다. 이후 가상 작업장에서의 제어 명령(control commands)이 실제 작업장에 반영되고 이 과정이 지속적으로 동기화(synchronization)된다. 작업이 진행되는 동안에 RFID(Radio Frequency Identification), 산업용 PLC(Product Life Cycle), 그외 IoT 센서를 통해서 실시간 프로세스 데이터(processing data)를 확보하여 [그림 4] 상단의 Workshop service system으로 전송한다. 전송된 데이터를 활용하여 가상 모델의 상태 변수를 업데이트하고 동시에 모니터링 과정을 통해서 이상을 탐지하는데, 이상탐지 정보를 기반으로 스케줄링을 최적화하는 과정이 수행된다. 이 외에도 디지털 트윈으로 구현한 스마트 그리드 및 스마트 빌딩에 이상치 탐지 기술을 적용한 사례들이 연구되었다[9]. 

   이상치 탐지 연구가 매우 활발하게 이루어지고 있음에도 디지털 트윈 상에서 이상치 탐지 기술을 효과적으로 적용하기 위해서 해결해야 할 과제가 있다. 첫째, 디지털 트윈을 구현하기 위해 수집하는 데이터의 특성을 고려해야 한다. 디지털 트윈 상의 데이터는 데이터 불균형도가 심하고 실시간으로 생성되는 동적인 성격을 지니는 경우가 대다수이다[10]. 이러한 경우에 맥락적(contextual) 이상 상황을 탐지할 수 있는 관련 알고리즘을 접목하는 것이 필요하다. 또한 점 이상(Point anomalies)에 대해서 디지털 트윈 상에서 정의하고 효과적으로 표현하기 위한 창의적인 방법이 필요할 것이다. 둘째, 디지털 트윈의 효과성을 극대화하기 위해서, 물리적 모델과 실시간으로 동기화하는 과정이 중요하다. 성능이 우수한 딥러닝 기반의 모델이 개발되고 있으나 모델의 이상 탐지 성능만 고려하는 것이 아니라 시간 효율성(time efficiency)을 주요 지표로 고려한 모델의 선택이 필요하다. Batzner의 Efficientad(Accurate visual anomaly detection at millisecond-level latencies) 모델이 이와 맥을 같이 한다[11]. Efficientad는 모델 구조를 효율화하여 추론(inference) 속도를 개선한 이상치 탐지 방법론으로 연산 효율성을 위한 hard feature loss와 loss penalty를 제안한 방법론이다.


   이상치 탐구 연구와 디지털 트윈 기술의 연구가 개별적으로 매우 활발하게 이루어지고 있는 만큼, 두 연구의 시너지 효과를 위해 창의적이고 도전적인 융합 연구를 시도하는 것이 필요한 시점이다. 



REFERENCES

[1] Hawkins, D. M. (1980). Identification of outliers (Vol. 11). London: Chapman and Hall.

[2] Chernov, A. V., Savvas, I. K., & Butakova, M. A. (2018, September). Detection of point anomalies in railway intelligent control system using fast clustering techniques. In International Conference on Intelligent Information Technologies for Industry (pp. 267-276). Cham: Springer International Publishing.

[3] Chang, K., Yoo, Y., & Baek, J. G. (2021). Anomaly detection using signal segmentation and one-class classification in diffusion process of semiconductor manufacturing. Sensors, 21(11), 3880.

[4] Yoo, J., Song, S., Chang, K., & Baek, J. G. (2023). Fault detection and diagnosis using two-stage attention-based variational LSTM in electrolytic copper manufacturing process. The International Journal of Advanced Manufacturing Technology, 1-20.

[5] Li, Y., Tao, Z., Wang, L., Du, B., Guo, J., & Pang, S. (2023). Digital twin-based job shop anomaly detection and dynamic scheduling. Robotics and Computer-Integrated Manufacturing, 79, 102443.

[6] Liao, H. J., Lin, C. H. R., Lin, Y. C., & Tung, K. Y. (2013). Intrusion detection system: A comprehensive review. Journal of Network and Computer Applications, 36(1), 16-24.

[7] Pang, G., Shen, C., Cao, L., & Hengel, A. V. D. (2021). Deep learning for anomaly detection: A review. ACM computing surveys (CSUR), 54(2), 1-38.

[8] Su, Y., Zhao, Y., Niu, C., Liu, R., Sun, W., & Pei, D. (2019, July). Robust anomaly detection for multivariate time series through stochastic recurrent neural network. In Proceedings of the 25th ACM SIGKDD international conference on knowledge discovery & data mining (pp. 2828-2837).

[9] Lu, Q., Xie, X., Parlikad, A. K., & Schooling, J. M. (2020). Digital twin-enabled anomaly detection for built asset monitoring in operation and maintenance. Automation in Construction, 118, 103277.

[10] 신윤종, & 이남연. (2022). 디지털 트윈 환경에서의 이상치 탐지 알고리즘 비교분석. Journal of Digital Contents Society, 23(12), 2497-2506.

[11] Batzner, K., Heckler, L., & König, R. (2023). Efficientad: Accurate visual anomaly detection at millisecond-level latencies. arXiv preprint arXiv:2303.14535.



사단법인 한국CDE학회(구 한국CAD/CAM학회)
(06130) 서울시 강남구 테헤란로7길 22, 한국과학기술회관 1관 909호 | Tel: 02-501-6862 | Fax: 02-501-6863 | E-mail: info@cde.or.kr

대표이사: 유병현 / 사업자등록번호: 220-82-60063

Copyright© 2023. Society for Computational Design and Engineering. All rights