지난호 보기
2024 하계학술대회 수상자 리뷰

ControlNet을 활용한 재구축 기반 이상 영역 탐지

글 : 임석준(전남대학교) / elex0104@naver.com

조회수73

ControlNet을 활용한 재구축 기반 이상 영역 탐지

Reconstruction Based Anomaly Region Detection Using ControlNet


이상 탐지는 정상 패턴과는 다른, 이상 패턴을 가진 객체를 찾는 것으로, 정상과 이상을 구분하는 일종의 분류 문제이다. 이상탐지 모델의 학습에 사용되는 데이터셋은, 데이터 불균형 문제가 심각하여 이상 데이터를 정상적으로 판별하지 못하는 경우가 많았고, 이미지를 재구축하여 원본 이미지와 비교하는 재구축 기반 이상 탐지 방법론들이 제시되었다. 하지만, 해당 방법론들은 많은 시간과 비용이 필요하다.


본 연구에선, 이전 방법론에서 사용되지 않았던, 학습되는 매개변수가 적고, condition을 통해 쉽게 제어할 수 있는 ControlNet을 활용한 이상 영역 탐지를 진행하고자 한다. 또한, 일반적인 이미지를 Condition으로써 학습하지 못하는 ControlNet을 위한 새로운 학습법을 탐구한다. 마지막으로, 이상 영역 탐지에 특화된, Swin Transformer 기반 Mask 생성 모델을 개발한다. 위 방법을 통해 학습이 빠르고, 높은 성능을 보이는 생성형 인공지능인 ControlNet을 활용하여, 재구축 모델의 더 빠른 도메인 적용을 가능케 한다.


그림 1은 본 연구에서 제안하는 이상 탐지 모델의 구조이다. 모델은 크게 재구축 부분, Mask 생성 부분으로 나뉜다. 재구축 부분에선 ControlNet이 정상 혹은 이상 이미지를 받아 모두 정상 이미지로 재구축한다. Mask 생성 부분에선 Swin Transformer에 이상 이미지, 재구축 이미지, 보간 이미지를 넣어 특징 맵 ( feature map )을 추출하고, UNet 구조의 CNN 기반 Decoder를 활용하여 해당 특징 맵을 기반으로 결함 부분의 Mask를 생성한다. 



그림 1. 본 연구에서 제안하는 이상 탐지 모델의 구조


림 2는 본 연구에서 제안하는 ControlNet 학습 방법이다. 학습을 위한 이상 이미지는, 정상 이미지에 noise를 합성하여 제작한다. 기존의 ControlNet 학습에선 원본 이미지를 0 ~ 1로, 목표 이미지를 -1 ~ 1로 정규화하여 학습을 진행하지만, 기존 학습 방법의 원본 이미지에는 일반적인 RGB 이미지가 아닌, canny나 HED 경계선과 같은 테두리, Human Pose, Semantic Segmentation, 깊이 맵 등이 사용된다. 학습에 일반적인 RGB 이미지를 사용하는 것은, 기존 ControlNet의 학습 방법과는 다르기 때문에, 학습에 오류가 발생했고, 이에 목표 이미지를 원본 이미지와 같은 0 ~ 1로 정규화한다.


           

그림 2본 연구에서 제안하는 ControlNet 학습 방법


                                                                                                                                                                

그림 3은 본 연구에서 제안하는 ControlNet 학습 방법을 통해 도출한 재구축 이미지다. ControlNet을 50 epoch 학습한 결과이고, 학습엔 약 90분이 소요된다. 기존의 ControlNet과 같이 목표 이미지를 -1 ~ 1로 정규화하는 경우, 첫 번째 재구축 이미지보다 더 어둡고, 특징이 모호한 재구축 이미지를 도출하여 정상적인 학습이 불가능하다. 하지만 새로운 학습 방법을 도입한 결과, 학습 횟수가 적어도, 74% 정도의 이상 영역을 탐지할 수 있다. Epoch가 증가함에 따라, 이상 탐지 성능 또한 개선된다.

                                                                                                     


그림 3. 본 연구에서 제안하는 ControlNet 학습 방법을 통해 도출한 재구축 이미지


이상 탐지는 생산 라인의 이상 제품을 판별하는 것이다. 이 문제를 해결하기 위해 여러 생성형 인공지능을 활용한 재구축 기반 이상 탐지 방법론들이 제시되었지만, 학습에 오랜 시간 및 비용이 필요했다. 이에, 학습에 필요한 매개변수가 적어 학습이 빠른 ControlNet을 이상 탐지에 활용하는 방법을 제안했다. 기존의 ControlNet 학습 방법으론 정상적인 재구축 이미지를 만들 수 없기 때문에, 목표 이미지의 정규화 정도를 달리하여 학습을 진행했다. 기존의 방법론들과는 달리, ControlNet을 활용한 모델은, 적은 epoch로도 준수한 성능을 보였다. 이를 통해, 더 빠른 도메인 적용의 가능성을 확인했다.



           


사단법인 한국CDE학회(구 한국CAD/CAM학회)
(06130) 서울시 강남구 테헤란로7길 22, 한국과학기술회관 1관 909호 | Tel: 02-501-6862 | Fax: 02-501-6863 | E-mail: info@cde.or.kr

대표이사: 유병현 / 사업자등록번호: 220-82-60063

Copyright© 2023. Society for Computational Design and Engineering. All rights