지난호 보기
2025 하계학술대회 수상자 리뷰

SigLIP 기반 프롬프트 엔지니어링 및 앙상블 기법을 활용한 철강 결함 분류 모델

글 : 양유진, 최수인, 최슬찬, 신승준 (한양대학교) / choi929@hanyang.ac.kr

조회수109

연구 배경

철강 제조 현장에서 결함을 빠르고 정확하게 분류하는 일은 생산성·품질 관리에 직결되는 중요한 과제이다. 그러나 기존 CNN 기반의 supervised learning 방식은 높은 성능을 위해 대규모 라벨링 데이터셋을 요구한다. 실제 산업 현장에서는 라벨링 비용과 시간 소모가 크고, 도메인마다 데이터 분포가 달라질 경우 모델을 재학습해야 하는 어려움이 존재한다. 이러한 문제를 해결하기 위해 라벨링 데이터 없이도 새로운 데이터셋에서 분류가 가능한 Zero-Shot 학습이 주목받고 있다.


연구 목적

본 연구의 목적은 사전 학습된 Vision-Language Model(VLM)인 SigLIP을 활용해 라벨링 데이터 없이 철강 표면 결함을 분류하는 파이프라인을 구축하는 것이다. 이를 통해 라벨링 비용과 모델 재학습 부담을 줄이고 제조 현장에서도 빠르게 적용 가능한 결함 분류 솔루션을 개발하고자 하였다. 또한 프롬프트 엔지니어링, 빔서치, 앙상블 기법을 활용해 Zero-Shot 분류의 성능을 극대화하고 안정성을 확보하는 것을 목표로 하였다. 



그림 1. SigLIP 기반 프롬프트 분류 파이프라인

그림 2. SigLIP 기반 프롬프트 분류 파이프라인



그림 3. 프롬프트 조합 탐색 및 하드보팅 기반 최종 예측 구조


1) 사용 데이터
본 연구에서는 NEU Surface Defect Database (NEU-DET)을 사용하였다. 해당 데이터셋은 총 6개의 결함 클래스로 구성되어 있으며, 클래스당 300장의 이미지를 포함해 전체 1,800장의 균형 잡힌 다중 클래스 데이터셋이다. 모든 이미지는 크기 200x200 픽셀의 그레이스케일 강재 표면 결함 이미지로, 분류 모델의 학습 및 평가에 적합한 특성을 가진다.
 
2) 모델 선택
OpenAI CLIP 계열의 최신 VLM인 SigLIP을 사용하였다. SigLIP은 구글이 수십억 개의 웹 이미지-텍스트 쌍으로 학습시킨 사전학습 모델로 이미지와 텍스트를 같은 임베딩 공간에 매핑해 유사도를 계산할 수 있다. 

3) 프롬프트 엔지니어링(Prompt Engineering): 총 5종 프롬프트 파일 생성
결함 클래스(Patches, Crazing, Pitted_Surface, Rolled-In Scale, Scratches, Inclusion)에 대한 단순 키워드뿐 아니라 문맥이 있는 문장을 포함한 다양한 프롬프트를 설계하였다. 
→ 사전적 표현, LLM 생성, 전문가 기술문, 국제 표준서(ISO 7788), 혼합 프롬프트 

4) 빔서치(Beam Search): 로그 확률로 상위 k개 후보를 유지, 확장하는 탐색 기법
수백 개의 프롬프트 후보를 대상으로 빔서치를 적용하여 상위 성능을 보이는 프롬프트 조합만 남기고 탐색을 이어갔다. 이를 통해 계산량을 줄이면서 최적의 조합을 효율적으로 찾았다.
→ 각 프롬프트 조합에 대해 top-k 추출

5) 앙상블(Hard Voting): 클래스별 best prompt 1개씩 Hard Voting으로 선택
여러 프롬프트의 예측 결과를 단순 평균하는 Soft Voting 대신, Hard Voting 방식으로 다수결 투표를 적용하여 프롬프트 표현 차이에 따른 score 편차 문제를 보완하고 최종 결과의 안정성을 높였다.
→ 선택된 prompt 조합으로 최종 철강 제품의 결함 classification 수행 

연구 결과
NEU-DET 데이터셋에서 테스트셋 평균 정확도 89.17%, 평균 신뢰도 79.12%를 달성하였다. 특히 paches, scratches, crazing 클래스에서는 95% 이상의 정확도를 보였으며, 별도의 재학습이나 fine-tuning 없이 사전학습 모델과 프롬프트 설계만으로 높은 성능을 달성했다는 점에서 의미가 크다. 

그림 4. 모델 평가 지표

결론 및 의의
본 연구는 라벨링 데이터 없이도 철강 표면 결함을 분류할 수 있는 Zero-Shot 분류 파이프라인의 가능성을 입증하였다. 프롬프트 엔지니어링, 빔서치 탐색, 하드보팅 앙상블을 통해 단일 프롬프트에 의존하는 문제를 해결하고 안정성을 높였다. 이를 통해 제조 현장에서 모델 재학습 없이도 프롬프트 수정만으로 신속하게 적용할 수 있는 현장 친화적 AI 솔루션의 가능성을 제시하였다. 

향후 계획
향후 연구에서는 연산량 감소를 위한 프롬프트 조합 최적화 및 탐색 구조 효율적으로 개선하고 Grad-CAM 기반 히트맵 시각화 등 설명 가능성(XAI)을 추가해 엔지니어가 결함 유형뿐만 아니라 결함 위치도 직관적으로 확인할 수 있도록 확장할 예정이다.


사단법인 한국CDE학회(구 한국CAD/CAM학회)
(06130) 서울시 강남구 테헤란로7길 22, 한국과학기술회관 1관 909호 | Tel: 02-501-6862 | Fax: 02-501-6863 | E-mail: info@cde.or.kr

대표이사: 정현 / 사업자등록번호: 220-82-60063

Copyright© 2023. Society for Computational Design and Engineering. All rights