Projects/AI 아이트래킹 모델 프로젝트

[도메인 공부 ] 8. 홍채 세그맨테이션 경량 CNN 모델

ha2yong 2025. 9. 15. 17:15

추천 경량 모델 (3클래스: sclera/iris/pupil)

  1. RITnet (OpenEDS 경쟁작, 초경량)
  • 구조: 저용량 인코더 + 얕은 디코더(UNet 계열)
  • 장점: 눈 전용으로 설계되어 동공/홍채 경계에 강함, 파라미터 매우 작음
  • 쓰임: 실시간(수백 FPS/GPU 가능 보고), 근접 눈 크롭에 특히 적합
  • 단점: 일반 장면보다 눈 전용 데이터에 강하게 최적화됨
  1. MobileNetV3-Small + Lite-UNet 디코더 (Depthwise)
  • 구조: MobileNetV3-Small(α=0.5~1.0) 백본 + 가벼운 up-proj 디코더
  • 장점: 속도/정확도 균형 아주 좋음, 파라미터 1~2M대까지 슬림화 가능
  • 쓰임: Edge/GPU/CPU 모두 쉬움, ONNX/TensorRT 변환 쉽고 윈도우 배포 용이
  • 팁: width_mult=0.5, 입력 256×256만으로도 동공/홍채는 충분히 잡힘
  1. BiSeNetV2 (Slim 설정)
  • 구조: Detail Branch + Semantic Branch 병렬 (경량 양자화 친화)
  • 장점: 고속 + 경계 품질(세부/의미 분리) 좋아서 홍채 테두리 잘 보존
  • 쓰임: 실시간 카메라 파이프라인, RTX 3050 Ti에서 매우 빠름
  • 팁: stem 채널 축소(0.5×), aux loss 사용하면 안정 학습
  1. Fast-SCNN
  • 구조: Learning to Downsample + Global Feature Extractor + Feature Fusion
  • 장점: 모바일/임베디드용으로 최적화, 파라미터 ~1.1M급
  • 쓰임: CPU 런타임 고려 시 선택지, 프레임 지연이 적음
  • 단점: 아주 미세 경계(동공의 톱니형 에지)에선 UNet류 대비 미세도 약간 떨어질 수 있음
  1. ENet / ESPNet (초소형)
  • 구조: 경량 분류기반 블록으로 이루어진 초기 세그 계열
  • 장점: 파라미터 극소(수십만), 낮은 사양 CPU에서도 동작
  • 단점: 최신 경량들 대비 표현력이 부족할 수 있어 후처리(타원 RANSAC) 의존 ↑

한 줄 요약

  • 최고 밸런스: MobileNetV3-Small + Lite-UNet
  • 초고속·눈 전용: RITnet
  • 경계 품질 + 실시간: BiSeNetV2(slim)
  • 저사양/CPU: Fast-SCNN 또는 ENet/ESPNet