반도체 FAB 이상감지 → 원인분석 → 조치 제안까지의 완전 자동화 파이프라인을 구축하기 위한 15개 개선 과제입니다.
전체 코드베이스 분석 (Detection, RCA, Core, Data Studio, UI/API)을 기반으로 도출되었습니다.
user_prompts / user_prompt_versions 테이블로 버전 관리 지원.
auto_resolve 플래그 + resolve_count 설정으로, 연속 N회 정상 판정 시 이상을 자동 해소.
야간/주말 불필요한 이상 알림 감소, 엔지니어 피로도 완화.
countermeasures 테이블로 이상 발생 시 구체적 조치를 즉시 제안.
Playbook Studio의 기반 데이터 모델 구축 완료.
문제: 이상 감지 후 "뭘 해야 하는지"가 엔지니어 경험에 의존. 조치 매뉴얼이 정형화되지 않음.
해결: Tool Studio(읽기) + Action Studio(쓰기) + Validation(검증)을 엮는 시나리오 빌더. AI가 진단 후보/조치 후보 중에서 선택하고 구체적 파라미터 값을 채움.
효과: 이상감지 → 자동 진단 → 구체적 조치 제안의 완전한 체인 실현.
문제: Tool Studio는 SELECT 전용. 조치 실행(라우팅 변경, PM 일정 수정 등)을 자동화할 수 없음.
해결: 진단 결과 관리 + 데이터를 변경하는 도구(처방전 + 약). Guard 조건, 사전 시뮬레이션, 승인 절차 포함.
문제: 조치를 실행하기 전에 부작용이 있는지 사전 검증할 방법이 없음.
해결: 디지털 트윈, 시뮬레이터, Knowledge Base 참조를 통해 조치의 안전성을 사전 검증하는 도구.
문제: 컨베이어 과부하 → WIP 정체 → 수율 저하가 3개 별도 이상으로 감지됨. 엔지니어가 수동으로 관계 파악해야 함.
해결: 시간 윈도우 기반 자동 그룹화 → 카테고리 인과 추론 → AI 상관분석. correlations 테이블(이미 존재) 활용.
효과: 이상 목록 노이즈 50% 감소, 근본 원인 도달 시간 단축
문제: RCA Agent가 스텁만 존재. 이상 감지 후 엔지니어가 수동으로 Deep RCA Studio에 들어가야만 분석 가능.
해결: poll_and_analyze() 구현 — pending RCA 자동 분석, 과거 이력/KB 참조, 구체적 조치 항목 생성.
효과: 이상 감지 → 원인분석 수분 이내. 야간/주말 이상도 자동 분석.
문제: Critical 이상도 푸시 알림 없음. 대시보드를 직접 열어야만 이상 인지 가능.
해결: WebSocket 실시간 UI 업데이트 → 외부 알림 채널 (Webhook/이메일) → 에스컬레이션 자동화.
문제: Deep RCA에서 축적된 시나리오와 Knowledge Base가 탐지 규칙 개선에 전혀 반영되지 않음.
해결: 시나리오 패턴 → 규칙 자동 제안, 탐지 에이전트의 KB 참조, False Positive 학습, 조치 효과 추적.
효과: 학습하는 시스템 — 분석할수록 탐지 정확도 향상.
문제: 이상 해소 시 어떤 조치를 취했는지 기록/추적 불가. "지난번에 뭘 했더라?" 찾을 수 없음.
해결: 조치 기록 시스템 → AI 조치 추천 (유사 이상 기반) → 조치 효과 자동 검증 → SOP 자동 생성.
FLOPI v1.7.0 — 통합 반도체 FAB AI 시스템
Generated 2026-03-26 • GitHub