스마트 공장의 제어 시스템 구축을 위한 생산품 품질 분류
Architecture Over view

🔥 스마트 공장의 제어 시스템 구축을 위한 생산품 품질 분류 🔥
1. 프로젝트 개요
펜데믹을 맞이한 최근 몇 년간 제조 운영과 공급망의 디지털 혁신은 관련 산업 분야에서 최우선 과제로 급부상했습니다. 스마트 공장은 공정 데이터에서 인사이트를 발굴하고 해석하여 추세를 예측하고, 스마트 제조 워크플로와 자동화된 프로세스를 구현합니다. 품질 편차를 최소화해 생산 경제성과 안정성을 확보할 수 있도록 생산된 제품이 적정 기준을 충족하는지 판단하고 분류하는 AI 모델을 개발해 주세요.
2. 사용한 스킬 & 도구
- 프로그래밍 언어: Python
- 분석 도구: Pandas, NumPy, Matplotlib, Seaborn, jupyter
- 머신러닝: Scikit-learn, LGBM, XGB, Catboost
- 기타: Optuna, adam (하이퍼파라미터 최적화)
3. 데이터 EDA
1) LINE별 Y_Class / PRODUCT_CODE별 Y_CLASS / Y_Quality 분포




2) Feature 상관 관계 분석

- Y_class : 선형적으로 설명하기 거의 불가능함
- 모델: tree, boosting, NN 추천
- 큰 블록 구조: 비슷한 피쳐그룹 많음
3) 데이터 전처리
- 다양한 결측치 보간법을 사용하였으나 Feature 별로 결측치 있지 다르고 결측치 값이 너무 많아 기존 데이터를 사용한 결측 방법 무의미함
- train, test 모두 결측치 대체 X ⇒ 0 처리
4) 모델링
- LightGBM, XGBoost, Catboost
| public | private | |
|---|---|---|
| NaN ⇒ 0 처리 | 0.6541 | - |
| select feature | 0.68412 | - |
| final model | 0.70444 | 0.68024 |
4. 결과

5. 회고록

도메인
- 제조 공정 공정관리도
- 공정 관리도에서 품질 값의 상한선(UCL)과 하한선(LCL) 사이에 위치할 경우 양품으로 판단함

Stacking
- 이상치를 탐지 하는데 좋은 방법이라고 추천해주심
6. 관련 링크 및 코드
https://dacon.io/competitions/official/236080/overview/description