1. 프로젝트 개요
본 프로젝트는 Galaxy Zoo와 같은 시민 과학 프로젝트를 소개하고, 일반 대중이 과학 연구에 쉽게 참여할 수 있도록 돕는 것을 목표로 함.
온라인에서 은하를 분류하는 간단한 활동을 통해 전문가가 아니어도 실제 과학 연구에 기여할 수 있음을 알리고, 프로젝트 참여 과정에서 느껴지는 진입 장벽을 낮추고자 함.
2. 사용한 스킬 & 도구
- 프로그래밍 언어: Python
- 딥러닝 프레임워크: pytorch
- 분석 도구: Pandas, NumPy, Matplotlib, Seaborn
3. 문제 해결 프로세스
-
목적 : Galaxy Zoo 프로젝트에 참여하는 벽을 낮추는 것
- 은하 분류라는 간단한 내용의 프로젝트이지만 그 안에서도 decsion tree가 있다. 선택하기 위해서는 천문학 관련 도매인 지식을 공부을 해야 하면 사진을 보고 판단하는 시간이 필요하다.
-
문제 정의 : 시민 프로젝트를 참여하기 위해서는 그에 대한 많은 지식이 필요한다.
-
목표 설정 : 프로젝트의 접근성, 효율성, 결과물의 신뢰성을 향상시키는 것이 목표로 설정/ MVP 제작
-
데이터 수집: Zenodo(범용 개방형 연구 데이터 저장소) / galaxy zoo (시민프로젝트)
-
데이터 전처리:
- Table, image dataset 매칭 및 신뢰성을 기준으로 필터링(flag : feature)


- 분석 및 모델링 : CNN (base), LeNet_5, AlexNet, VGG11, ResNet18
| Model | loss | accuracy |
|---|---|---|
| CNN(Base) | 0.00027 | 0.842901 |
| LeNet_5 | 0.00028 | 0.878513 |
| AlexNet | 0.000340 | 0.877554 |
| VGG11 | 0.422 | 0.789454 |
| ResNet18 | 0.988 | 0.725645 |
4. 결과 및 성과
- 모델이 복잡도가 올라가면 올라갈수록 성능 감소하는 것을 알 수 있다.
- task1 분류 부분은 매우 간단하여 낮은 모델로 사용 가능
- Streammit를 통해서 MVP 형태로 설명함
5. MVP (Streamlit)
6. 관련 링크 및 코드
Github
GitHub - ASOTEA/Capstone_Design_4_1