- 프로젝트 기본 정보
- 프로젝트 개요: 팀별로 데이터 분석 목표를 설정하고, 수집·정제·모델링·결과 해석까지 전 과정을 수행
- 분석 범위: 분류/회귀 기반 예측 모델 외에도 군집 분석(Clustering), 연관 분석, 차원 축소 등 다양한 기법을 활용해 인사이트 도출을 권장
- 모델 제한: 강의에서 다룬 전통적 기계학습 알고리즘을 활용하며, 심층신경망/딥러닝 알고리즘은 사용 금지
- 팀워크: 협업을 통해 데이터 분석 기획부터 구현, 해석까지의 역량을 종합적으로 강화하는 것을 목표로 함
- 단계별 발표 안내 (총 3회)
발표 방식 및 세부 시간 제한 등은 추후 이캠퍼스를 통해 공지 예정임
- 1차: Kick-off Presentation
- 데이터 이해 필수: 분석 기법보다 데이터 자체에 대한 정확한 이해가 최우선임
- 데이터 구조 및 활용 가능성을 충분히 파악하지 못할 경우 낮은 평가를 받을 수 있음
- 프로젝트 목표 정의, 데이터 설명, 전처리 계획, 활용 모델 개요 및 예상 결과를 포함
- 2차: Interim Presentation
- 실제 수집 및 전처리 결과, 데이터 기본 통계, 시각화 분석
- 분석 대상 데이터의 특성 재확인, 적용 모델 및 실험 설계 개요, 향후 일정 공유
- 3차: Final Presentation
- 전체 개요, 최종 전처리 및 분석 결과, 모델 간 성능 비교 분석
- 도출된 인사이트, 연구 한계 및 추후 연구 방향 제시
- 별도의 최종보고서는 없으며 발표자료로 갈음함
- 데이터 및 분석 방법론 가이드
- 데이터 수집: Kaggle, 공공데이터포털, AI-hub, 빅카인즈, 특허 데이터, NTIS, Google Dataset 등 공신력 있는 플랫폼의 오픈 데이터를 적극 활용
- 단순하거나 데이터량이 부족한 데이터셋은 지양하고, 다양한 데이터 연계를 권장
- 분석 모델 예시:
- 회귀/분류: 선형/로지스틱 회귀, 의사결정나무, 랜덤 포레스트, SVM, KNN 등
- 군집/기타: K-means, DBSCAN, PCA, LDA, 연관 규칙 탐사 등
- 성능 평가: 모델 특성에 맞는 지표(Accuracy, F1-score, RMSE, 실루엣 계수 등)를 활용해 비교 및 해석을 수행
- 운영 및 평가 기준
- 발표자 규칙: 각 발표는 팀 내 1인이 맡되, Kick-off, 중간, 최종 발표는 각각 다른 사람이 발표해야 함 (발표는 팀원당 최대 1회 권장)
- 조교 면담 (TA Office Hours): 팀별 총 2회 가능하며, 질문을 미리 준비해 효율적으로 진행할 것
- 자료 제출 및 유의사항
- 파일 형식: 모든 발표 자료는 애니메이션이 없는 PDF 형식으로만 제출 가능함
- 발표자료 첫페이지 구성:
- 프로젝트 코드: 팀의 색깔이나 팀프로젝트 컨셉을 반영한 고유 명사구 기재
- 팀원 명단: 팀장의 성명을 반드시 가장 상단에 배치할 것 (팀장의 역할을 중요하게 평가함)