이 프로젝트는 서울시의 대중교통 데이터를 분석하여 버스 노선 추가가 필요한 지역을 선정하는 것을 목표로 합니다. 이를 통해 서울시의 대중교통 수요를 효율적으로 관리하고 시민들에게 더 나은 대중교통 서비스를 제공하는 데 기여하고자 합니다.
-
(1) Data
- 버스 승하차 및 운행 노선 데이터
- 구별 유동인구 데이터
- 구별 주민 등록 데이터
- 구별 업종 등록 정보
-
(2).Data Preprocessing
- 단변량 및 이변량 분석을 통한 유의미한 변수 선정 및 불필요한 변수 제거
- 신규 정류장 입지 결정을 위한 가설 수립
-
(3) Data Analysis
- 데이터 간의 관계 분석 및 특정 변수의 중요도 도출(HeatMap)
- 도출된 중요도를 바탕으로 최적의 신규 정류장 위치 선정
- 가설 검증
-
(4) Report
- 분석 결과 및 최적의 신규 정류장 위치 제시
- 데이터 기반 의사결정 과정 설명
-
(5) Review
- 데이터 분석을 통해 새로운 인사이트를 도출하고 실제 의사결정에 활용하는 역량을 강화
- 단순한 데이터 분석을 넘어 데이터 기반의 문제 해결 능력을 향상
- 최적의 정류장 위치를 선정하는것에 대해 추가적인 연구가 필요
웨어러블 센서 데이터를 분석하여 사용자의 자세를 예측하는 AI 모델을 개발합니다. 정적 자세와 동적 자세를 구분하여 각각의 딥러닝 모델을 설계하고 최종적으로 모델을 병합하여 정확도를 높입니다.
-
(1) Data
- 6개의 행동 데이터 -> 2개의 그룹(정적행동 3개, 동적행동 3개)
- 웨어러블 센서 데이터 (가속도, 자이로스코프 등)
-
(2) Data Preprocessing
- 중요한 상위 feature 선정(Random Forest 이용)
- 선정된 feature 대상 EDA 진행
- MinMaxScaling 진행
- 정적 자세와 동적 자세 데이터 분리
- 정적 자세 중 Laying와 SITTING, STANDING 자세 데이터 분리
-
(3) Data Analysis
- 정적 자세 예측을 위한 딥러닝 모델 설계
- 유사한 데이터 패턴을 보이는 자세 분류를 위한 세분화된 분류 기준 적용
- 과적합 방지를 위한 다양한 규제 기법 적용
- 정적 자세 모델 일부 파트 모델링 수행
- 동적 자세 예측을 위한 딥러닝 모델 설계
- 정적 자세 모델과 동적 자세 모델 병합
- 정적 자세 예측을 위한 딥러닝 모델 설계
-
(4) Report
- 전체 자세 예측 모델의 97% 정확도 달성
-
(5) Review
- Dropout, L2 규제 기법을 적용하여 모델의 과적합 방지 및 성능 향상
- 유사한 데이터 패턴을 보이는 자세 분류 문제 해결 능력 향상
-
(1) Data
- 국토교통부 데이터 (아파트 단지 정보, 주차 관련 데이터 등)
- SGIS 데이터 (외부 데이터, 지역별 특성 데이터)
-
(2) Data Preprocessing
- 데이터 정제 및 결측치 처리(Merge, Concat, Pivot, Group By)
- SGIS 데이터 병합 및 변수 추가
- 전처리 된 데이터 EDA 진행
- MinMaxScaling 진행
-
(3) Data Analysis
- KNN, 회귀, DecisionTree, RandomForest, LGB, XGB 모델 사용
- GridSearch를 사용하여 최적의 모델 선택
- SGIS 데이터 병합 전후 모델 성능 변화 분석
-
(4) Report
- 신규 아파트 단지 적정 주차공간 예측 결과 제시
- SGIS 데이터 활용 결과 및 데이터 기반 도시 계획 가능성 탐구 결과 보고
-
(5) Review
- SGIS 데이터가 모델 성능에 유의미한 영향을 미치지 못한 원인 분석 및 개선 방안 모색
- 다양한 외부 데이터 및 모델링 기법을 활용하여 예측 정확도 향상 가능
- 다양한 변수 실험을 통해 데이터 기반 도시 계획 및 인프라 개선 가능성 탐구
