의료폐기물 발생량을 예측하고(연 → 월 → 요일 Top-Down 할당), 예측 결과를 바탕으로 수거 차량의 동적 운송 경로 최적화(VRP) 를 수행하는 의사결정 지원 대시보드입니다.
- 기간: 2025/10/29 ~ 2025/12/05
- 팀 구성: 2인
- 담당 업무: 데이터 분석(DA), 대시보드 구성
- 기술: Python, Streamlit
- 배포: https://medical-waste-pathfinder.onrender.com
- GitHub: https://github.com/multiful/Medical_Waste_Pathfinder
- VRP 시나리오 결과(예: 2030년 4월 월요일)
- 총 처리 물량: 946,048 kg
- 투입 차량 수: 67대 내외
- 총 운행 거리: 17,820.69 km
- 총 물류 비용: 56,998,896원
- 의사결정 관점 효과
- 수요 변동(월/요일)에 대응한 차량·경로 최적화
- 고위험/고발생 지역 우선 수거 시나리오 기반 운영 지원
팬데믹/의료이용 변화로 의료폐기물은 급증하지만 처리시설은 제한적이며, 장거리 운송은 비용 비효율과 감염 위험을 증가시킵니다.
본 프로젝트는 예측 기반 수요 산정 → Top-Down 할당 → VRP 최적화를 하나의 파이프라인으로 연결해 운송 의사결정을 지원합니다.
- 지역별 의료폐기물 발생량 예측
- 예측 기반 Top-Down 할당(연 → 월 → 요일)
- 예측 기반 동적 운송 경로 최적화(VRP)
- 시나리오 기반 의사결정 지원 대시보드 구축
분석 단위는 기본적으로 시도-연도 패널 데이터입니다.
- 의료폐기물 발생량(2011~2023, 지역 집계): 환경통계청
- 인구/고령인구비율/병원 수: KOSIS(국가통계포털)
- 코로나 의료폐기물(2020~2022.6): 공공데이터포털
전처리 시 세종/제주는 데이터 일관성 및 표본 문제로 제외했습니다.
- 의료폐기물(타깃) + 병의원 수 + 고령화/인구 + 의료시설 유형을 연도·지역 기준으로 병합
- 결측치는 (1) 시도별 중앙값 → (2) 전체 중앙값 순으로 보정
- 인구/고령인구 대비 의료폐기물 강도, 의료기관당 의료폐기물 등 파생지표 생성
- 시간 추세 반영:
연도_정규화,연도_제곱 - 의료 인프라 종합 지표:
의료인프라_강도
- 타깃 분포 왜도를 고려하여 변환 후보(log/Box-Cox/Yeo-Johnson)를 비교 후 선택
- 다중공선성: VIF 기반 점검(필요 시 필터링)
- 모델 비교: OLS, Poisson GLM, Negative Binomial GLM, LassoCV
- 최종 선택(예시): Poisson GLM
- 위험도 군집화(KMeans) + MDS 시각화
- SEM(구조방정식) 기반 매개효과 분석(인프라 정의에 따른 해석 비교)
- 예측값 기반 수거 수요(
demand_mean,demand_q90) 산출 - 수거 시나리오에 따라 VRP(경로 최적화) 수행
- 대시보드에서 지역/시나리오별 결과 확인
- 치과·요양병원 등 일부 의료시설 지표가 의료폐기물 발생량 증가와 유의한 관계를 보였고, 연도 효과 또한 유의하게 나타났습니다.
- “의료 인프라”를 어떤 지표로 정의하느냐에 따라 해석이 달라져, 정책/운영 관점에서 지표 설계의 중요성을 확인했습니다.
- 예측–할당–VRP를 결합하여, 수요 변동에 대응 가능한 운송 의사결정 프로세스를 대시보드로 구현했습니다.
- (모형) SEM 일부 모델의 적합도 개선을 위한 변수/구조 확장 필요
- (데이터) 공간·시간 단위 고도화(시군구/월·주 단위) 및 추가 변수 반영
- (최적화) VRP 제약조건 현실화(차량 용량, 시간창, 다중 차고지, 위험가중 비용 등)
- (서비스) Streamlit UI/시각화 및 사용자 플로우 개선