[공모전] 광진구 빅데이터 공모전 후기

    BOAZ 2차 프로젝트로 참여했던 2023년 광진구 빅데이터 분석 프로젝트!

    부문은 '시각화'였지만 당시 진행하고 있는 공모전이 광진구 공모전 뿐이라 분석 공모전을 진행했다.

     

    그래서 우리는 수상을 목표로... (목표는 크게!)

    광진구 관련 데이터 분석이 중심, 시각화는 부가적인 느낌으로 공모전을 진행했다.

    우리 팀은 총 2개의 모델링과 2개의 시각화를 진행했다. 

     

    1. 문제 상황

    몇 년 간, 광진구의 주차장 부족과 불법주차로 인한 교통난이 심각하다는 기사 및 통계치를 참고하여, 도시교통 데이터를 활용해 주차 공간이 부족한 곳을 찾아 주차장을 설립하고, 혼잡한 곳을 찾아 주차단속 강화함이 필요하다는 생각이 들었다. 

     

    2. 주차공간 부족 문제 분석

    2-1. 주차장 입지선정을 위한 주차장 면수 예측 모델

    가장 주차장이 필요한 광진구의 행정동이 어디일까?

    - 주차부족 문제를 해결하기 위해 공영주차장 설치 입지 선정을 위한 주차 면수 예측 모델을 만들고, 행정동별 주차장 면수 기대예측값과 실제 주차장 면수를 비교해 주차장 면수가 부족한 행정동을 파악했다. 

     

    모델링 목표

    - 주차장 면수 예측 모델을 구현하고, 이 모델에 광진구 데이터를 적용하여 주차장 면수의 기대예측값을 산출해 실제 광진구의 주차장 면수와 비교

    - 주차장 면수에 영향을 미치는 요인을 파악하고, 설명가능한 다중선형회귀모형 선택모델 결과 해석을 통해 정책 제안에 인사이트 제공가능

    ---> Train set으로 서울시 행정동 데이터를 학습시키고, Test set으로 광진구 행정동 데이터를 사용해 주차면수를 예측했다. 

     

    학습된 모델을 바탕으로, 광진구 행정동 15개의 주차면수를 예측했고, 가장 주차면수가 부족한 행정동은 자양4동, 중곡4동, 구의2동 순이었다. 이를 바탕으로 각 행정동의 특성에 맞는 정책을 제시했고, 공영 주차장 실시간 정보 고도화를 위한 시각화까지 진행했다. 

    2-2. 분석 결과 활용 및 정책 제안

    첫 번째 제시한 시각화는, 주차공간을 필요로하는 사용자에게 조건에 따른 주차장 정보제공 서비스를 제공하고, 더 나아가 거주자 전용 주차칸이 비어있는 시간대 및 공간 데이터를 추가활용가능하다면 그 시간대에 주차 공간이 필요한 다른 사람에게 주차 공간 제공하여 주차 문제 해결 가능한 서비스를 제시했다. 

    두 번째로 제시한 시각화는, 광진구 행정동별 주차장 현황을 통합적으로 제시하는 대시보드 분석으로 주차관련 정책 수립의 근거로 활용가능한 대시보드를 제작했다. (*주차 확보율 = 주차장 면수/차량등록 대수)

    3. 불법 주차 문제 분석

    3-1. 효율적인 불법주차단속을 위한 시간대별 유동인구 예측 모델

    일주일 후, 내일 또는 몇 시간 후에 광진구는 얼마나 혼잡할까?
    - "빅데이터를 활용하여 교통수요예측의 신뢰성을 높이기 위해서 유동인구 빅데이터를 활용하면 공간적 정밀도를 높여 구체적 접근이 가능하다.” 국토연구원, ‘지역 간 교통수요 예측의 신뢰성 제고를 위한 빅데이터 활용방안 연구’

    - 주차 부족, 불법주차에 영향을 미치는 요인은 그날 어떤 곳에 사람이 많은 지 예측하는 것과 관련이 있음
    - 시간대별 유동인구 수를 예측해 불법주차로 인한 주차 문제를 해결하고자 함

    모델링 목표
    - 실시간 시간대별 예측을 통해 빠르게 예측하고 대비 가능한 모델
    - 2023년 광진구 행정동의 4164개의 데이터로 학습한 광진구에 특화된 모델 구축
    - 실시간 대용량 데이터 처리에 유리한 XGBoost 모델 선정
    - 부분의존도과 변수중요도를 통해 모델링 결과 설명이 가능

    유동인구 예측 모델 분석 결과, 광진구 전체로 봤을 때의 광진구 전체로 봤을때 저녁시간때, 18시에 가장 유동인구가 많았으나, 행정동별 유동인구를 예측하면 다른 결과를 보였다. 

    3-2. 분석 결과 활용 및 정책 제안

    단속 현황, CCTV 설치 현황 정보를 통합적으로 제시하는 대시보드 분석으로 불법주정차 관리 우선지역을 도출 및 정책 활용가능하게 했다. 

    좌측 지도를 통해 불법 주정차 단속 현황을 확인하고 단속 횟수가 많을 수록 진한 붉은 색을 띄도록 시각화 했다. 또한, 우측 지도를 통해 불법 주정차 단속 CCTV 설치위치 확인할 수 있고, 불법 주정차가 많이 발생하는 구간을 확인하고 집중단속을 하거나, 주차단속 사각지대를 파악해 CCTV 추가 설치 할 수 있도록 대시보드를 제시했다. 

    4 . 의의 및 한계 

    의의

    - 주차장 면수와 유동인구를 활용해 주차 수요를 예측하고 데이터 분석 결과에 기반한 정책 제안함
    - 설명가능한 모델로 주차문제에 영향을 미치는 요인을 파악함
    - 장기적인 관점에서 주차공간을 확보할 수 있는 방안을 제시함과 동시에, 시간대별 예측모델로 빠른 대처가 가능한 방안 제시함
    - 정책 제안 과정에서 시각화 대시보드를 직접 구현해 현실적인 정책을 제시함

    한계

    - 혼잡도를 예측하기 위해 유동인구를 고려했으나 추가적으로 교통량, 행사여부를 고려한다면 더 정확한 분석 가능
    - 데이터의 한계로 대시보드에 공유주차 관련 내용을 반영하지 못함
    - 주차면수가 가장 부족한 상위 3개의 동에 집중한 정책을 제시함. 본질적인 주차문제 해결을 위해 도시 전반적인 변화에 대한 정책 제안이 필요


    비록 수상은 하지 못했지만...! 첫 공모전에서 많은 걸 얻어가는 것 같아서 너무나도 뜻깊은 프로젝트였다. 데이터 전처리부터 모델링, 그리고 시각화까지 우리가 하려던 방향성과 최대한 알맞게 녹여낸 것 같아 뿌듯했다.

    다음 공모전 출전 때는 조금 더 잘 해보는 걸로 ... ! 

    댓글