취미와 밥줄사이

[Data Analysis] 공공데이터 분석 - 가해운전자 연령층별 월별 교통사고 건수 본문

C

[Data Analysis] 공공데이터 분석 - 가해운전자 연령층별 월별 교통사고 건수

취미와 밥줄사이 2021. 5. 11. 15:39

Intro


공공데이터 포털의 가해운전자 연령층별 월별 교통사고 데이터를 바탕으로 데이터 분석을 진행 하였습니다.

 

 

EDA


먼저 데이터 분석에 사용할 라이브러리를 불러옵니다. 프로그래밍 언어는 파이썬을 사용하였습니다.



데이터에 분석에 사용할 데이터를 불러옵니다. encoding = 'cp949'   공공데이터 포털에서 가져온 데이터는 대부분 이 파라미터를 사용해주어야 합니다. utf방식이 아니어서 한글깨짐 현상이 발생하는 것 같습니다.



 


결측치가 있는지 확인해 보았습니다. 결측치가 없기 때문에 컬럼별 EDA 바로 진행하도록 하겠습니다.





 


상대적으로 50 ~ 60, 65세 이상의 가해자의 사고가 사망자수가 상대적으로 높은 것을 볼 수 있습니다.












다음은 월 컬럼과 사고건 수 사망자 수의 관계를 확인해보도록 하겠습니다.


 









 

 

 

Conclusion


  • 몇 월인지는 사고건수, 사망자수와 중상자 수 등의 다른 피쳐들과 관련이 없다.
  • 65세 이상의 연령의 사고에는 다른 연령대에 비해 높은 사망비율을 보인다.