일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- matplotlib
- 코랩
- 파이썬
- 원격저장소
- 플라스크
- 라이브러리
- 깃허브
- 우분투
- 디렉토리
- 운영체제
- 프로그래머스
- 머신러닝
- 가상환경
- 디버깅
- MySQL
- 단축키
- 데이터베이스
- 판다스
- SQL
- 데이터분석
- 엑셀
- OpenCV
- 역할
- 에러
- 기초
- 예제
- vscode
- visual studio code
- 아나콘다
- 리눅스
Archives
- Today
- Total
취미와 밥줄사이
[Data Analysis] 공공데이터 분석 - 가해운전자 연령층별 월별 교통사고 건수 본문
Intro
공공데이터 포털의 가해운전자 연령층별 월별 교통사고 데이터를 바탕으로 데이터 분석을 진행 하였습니다.
EDA
먼저 데이터 분석에 사용할 라이브러리를 불러옵니다. 프로그래밍 언어는 파이썬을 사용하였습니다.
데이터에 분석에 사용할 데이터를 불러옵니다. encoding = 'cp949' 공공데이터 포털에서 가져온 데이터는 대부분 이 파라미터를 사용해주어야 합니다. utf방식이 아니어서 한글깨짐 현상이 발생하는 것 같습니다.
결측치가 있는지 확인해 보았습니다. 결측치가 없기 때문에 컬럼별 EDA 바로 진행하도록 하겠습니다.
상대적으로 50 ~ 60, 65세 이상의 가해자의 사고가 사망자수가 상대적으로 높은 것을 볼 수 있습니다.
다음은 월 컬럼과 사고건 수 사망자 수의 관계를 확인해보도록 하겠습니다.
Conclusion
- 몇 월인지는 사고건수, 사망자수와 중상자 수 등의 다른 피쳐들과 관련이 없다.
- 65세 이상의 연령의 사고에는 다른 연령대에 비해 높은 사망비율을 보인다.
'C' 카테고리의 다른 글
[Data Analysis] seaborn figure 사이즈 조절하는 법 (0) | 2021.05.13 |
---|---|
[Data_Analysis] 공공데이터 분석 - 인천에 어떤 커피 브랜드가 많을까? (0) | 2021.05.13 |
[Colab] 코랩 노트북에서 R언어 사용하기 (0) | 2021.05.10 |
[Kaggle] 캐글 노트북에서 한글 폰트 사용하는 법 (0) | 2021.05.10 |
[Data_Analysis] - Recommendation system _ Collaborative Filtering (0) | 2021.05.02 |