일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 라이브러리
- MySQL
- 깃허브
- OpenCV
- 우분투
- 운영체제
- 머신러닝
- 가상환경
- 디버깅
- 에러
- 판다스
- vscode
- 예제
- 데이터베이스
- 데이터분석
- visual studio code
- 원격저장소
- 단축키
- 기초
- 아나콘다
- matplotlib
- 플라스크
- 역할
- 파이썬
- 엑셀
- 리눅스
- 프로그래머스
- 코랩
- SQL
- 디렉토리
Archives
- Today
- Total
취미와 밥줄사이
[Visualization] - Bar chart / 막대차트 (feat. 로그 스케일 사용이유) 본문
Python/Visualization
[Visualization] - Bar chart / 막대차트 (feat. 로그 스케일 사용이유)
취미와 밥줄사이 2021. 5. 8. 16:43이 게시물은 캐글 노트북을 통해 스스르 공부한 내용을 복습하기 위한 작성한 글 입니다. 더 자세한 내용을 확인하고 싶은 분들은 하단의 링크를 참조해주세요!
Bar Plot / 막대차트
- 막대 그래프 (또는 막대 차트)는 가장 일반적인 플롯 유형 중 하나입니다.
- 숫자 변수와 범주 형 변수 간의 관계를 보여줍니다.
- 예를 들어 막대 차트를 사용하여 여러 개인의 키를 표시 할 수 있습니다.
- 막대 차트는 종종 매우 다른 히스토그램과 혼동됩니다. (입력으로 숫자 변수 만 있으며 분포를 보여줍니다.)
- 일반적인 실수는 막대 그래프를 사용하여 각 그룹의 평균 값을 나타내는 것입니다.
- 그룹당 여러 값이있는 경우 평균 만 표시하면 정보의 일부가 가장됩니다.
- 이 경우 박스플롯 이나 바이올린 플롯을 고려해보십시오.
- 최소한 그룹당 관측치 수와 각 그룹의 신뢰 구간을 표시해야합니다.
코드 및 예제
먼저 필요한 데이터셋을 불러옵니다. 이 데이터셋은 캐글의 데이터셋을 사용하였습니다.
이 데이터셋이 필요하신 분들은 하단의 첫 번째 링크를 참조해주세요
불러온 데이터셋은 성별을 기준으로 연봉의 평균을 집계한 데이터 프레임을 저장 하였습니다.
그래프는 plotly 라이브러리를 사용하여 만듭니다.
Parameter
data_frame = : 데이터 프레임을 인자로 받습니다.
x = : x축 값으로 받을 데이터프레임의 컬럼이름
y = : y축의 값으로 받을 데이터프레임의 컬럼이름
color = : 색상으로 구분할 컬럼의 이름
log_y = True : y축이 데카르트 좌표로 y스케일이 됩니다.
template = : 사용할 템플릿 이름
※ 로그 스케일
1. 정수 스케일 대신 로그 스케일을 사용하는 이유는 두 가지가 있다.
1) 시각적인 장점
- 차이가 급격하게 벌어진 과거 데이터 혹은 비교 데이터와의 차이를 시각적으로 파악하기 불편할 때 사용
2) 절대치가 아닌 변화율
- 절대치가 아닌 변화율을 그래프로 그림으로써 변화율을 확인할 수 있다.
- 상승 / 하락의 비율적인 측면을 살편볼 수 있다.
- 정수 스케일과는 다른 인사이트를 얻을 수 있다.
log의 역할은 큰 수를 같은 비율의 작은 수로 바꿔주는 것이다.
log는 큰 수를 작게 만들고 복잡한 계산을 간편하게 하기위해 사용한다. 로그를 취하는 순간 그 수는 치수가 되어버리니, 값이 작아진다.
로그를 취하는 이유는 큰 수를 작게 만들고, 복잡한 계산을 쉽게 만들어 데이터 분석 시 의미있는 결과를 도출하기 위한 것이다.
데이터 간의 편차가 큰 경우에 로그를 취하면 의미있는 결과를 얻을 가능성이 높아진다.
Reference
www.kaggle.com/vanshjatana/a-simple-tutorial-to-data-visualization/notebook
plotly.com/python-api-reference/generated/plotly.express.bar
'Python > Visualization' 카테고리의 다른 글
[Visualization] seaborn 라이브러리의 Facets (0) | 2021.05.09 |
---|---|
[Visualization] seaborn 라이브러리 scatterplot 사용법 정리 (0) | 2021.05.09 |
[Visualization] - Parallel Plots( 평행 플롯) 사용법 및 예제 (0) | 2021.05.07 |
[Visualization] - missingno 라이브러리 사용법 (0) | 2021.05.07 |
[Visualization] - Video Game Sales (0) | 2021.05.06 |