일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 우분투
- matplotlib
- 기초
- 아나콘다
- MySQL
- 가상환경
- 데이터베이스
- 라이브러리
- 리눅스
- 머신러닝
- 엑셀
- 플라스크
- 프로그래머스
- 판다스
- SQL
- 역할
- visual studio code
- 파이썬
- 코랩
- 디버깅
- 원격저장소
- OpenCV
- 깃허브
- 데이터분석
- 예제
- 운영체제
- 디렉토리
- 단축키
- 에러
- vscode
- Today
- Total
목록데이터분석 (3)
취미와 밥줄사이
INTRODUCTION 파이썬은 데이터 분석을 하는데 유용한 라이브러리가 많습니다. 대표적인 라이브러리로는 pandas 라이브러리가 있습니다. 판다스를 통해 데이터 전처리 그리고 데이터 분석을 한 데이터를 엑셀로 공유하고 싶은 상황이 발생할 때가 있습니다. 이럴 떄는 간단하게 데이터프레임을 엑셀 혹은 csv파일로 저장하여 공유할 수가 있습니다. pd.to_excel() # 엑셀 파일로 저장 pd.to_csv() # csv 파일로 저장하기 Parameter - pd.to_excel() excel_writer : 저장할 파일경로 sheet_name : 시트 이름 설정 index : 인덱스 포함여부 설정 header : header 포함여부 na_rep 결측치 표현방법 설정 CONTENT - 예제 캐글 노트북..
Introduction 데이터를 분석하거나 혹은 EDA를 하는 경우에 데이터 전처리 작업을 해야한다. 이상치를 발견하고 처리하거나 결측치를 확인하고 처리하는 작업이 반드시 필요하다. 이상치나 결측치는 특히 머신러닝이나 예측, 분류를 하는 경우 문제를 일으키고 학습이 잘 되지 않는다. 파이썬 판다스를 통해서 데이터를 처리하는 경우에 pd.info() , pd.isna().sum() 함수를 통해서 확인을 할 수도 있지만 시각화 라이브러리를 통해 더 간단하게 결측치를 확인할 수 있다. 이러한 활동을 도와주는 것이 missingno 라이브러리 입니다. 다음은 사용법이 입니다. Content 1. 라이브러리 불러오기 필요한 라이브러리를 임포트한다. 여기 missingno 라이브러리를 통해서 결측치를 시각화 할 것..