일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 리눅스
- 판다스
- SQL
- MySQL
- 운영체제
- 단축키
- visual studio code
- 기초
- 디렉토리
- 가상환경
- 라이브러리
- 코랩
- 디버깅
- 역할
- 에러
- 프로그래머스
- 파이썬
- 원격저장소
- 데이터분석
- 예제
- OpenCV
- 아나콘다
- 깃허브
- 우분투
- matplotlib
- 데이터베이스
- 엑셀
- 플라스크
- 머신러닝
- vscode
Archives
- Today
- Total
취미와 밥줄사이
[Pandas] 데이터프레임의 value 명칭 변경하는 방법 본문
Introduction
데이터 분석에서는 가장 중요한 과정 중 하나가 데이터 전처리하는 과정입니다. 결측치를 다루고 이상치를 다루며, 입력된 데이터의 일관성을 유지하는 과정을 의미합니다.
판 다스의 데이터 프레임에서 column의 value을 변경하는 방법을 소개하려 합니다.
데이터는 공공데이터 포털의 데이터를 이용하였습니다.
www.data.go.kr/data/15059999/fileData.do
Content
1. loc 메서드 사용해서 변경하기
- 데이터프레임.loc[ 조건, '칼럼명' ] = 새로운 값 이름
데이터프레임의 상호명 칼럼에 있는 값들을 모두 커피쿡으로 동일하게 변경할 것이다.
데이터프레임.loc[ 조건, '컬럼명' ] = 새로운 값이름
loc 메서드를 통해 변경하려는 컬럼의 값에 접근한 이후 새로운 이름을 대입한다.
제대로 변경 되었음을 확인할 수 있다.
2. replace 메서드 이용하기
- Series.replace(['oldvalue1', 'oldvalue2'], ['newvalue1', 'newvalue2'])
다음 빨간색 체크박스 체크된 데이터들을 모두 `빽다방`으로 동일하게 변경할 것입니다.
replace 함수를 통해 변경
시리즈자료형.replace( [ '변경하려는 값'] , ['새로운 값'])
제대로 변경된 걸 확인할 수 있습니다.
Reference
www.delftstack.com/ko/howto/python-pandas/pandas-replace-values-in-column/
pandas.pydata.org/docs/reference/api/pandas.Series.map.html?highlight=map#pandas.Series.map
'Python > Pandas' 카테고리의 다른 글
[Pandas] pd.read_csv - 파라미터 사용법 (0) | 2021.05.12 |
---|---|
[Pandas] 데이터프레임 엑셀로 저장하기 (0) | 2021.05.09 |
[Pandas] - isintance() (0) | 2021.04.28 |
[Pandas] - ast.literal_eval() (0) | 2021.04.28 |
[Pandas] - 에러:UnicodeDecodeError (0) | 2021.04.28 |