취미와 밥줄사이
[Pandas] 데이터프레임의 value 명칭 변경하는 방법 본문
Introduction
데이터 분석에서는 가장 중요한 과정 중 하나가 데이터 전처리하는 과정입니다. 결측치를 다루고 이상치를 다루며, 입력된 데이터의 일관성을 유지하는 과정을 의미합니다.
판 다스의 데이터 프레임에서 column의 value을 변경하는 방법을 소개하려 합니다.
데이터는 공공데이터 포털의 데이터를 이용하였습니다.
www.data.go.kr/data/15059999/fileData.do
공공데이터 포털
국가에서 보유하고 있는 다양한 데이터를『공공데이터의 제공 및 이용 활성화에 관한 법률(제11956호)』에 따라 개방하여 국민들이 보다 쉽고 용이하게 공유•활용할 수 있도록 공공데이터(Datase
www.data.go.kr
Content
1. loc 메서드 사용해서 변경하기
- 데이터프레임.loc[ 조건, '칼럼명' ] = 새로운 값 이름
데이터프레임의 상호명 칼럼에 있는 값들을 모두 커피쿡으로 동일하게 변경할 것이다.
데이터프레임.loc[ 조건, '컬럼명' ] = 새로운 값이름
loc 메서드를 통해 변경하려는 컬럼의 값에 접근한 이후 새로운 이름을 대입한다.
제대로 변경 되었음을 확인할 수 있다.
2. replace 메서드 이용하기
- Series.replace(['oldvalue1', 'oldvalue2'], ['newvalue1', 'newvalue2'])
다음 빨간색 체크박스 체크된 데이터들을 모두 `빽다방`으로 동일하게 변경할 것입니다.
replace 함수를 통해 변경
시리즈자료형.replace( [ '변경하려는 값'] , ['새로운 값'])
제대로 변경된 걸 확인할 수 있습니다.

Reference
www.delftstack.com/ko/howto/python-pandas/pandas-replace-values-in-column/
Pandas DataFrame에서 열 값 바꾸기
이 튜토리얼에서는 map, loc, replace 메서드를 사용하여 DataFrame의 열 값을 대체하는 다양한 방법을 제공합니다.
www.delftstack.com
pandas.pydata.org/docs/reference/api/pandas.Series.map.html?highlight=map#pandas.Series.map
pandas.Series.map — pandas 1.2.4 documentation
If ‘ignore’, propagate NaN values, without passing them to the mapping correspondence.
pandas.pydata.org
[Python pandas] 결측값, 원래 값을 다른 값으로 교체하기(replacing generic values) : replace()
지난번 포스팅에서는 Python pandas의 - fillna() method를 사용한 결측값 대체 - dropna() method를 사용한 결측값 있는 행, 열 제거 - interpolate() method를 사용한 결측값 보간 하는 방법을 알아보았습..
rfriend.tistory.com
'Python > Pandas' 카테고리의 다른 글
[Pandas] pd.read_csv - 파라미터 사용법 (0) | 2021.05.12 |
---|---|
[Pandas] 데이터프레임 엑셀로 저장하기 (0) | 2021.05.09 |
[Pandas] - isintance() (0) | 2021.04.28 |
[Pandas] - ast.literal_eval() (0) | 2021.04.28 |
[Pandas] - 에러:UnicodeDecodeError (0) | 2021.04.28 |