취미와 밥줄사이

[Pandas] 데이터프레임의 value 명칭 변경하는 방법 본문

Python/Pandas

[Pandas] 데이터프레임의 value 명칭 변경하는 방법

취미와 밥줄사이 2021. 5. 13. 00:51

 

 

 

 

 

 

 

 

 

 

Introduction


데이터 분석에서는 가장 중요한 과정 중 하나가 데이터 전처리하는 과정입니다. 결측치를 다루고 이상치를 다루며, 입력된 데이터의 일관성을 유지하는 과정을 의미합니다.

 

판 다스의 데이터 프레임에서 column의 value을 변경하는 방법을 소개하려 합니다.

 

 

데이터는 공공데이터 포털의 데이터를 이용하였습니다.

 

www.data.go.kr/data/15059999/fileData.do

 

공공데이터 포털

국가에서 보유하고 있는 다양한 데이터를『공공데이터의 제공 및 이용 활성화에 관한 법률(제11956호)』에 따라 개방하여 국민들이 보다 쉽고 용이하게 공유•활용할 수 있도록 공공데이터(Datase

www.data.go.kr

 

 

 

 

Content


1.   loc   메서드 사용해서 변경하기


  • 데이터프레임.loc[ 조건, '칼럼명' ] = 새로운 값 이름


     
데이터프레임의 상호명 칼럼에 있는 값들을 모두 커피쿡으로 동일하게 변경할 것이다. 







데이터프레임.loc[ 조건, '컬럼명' ] = 새로운 값이름

loc 메서드를 통해 변경하려는 컬럼의 값에 접근한 이후 새로운 이름을 대입한다.







제대로 변경 되었음을 확인할 수 있다.

 

 

 

 

2. replace 메서드 이용하기


  • Series.replace(['oldvalue1', 'oldvalue2'],      ['newvalue1', 'newvalue2'])

다음 빨간색 체크박스 체크된 데이터들을 모두 `빽다방`으로 동일하게 변경할 것입니다.

 



replace 함수를 통해 변경
시리즈자료형.replace( [ '변경하려는 값'] , ['새로운 값'])








제대로 변경된 걸 확인할 수 있습니다.



 

 

 

 

Reference


www.delftstack.com/ko/howto/python-pandas/pandas-replace-values-in-column/

 

Pandas DataFrame에서 열 값 바꾸기

이 튜토리얼에서는 map, loc, replace 메서드를 사용하여 DataFrame의 열 값을 대체하는 다양한 방법을 제공합니다.

www.delftstack.com

 

 

 

pandas.pydata.org/docs/reference/api/pandas.Series.map.html?highlight=map#pandas.Series.map

 

pandas.Series.map — pandas 1.2.4 documentation

If ‘ignore’, propagate NaN values, without passing them to the mapping correspondence.

pandas.pydata.org

 

 

rfriend.tistory.com/265

 

[Python pandas] 결측값, 원래 값을 다른 값으로 교체하기(replacing generic values) : replace()

지난번 포스팅에서는 Python pandas의  - fillna() method를 사용한 결측값 대체  - dropna() method를 사용한 결측값 있는 행, 열 제거  - interpolate() method를 사용한 결측값 보간 하는 방법을 알아보았습..

rfriend.tistory.com