일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- SQL
- 디렉토리
- matplotlib
- 판다스
- 데이터베이스
- 역할
- 단축키
- MySQL
- 머신러닝
- 프로그래머스
- 라이브러리
- 플라스크
- 운영체제
- 우분투
- visual studio code
- vscode
- 파이썬
- 코랩
- 예제
- 아나콘다
- OpenCV
- 에러
- 원격저장소
- 엑셀
- 깃허브
- 데이터분석
- 디버깅
- 가상환경
- 기초
- 리눅스
Archives
- Today
- Total
취미와 밥줄사이
[Pandas] - DataFrame : merge 사용법과 코드 본문
1. merge
- Pandas에서 두 개의 데이터프레임의 결합하는 방식은 대표적으로 3가지가 있다. merge, join, concat 이렇게
- 3개의 메소드가 존재한다. merge와 join, concat 상황에 따라 다르게 사용된다.
- 오늘은 merge 메서드의 사용법에 대해서 알아보고자 한다. Pandas의 merge 메서드는 MySQL의 JOIN 키워드와 기능이 매우 유사하다. 기준열(공통속성)을 가진 열을 기준으로 데이터프레임을 병합하는 기능을 가진다.
- merge 메서드의 how파라미터를 어떻게 사용하는지에 따라 결합방식이 달라지고 , on = 파라미터를 통해서 기준열을 설정할 수 있다.
2. 데이터프레임 생성
# 라이브러리 가져오기 import pandas as pd # 데이터프레임 생성 book_titles =pd.DataFrame(data = { 'book_id':[1, 2, 3, 4, 5], 'title': ['별헤는 밤', '자유론','복학왕', '자료구조', '텐서플로우'] }) book_reviews =pd.DataFrame(data = { 'book_id':[1, 2, 3, 4, 5], 'review': ['재미', '슬픔','기쁨', '행복', '절망'] })
2. how : 결합방식 설정
2-1. how: left
- left로 설정한 데이터프레임을 기준으로 병합
pd.merge(book_title, book_review, how='left')
2-2. how: right
- right로 설정한 데이터프레임을 기준으로 병합
pd.merge(book_title, book_review, how='right')
2-3. how: inner
- 교집합
pd.merge(book_title, book_review, how='inner')
2-4. how: outer
- 모든 index가 누락되지 않고 데이터프레임으로 형성
pd.merge(book_title, book_review, how='outer')
Reference
https://pandas.pydata.org/about/citing.html
'Python > Pandas' 카테고리의 다른 글
[Pandas] pd.read_csv - 파라미터 사용법 (0) | 2021.05.12 |
---|---|
[Pandas] 데이터프레임 엑셀로 저장하기 (0) | 2021.05.09 |
[Pandas] - isintance() (0) | 2021.04.28 |
[Pandas] - ast.literal_eval() (0) | 2021.04.28 |
[Pandas] - 에러:UnicodeDecodeError (0) | 2021.04.28 |