본문 바로가기
[파이썬]/[파이썬]엑셀

[파이썬_엑셀]9. Pandas의 union1d와 reindex

by abooda 2022. 7. 4.
반응형

[파이썬_엑셀][9. Pandas의 union1d와 reindex-블로그 요약]

Pandas에서 특히 두개의 표를 비교위해서 필요한 union1d와 reindex에 대해서 설명하겠습니다.

간단히,

union1d: 두개의 index를 전부 포함하는 항목 만들기

reindex: 열과 행의 Index를 재배치 하기

[파이썬_엑셀]9. Pandas의 union1d와 reindex

이번에는 Pandas를 통해서 두개의 표를 비교하기 위해서 꼭 필요함 몇가지 함수를 설명하겠습니다.

이번함수는 다음시간에 진행 할, 두개의 표를 비교하기에 기초적으로 필요한 부분입니다.

 

[정의] - Pandas로 행의 Index를 합치고, 합친 행의 Index로 값 배열하기

1. 두개의 표를 불러온다.

2. 두개의 표에서 행의 Index를 불러오고 두개의 값을 합친다.

[예를들면]

A의 표의 행의 Index: 사과, 포도, 배

B의 표의 행의 Index: 바나나, 사과, 배추

--> 두개의 표의 행의 Index를 합친 후의 Index(합집합 개념): 사과, 포도, 배, 바나나, 배추 

3. 합친 새로운 Index를 기존에 표의 Index로 재 배열한다.

 

내용은 굉장히 주관적이고 전문적으로 공부를 하신분들이 보기에 굉장이 부족한점이 있으니,

참조 부탁드립니다.

 

1. 엑셀에서의 값 불러오기(Pandas 사용)

우선 엑셀 파일에서 값을 불러오고 표시형식을 확인하는 방법에 대해서 진행 하겠습니다.

 

진행방식은 Pandas로 데이터를 불러와서 편집하고, Openpyxl로 데이터를 입력하는 방식으로 진행하겠습니다.

 

[불러올 엑셀의 내용]

1.  파일명: compare.xlsx

2.  시트명: Before, After

3.  엑셀 세부 내용 및 불러올 내용 정보

Before 시트
After 시트

[파이썬 실행화면]

1. 불러올 파일을 지정하고 새롭게 저장할 파일의 위치 지정

2. 엑셀 파일 불러오기(Openpxyl)

3. 엑셀 파일 불러오기(Pandas)

 

2. Pandas로 행의 Index를 합치고 재 배열하기

Pandas로 두개의 표에서 행의 Index를 불러와서 두개의 표를 같이 표시 할 수 있는 Index를 만들겠습니다.

 

1. 행의 Index를 합치기; union1d를 사용함.

sheet1.columns: Date, 파는곳, 제품명, 금액, 수량, 단위, 부가세

sheet2.columns: Date, 파는곳, 제품명, 금액, 수량, 단위, 세금

 

2. 합친 행의 Index를 각각의 표에 적용하기

합친후의 Before 시트

3. 신규 엑셀시트를 만들고 새롭게 작성한 표를 이동 시키기

[행을 합친 뒤의 결과값 - before 시트]

[행을 합친 뒤의 결과값 - after 시트]

 

*** Your memories make your destiny ***

반응형

댓글