반응형
Python Pandas의 Dataframe을 특정 열(column)을 기준으로 한 정렬방법
1. 데이터프레임 생성
-. 엑셀로 간단한 테이블을 만든 후 txt 파일('Dataframe.txt')로 저장한다.
-. 아래 캡쳐는 주피터노트북 (Jupyter notebook) 상에서 해당 txt 파일을 열었을 때 보이는 것. 각 항목이 tab으로 구분되어 있다.
-. txt 파일을 Dataframe으로 읽어오기 위한 코드 적용 (TSV, tab-seperated values)라고 부르는데, CSV의 comma 대신 tab으로 항목을 구분함.
import pandas as pd
dataFrame = pd.read_csv('Dataframe.txt', sep='\t')
2. 특정 컬럼 기준으로 정렬 (sort_values)
-. 판다스의 sort_values 기능을 이용한다. dataFrame.sort_values("컬럼명", 정렬기준)
dataFrame = dataFrame.sort_values("Level", ascending=False) #ascending=False: 내림차순, True: 오름차순. default는 True
3. 인덱스 재설정 (reset_index)
-. 인덱스 재설정을 하면 기존 인덱스가 "index"컬럼으로 생성된다.
dataFrame.reset_index()
-. 지저분하니까 reset_index 시 기존 인덱스를 제거 (drop)한다.
dataFrame.reset_index(drop=True)
728x90
반응형
'python' 카테고리의 다른 글
[tensorflow] keras (생활코딩) - tensorflow 1.x / 2.x 차이 (0) | 2021.03.31 |
---|---|
[python] 한경 컨센서스 크롤링 (1) | 2021.03.18 |
[python] 전자공시 (dart) feed 가져오기 (0) | 2021.02.21 |
[Python] 신용카드 혜택 모으기 - 네이버 신용카드 정보 크롤링 (2) (0) | 2021.02.16 |
[Python] Jinja(神社) 진자? 신사? - 파이썬은 날먹 (0) | 2021.02.14 |
최근댓글