반응형
0. 들어가기
-. 카드 문자를 자동으로 정리해서 혜택을 뽑아먹는 프로그램을 만들다 보니, 카드사마다, 그리고 심지어 같은 카드사에 대해서도 가맹점 명이 다른 경우가 있다. 그래서 그걸 하나로 모으는 alias 테이블을 만들었다.
-. 그렇게 만들어진 alias 테이블에 기입된 여러가지 별칭들을 하나의 대표 단어로 변환하는 작업을 한다.
1. alias table 형식
-. alias 테이블은 아래와 같은 형태의 값을 가진다.
-. '쥐에스칼텍스'라는 키워드가 들어오면 (alias0, 2) 번에 있다는 위치 정보를 받아서, 그것의 대표 단어인 'GS칼텍스'를 가리키게 하는 것이 이번 코드의 목표
2. 그래서 코드는?
1) 가장 처음에 할 것은, 해당 키워드가 alias table에 있는지를 확인하는 것이다.
-. dataframe에는 isin()이라는 아주 유용한 함수가 있다. 이 함수를 이용하면 해당 주어진 dataframe 중 해당 키워드와 일치하는 좌표만 True 표기를 해준다.
2) 컬럼별로 정리한다.
-. dataframe에 any() 함수를 이용하면 'True' 값이 하나라도 있는 컬럼이 출력된다. 참고로 all() 함수는 모든 값이 True여야 한다. 참고
3) col / row 뽑아내기
-. 요롷게
4) 최종값
-. 이렇게
728x90
반응형
'python' 카테고리의 다른 글
[KAKAO + FLASK] 카카오 챗봇 만들기 (1) - 시작 (0) | 2021.12.03 |
---|---|
[KAKAO + FLASK] 이미지 업로드용 카카오챗봇 + 이미지 뷰 페이지 (0) | 2021.12.03 |
[python] 파이썬에서 google spreadsheet (엑셀시트) 사용하기 -2 (0) | 2021.05.09 |
[python] 파이썬에서 google spreadsheet (엑셀시트) 사용하기 (0) | 2021.04.04 |
[tensorflow] keras (생활코딩) - tensorflow 1.x / 2.x 차이 (0) | 2021.03.31 |
최근댓글