반응형

0. 들어가기

-. 카드 문자를 자동으로 정리해서 혜택을 뽑아먹는 프로그램을 만들다 보니, 카드사마다, 그리고 심지어 같은 카드사에 대해서도 가맹점 명이 다른 경우가 있다. 그래서 그걸 하나로 모으는 alias 테이블을 만들었다.

-. 그렇게 만들어진 alias 테이블에 기입된 여러가지 별칭들을 하나의 대표 단어로 변환하는 작업을 한다.

1. alias table 형식

-. alias 테이블은 아래와 같은 형태의 값을 가진다.

-. '쥐에스칼텍스'라는 키워드가 들어오면 (alias0, 2) 번에 있다는 위치 정보를 받아서, 그것의 대표 단어인 'GS칼텍스'를 가리키게 하는 것이 이번 코드의 목표

 

2. 그래서 코드는?

1) 가장 처음에 할 것은, 해당 키워드가 alias table에 있는지를 확인하는 것이다.

-. dataframe에는 isin()이라는 아주 유용한 함수가 있다. 이 함수를 이용하면 해당 주어진 dataframe 중 해당 키워드와 일치하는 좌표만 True 표기를 해준다.

2) 컬럼별로 정리한다.

-. dataframe에 any() 함수를 이용하면 'True' 값이 하나라도 있는 컬럼이 출력된다. 참고로 all() 함수는 모든 값이 True여야 한다. 참고

3) col / row 뽑아내기

-. 요롷게

 

4) 최종값

-. 이렇게

 

728x90
반응형
  • 네이버 블러그 공유하기
  • 네이버 밴드에 공유하기
  • 페이스북 공유하기
  • 카카오스토리 공유하기