쉬엄쉬엄블로그

Python pandas dataframe groupby, groups, isin 본문

코딩

Python pandas dataframe groupby, groups, isin

쉬엄쉬엄블로그 2022. 5. 18. 12:15
728x90

df_grp = df.groupby(['컬럼명1', '컬럼명2'])
df_dic = df_grp.groups

 

df_grp.groups를 하면 df_dic에 key값으로 (컬럼명1, 컬럼명2)가 담기고

value값으로 해당 key값에 해당하는 인덱스값이 list로 담긴다.

 

groupby를 통해 컬럼명1과 컬럼명2로 묶이기 때문에
컬럼명1의 값과 컬럼명2의 값이 서로 같은 row의 인덱스 값이 value값에 list로 담긴다.

 

이를 이용하여 dataframe내에서 특정 column들의 값이 서로 같은 row 인덱스를 추출할 수 있었다.

 

 

 

인덱스가 아닌 특정 컬럼의 값으로 이루어진 데이터를 추출하고 싶다면

df[df['컬럼명1'].isin(특정 컬럼 값을 가진 리스트)]

로 추출할 수 있다.

 

반대로 특정 컬럼의 값이 아닌 데이터를 추출하고 싶다면

df[~df['컬럼명1'].isin(특정 컬럼 값을 가진 리스트)]

로 추출할 수 있다.

'코딩' 카테고리의 다른 글

Python set  (0) 2022.04.14
Python collections  (0) 2022.04.14
Python permutations  (2) 2022.04.11
Python PriorityQueue  (0) 2022.04.09
Python any(), all()  (0) 2022.04.02
Comments