목차
반응형
데이터프레임을 만들고서 결측된 행(비어있는 행)을 찾고 싶다면?
1. df.info()
info()는 해당 데이터프레임의 정보를 보여줍니다. 여기서 인덱스 범위가 4로 나오는데, non-null이 2라면 나머지 2는 null이라고 판단할 수 있습니다.
2. df.isnull()
isnull()을 사용하면 데이터프레임 구조를 그대로 보여주면서 null인지 여부를 True, False로 표시해줍니다.
3. df.isnull().sum()
isnull().sum()을 하게 되면 요약해서 딱 어디에 몇개 데이터가 null값인지 알 수 있습니다.
4. df.loc[df.isnull().any(axis=1)]
위에서 다룬 방법들은 있는지 없는지를 직관적으로 판단하기 좋습니다.
다만, 어떻게 된건지를 보려면 데이터를 직접 들여다볼 필요도 있습니다.
그럴 때는 df_test.loc[df.isnull().any(axis=1)]를 활용해봅니다.
이렇게 하면 데이터프레임에서 null값이 있는 행들을 모두 반환해줍니다.
수량이 적으면 크게 문제 없어보이긴 하지만.. 숨어있는 경우나 예상 못한 경우도 있을 수 있기 때문에, 한번씩은 이렇게 보는 것도 좋은 것 같습니다.
5. df.loc[df['test'].isnull()]
null이 있는 특정 열을 알고 있는 경우라면, 직접 해당 열을 지칭해도 됩니다.
정확히 지칭이 되는 경우엔 그냥 isnull()만 사용해도 아래처럼 동일한 결과를 얻을 수 있습니다.
반응형
'파이썬 > 파이썬 궁금증 회고' 카테고리의 다른 글
pandas dataframe 열 사이에 열 추가하기(열 순서 바꾸기) (1) | 2024.07.24 |
---|---|
파이썬 concat - 특정 경로 내 CSV 파일들을 하나의 DF로 합치기(병합하기) (0) | 2024.07.22 |
아나콘다 가상환경에서 파이썬 라이브러리 설치 안될 때 (0) | 2023.10.17 |
.py와 .ipynb에서 같은 파일 사용하기(같은 파일 경로 사용하기), 다른 컴퓨터에서 같은 파일 사용하기 (0) | 2023.05.12 |
파이썬 SettingWithCopyWarning과 FutureWarning 해결하기: Pandas DataFrame에서 .copy() 사용 및 numeric_only 지정 (0) | 2023.04.18 |
댓글