본문 바로가기
파이썬/파이썬 궁금증 회고

파이썬 pandas - 데이터프레임에서 결측된 값, 결측된 행 찾기

by davi_kr 2024. 7. 23.

목차

    반응형

    데이터프레임을 만들고서 결측된 행(비어있는 행)을 찾고 싶다면?

    1. df.info()

    info()는 해당 데이터프레임의 정보를 보여줍니다. 여기서 인덱스 범위가 4로 나오는데, non-null이 2라면 나머지 2는 null이라고 판단할 수 있습니다.

     

    2. df.isnull()

    isnull()을 사용하면 데이터프레임 구조를 그대로 보여주면서 null인지 여부를 True, False로 표시해줍니다.

     

    3. df.isnull().sum()

    isnull().sum()을 하게 되면 요약해서 딱 어디에 몇개 데이터가 null값인지 알 수 있습니다.

     

    4. df.loc[df.isnull().any(axis=1)]

    위에서 다룬 방법들은 있는지 없는지를 직관적으로 판단하기 좋습니다.

    다만, 어떻게 된건지를 보려면 데이터를 직접 들여다볼 필요도 있습니다.

    그럴 때는 df_test.loc[df.isnull().any(axis=1)]를 활용해봅니다.

    이렇게 하면 데이터프레임에서 null값이 있는 행들을 모두 반환해줍니다.

    수량이 적으면 크게 문제 없어보이긴 하지만.. 숨어있는 경우나 예상 못한 경우도 있을 수 있기 때문에, 한번씩은 이렇게 보는 것도 좋은 것 같습니다.

     

    5. df.loc[df['test'].isnull()]

    null이 있는 특정 열을 알고 있는 경우라면, 직접 해당 열을 지칭해도 됩니다.

    정확히 지칭이 되는 경우엔 그냥 isnull()만 사용해도 아래처럼 동일한 결과를 얻을 수 있습니다.

     

     

    반응형

    댓글