본문 바로가기
반응형

파이썬21

파이썬 pandas(판다스) groupby - 시간에 따라 묶기 결과물년월, 결제수단(payment)에 따라 총 금액을 볼 수 있고 해당 년월에 특정 자치구에서 나온 값들도 같이 볼 수 있습니다.데이터 둘러보기groupby를 어떻게 활용할 수 있는지, 자세히 다뤄보기 위해 데이터를 먼저 둘러봅니다.이용할 데이터는 택시 관련 정보입니다.import pandas as pdimport seaborn as snsimport numpy as npdf = sns.load_dataset('taxis')df.info() df.head(5) 위 데이터는 상차, 하차 시간, 승객 수, 거리, 운임비, 팁, 톨비, 총 비용, 색상, 결제수단, 상차 지역, 하차 지역, 상차 자치구, 하차 자치구 정보로 구성되어 있습니다. df.isnull().sum()결측치는 수량이 얼마나 있는지 확인해.. 2024. 8. 4.
pandas dataframe 열 사이에 열 추가하기(열 순서 바꾸기) 데이터프레임에 데이터를 다 넣고 보니.. 순서가 꼬일 때가 간혹 있습니다.이럴 때, 순서를 바꿔야겠다 생각할 수도 있으나, 지우고 새로 추가해야겠다라고 생각할 수도 있습니다.한두개 열만 조정해도 된다면 insert를 사용하면 편합니다. df.insert(열의 위치(loc), 열 이름(label), 열에 들어갈 값들(values))import pandas as pd# 예시 데이터프레임 생성data = { 'date': ['2024-07-22', '2024-07-23', '2024-07-24'], 'value': [10, 20, 30]}df_daily = pd.DataFrame(data)# 'date' 열을 datetime 형식으로 변환df_daily['date'] = pd.to_datetime(.. 2024. 7. 24.
파이썬 concat - 특정 경로 내 CSV 파일들을 하나의 DF로 합치기(병합하기) 특정 경로 내 CSV 파일들을 하나의 DF로 합치기(병합하기)같은 형태를 가진 csv가 여러개로 나뉘어 있을 때, 하나로 작업하기 위해 필요한 코드입니다. import pandas as pdimport os# CSV 파일이 저장된 디렉터리 경로directory = "/Users/david/Documents/project/final_data_set"# CSV 파일을 하나의 df로 병합def merge_csv_files(directory): # CSV 인 것들만 리스트로 만듦 csv_files = [f for f in os.listdir(directory) if f.endswith('.csv')] dfs = [] # csv_files라는 리스트를 돌면서 csv 파일을 df로 변환.. 2024. 7. 22.
아나콘다 가상환경에서 파이썬 라이브러리 설치 안될 때 아나콘다 가상 환경에서 pyautogui를 사용해보려 conda install -c "conda-forge/label/cf202003" pyautogui를 이용해서 설치를 해봤는데 에러가 났습니다. 에러 코드더보기Collecting package metadata (current_repodata.json): doneSolving environment: failed with initial frozen solve. Retrying with flexible solve.Collecting package metadata (repodata.json): doneSolving environment: failed with initial frozen solve. Retrying with flexible solve.Packa.. 2023. 10. 17.
반응형