본문 바로가기
반응형

파이썬/파이썬 스터디6

파이썬 pandas(판다스) groupby - 시간에 따라 묶기 결과물년월, 결제수단(payment)에 따라 총 금액을 볼 수 있고 해당 년월에 특정 자치구에서 나온 값들도 같이 볼 수 있습니다.데이터 둘러보기groupby를 어떻게 활용할 수 있는지, 자세히 다뤄보기 위해 데이터를 먼저 둘러봅니다.이용할 데이터는 택시 관련 정보입니다.import pandas as pdimport seaborn as snsimport numpy as npdf = sns.load_dataset('taxis')df.info() df.head(5) 위 데이터는 상차, 하차 시간, 승객 수, 거리, 운임비, 팁, 톨비, 총 비용, 색상, 결제수단, 상차 지역, 하차 지역, 상차 자치구, 하차 자치구 정보로 구성되어 있습니다. df.isnull().sum()결측치는 수량이 얼마나 있는지 확인해.. 2024. 8. 4.
파이썬으로 엑셀 작업하기 - openpyxl 데이터 분석에서 엑셀은 강력한 도구로 자리 잡아 왔습니다. 파이썬에서 엑셀 파일을 읽고 쓰는 데 사용할 수 있는 여러 패키지가 있지만, 그 중에서도 openpyxl은 그 기능과 사용법의 쉬움으로 인해 널리 사용되고 있습니다.openpyxl이란?openpyxl은 파이썬에서 엑셀 2010 이상의 xlsx/xlsm/xltx/xltm 파일을 읽고 쓰는 데 사용되는 라이브러리입니다. 이 라이브러리를 사용하면 파이썬 코드를 통해 엑셀 문서를 생성하고, 데이터를 입력하고, 서식을 지정하고, 그림이나 차트를 추가하는 등의 작업을 할 수 있습니다.openpyxl로 할 수 있는 일openpyxl은 엑셀 파일을 작업하기 위한 광범위한 기능을 제공합니다. 여기에는 다음과 같은 작업들이 포함됩니다:엑셀 문서 읽기 및 쓰기셀에 .. 2023. 5. 12.
반복문으로 df 내의 모든 행의 값 텍스트로 적어주기 - iterrows Python 데이터 분석에서는 Pandas의 DataFrame을 이용하여 데이터를 다루는 경우가 많습니다. 여기서는 DataFrame의 iterrows() 메소드를 활용하여 데이터를 순회하고, 각 행의 데이터를 텍스트로 변환하는 방법을 알아보겠습니다. 기본 셋팅import pandas as pdfrom datetime import datetime, timedelta# 현재 시간부터 시작해 하루씩 증가하는 날짜 데이터를 생성합니다.date_series = pd.date_range(start=datetime.now(), periods=5)# 임의의 데이터를 생성합니다.names = ['Alice', 'Bob', 'Charlie', 'Dave', 'Eve']ages = [25, 31, 35, 19, 45]# .. 2023. 5. 12.
맥 아나콘다 설치 및 가상환경 설정 가이드: 무료 버전 사용 방법 및 터미널, 네이게이터 활용법 [아나콘다 설치하기]무료 버전 설치를 위해선 아래 링크로 들어가 다운로드를 받으면 됩니다.https://www.anaconda.com/products/distribution Anaconda | Anaconda DistributionAnaconda's open-source Distribution is the easiest way to perform Python/R data science and machine learning on a single machine.www.anaconda.com이전 버전을 설치하고 싶다면 아카이빙된 링크에서 다운로드 받을 수 있습니다.https://repo.anaconda.com/archive/ Index of /Anaconda-1.6.1-Linux-x86.sh 247.1M 20.. 2023. 4. 16.
반응형