Python

Pandas_Cheat_

calla1013 2025. 5. 25. 16:59
데이터 분석 필수템! 파이썬 Pandas 치트 시트 완벽 가이드 🐼

 

 

데이터 분석 필수템! 파이썬 Pandas 치트 시트 완벽 가이드 🐼

안녕하세요! 데이터 과학과 분석에 입문하신 여러분을 위한 최고의 친구, Pandas 라이브러리를 오늘 완벽하게 정리해드립니다.

✅ Pandas란?

Pandas는 Python에서 데이터를 다루기 위한 강력한 도구로, 표 형식의 데이터를 처리하는 데 최적화되어 있습니다. 핵심은 DataFrame이라는 자료구조입니다.

📌 DataFrame 만들기

아래는 가장 기본적인 방법으로 DataFrame을 생성하는 예시입니다.

import pandas as pd

# 딕셔너리로 생성
df = pd.DataFrame({
    '이름': ['철수', '영희', '민수'],
    '점수': [90, 85, 88]
})
print(df)
💡 각 key는 열(column), value는 값(list)입니다.

🎯 데이터 선택하기

🔹 열 선택

# 단일 열 선택
df['이름']

🔹 행 선택 (loc, iloc)

# 인덱스 라벨 기반
df.loc[0]

# 정수 위치 기반
df.iloc[1]

🔍 조건 필터링

# 점수가 85점 이상인 사람만
df[df['점수'] >= 85]

🔁 데이터 정렬

# 점수를 기준으로 정렬
df.sort_values(by='점수', ascending=False)

📊 그룹화와 집계

# 과목별 평균 구하기
df.groupby('과목')['점수'].mean()

🛠️ 누락값 처리

import numpy as np

df = pd.DataFrame({
    '이름': ['철수', '영희', np.nan],
    '점수': [90, np.nan, 85]
})

# NaN 제거
df.dropna()

# NaN 채우기
df.fillna('미정')

💾 파일로 저장하기

# CSV 저장
df.to_csv('my_data.csv', index=False)

# Excel 저장
df.to_excel('my_data.xlsx', index=False)

📈 간단한 시각화

import matplotlib.pyplot as plt

# 히스토그램
df['점수'].plot.hist()
plt.show()

🏁 마무리하며

Pandas는 단순한 데이터 정리 도구를 넘어, 강력한 분석 능력을 갖춘 필수 라이브러리입니다. 이 치트 시트를 바탕으로 Pandas의 기본부터 실전 활용까지 마스터해보세요!

'Python' 카테고리의 다른 글

Numpy_Cheat_  (0) 2025.05.25
Matplotlib_Cheat_  (0) 2025.05.25
Python.데이터 수집  (0) 2025.05.25
Python.DB 활용  (0) 2025.05.25
Python.GUI  (1) 2025.05.25