데이터 분석 필수템! 파이썬 Pandas 치트 시트 완벽 가이드 🐼
안녕하세요! 데이터 과학과 분석에 입문하신 여러분을 위한 최고의 친구, Pandas 라이브러리를 오늘 완벽하게 정리해드립니다.
✅ Pandas란?
Pandas는 Python에서 데이터를 다루기 위한 강력한 도구로, 표 형식의 데이터를 처리하는 데 최적화되어 있습니다. 핵심은 DataFrame이라는 자료구조입니다.
📌 DataFrame 만들기
아래는 가장 기본적인 방법으로 DataFrame을 생성하는 예시입니다.
import pandas as pd
# 딕셔너리로 생성
df = pd.DataFrame({
'이름': ['철수', '영희', '민수'],
'점수': [90, 85, 88]
})
print(df)
💡 각 key는 열(column), value는 값(list)입니다.
🎯 데이터 선택하기
🔹 열 선택
# 단일 열 선택
df['이름']
🔹 행 선택 (loc, iloc)
# 인덱스 라벨 기반
df.loc[0]
# 정수 위치 기반
df.iloc[1]
🔍 조건 필터링
# 점수가 85점 이상인 사람만
df[df['점수'] >= 85]
🔁 데이터 정렬
# 점수를 기준으로 정렬
df.sort_values(by='점수', ascending=False)
📊 그룹화와 집계
# 과목별 평균 구하기
df.groupby('과목')['점수'].mean()
🛠️ 누락값 처리
import numpy as np
df = pd.DataFrame({
'이름': ['철수', '영희', np.nan],
'점수': [90, np.nan, 85]
})
# NaN 제거
df.dropna()
# NaN 채우기
df.fillna('미정')
💾 파일로 저장하기
# CSV 저장
df.to_csv('my_data.csv', index=False)
# Excel 저장
df.to_excel('my_data.xlsx', index=False)
📈 간단한 시각화
import matplotlib.pyplot as plt
# 히스토그램
df['점수'].plot.hist()
plt.show()
🏁 마무리하며
Pandas는 단순한 데이터 정리 도구를 넘어, 강력한 분석 능력을 갖춘 필수 라이브러리입니다. 이 치트 시트를 바탕으로 Pandas의 기본부터 실전 활용까지 마스터해보세요!
'Python' 카테고리의 다른 글
| Numpy_Cheat_ (0) | 2025.05.25 |
|---|---|
| Matplotlib_Cheat_ (0) | 2025.05.25 |
| Python.데이터 수집 (0) | 2025.05.25 |
| Python.DB 활용 (0) | 2025.05.25 |
| Python.GUI (1) | 2025.05.25 |