파이썬 설치 가이드 (맥OS & 윈도우)
목차
- 서론 – 파이썬 설치가 중요한 이유
- 파이썬 다운로드 및 설치
2.1 파이썬 공식 웹사이트 접근
2.2 운영체제별 설치 (맥OS / 윈도우)
2.3 설치 시 주의할 점 - 인증서 설치 (맥OS 전용)
- 설치 확인 및 간단한 실행
- 개발 환경 설정 (IDLE, VS Code, PyCharm 등)
- 환경 변수 설정 (윈도우)
- 별칭(Alias) 설정 (맥OS)
- 실행 절차 (따라하기용 체크리스트)
- 참고 사이트 및 참고 문헌
1. 서론 – 파이썬 설치가 중요한 이유
- 파이썬(Python): 데이터 분석, 인공지능, 웹 개발 등 다양한 분야에 활용되는 범용 프로그래밍 언어.
- 설치 과정에서 환경 변수 설정, 인증서 설치 등을 빼먹으면 실행 오류 발생.
2. 파이썬 다운로드 및 설치
2.1 공식 웹사이트 접근
- python.org 접속
- 최신 버전 확인 (현재: Python 3.13.2)
2.2 운영체제별 설치
- 맥OS: Download Python 3.13.2 클릭 → .pkg 파일 설치
- 윈도우: Download for Windows 클릭 → .exe 실행
2.3 설치 시 주의할 점
- 윈도우: “Add Python to PATH(환경변수 추가)” 반드시 체크 ✔
- 맥OS: 설치 후 Install Certificates(인증서 설치) 실행
3. 인증서 설치 (맥OS 전용)
- 경로: Applications → Python 3.x → Install Certificates.command 실행
- 필요 이유: HTTPS 기반 패키지 설치 시 인증 오류 방지
4. 설치 확인 및 간단한 실행
- IDLE 실행 (기본 제공 에디터)
- 예시:
-
print("Hello, World!") 1 + 3 4 * 5 5 % 3
- 출력 확인 → 정상 작동 시 설치 성공
5. 개발 환경 설정
6. 환경 변수 설정 (윈도우)
- 설치 시 “PATH 추가” 체크 필수
- 확인 방법:
- cmd 실행 후 → python --version 입력
- 버전 출력 시 정상
7. 별칭(Alias) 설정 (맥OS)
- 기본 명령어 python 대신 python3만 인식되는 경우 많음
- 해결: .zshrc 또는 .bashrc에 별칭 추가
-
alias python="python3"
- 저장 후 source ~/.zshrc 실행 → python 입력해도 실행 가능
8. 실행 절차 (따라하기 체크리스트 ✅)
⬜ python.org 접속
⬜ 운영체제 맞는 버전 다운로드
⬜ (윈도우) 설치 시 Add Python to PATH 체크
⬜ (맥OS) 설치 후 Install Certificates.command 실행
⬜ 터미널/명령 프롬프트에서 python --version 또는 python3 --version 확인
⬜ IDLE 또는 VS Code에서 print("Hello, World!") 실행
⬜ (선택) 별칭(Alias) 추가로 python3 대신 python 사용 가능
9. 참고 사이트 및 참고 문헌
- 파이썬 공식 사이트: https://www.python.org/downloads/
- VS Code 다운로드: https://code.visualstudio.com/
- JetBrains PyCharm: https://www.jetbrains.com/pycharm/
📌 주석
- 환경 변수(PATH): 프로그램 실행 시 운영체제가 명령어를 찾는 경로 목록.
- 인증서(Certificate): 보안 연결(HTTPS)에서 서버의 신뢰성을 증명하는 전자 문서.
- Alias(별칭): 긴 명령어나 특정 명령어를 짧게 바꿔 실행할 수 있는 사용자 정의 단축어.
파이썬 설치 완벽 가이드
이 문서는 왕초보도 쉽게 따라 할 수 있도록 파이썬 설치 절차를 단계별로 설명합니다. 운영 체제에 맞는 올바른 파일을 다운로드하는 방법부터, 설치 후 필수적으로 확인해야 할 설정들까지 모두 포함하고 있습니다.
목차
- 파이썬 설치 파일 다운로드
- 설치 절차 (윈도우/맥OS)
- 2.1. 윈도우 사용자 필수 확인 사항
- 2.2. 맥OS 사용자 필수 확인 사항
- 설치 확인 및 IDLE[^1] 사용
- 터미널 환경 설정 (맥OS 사용자)
- 주석 및 참고문헌
1. 파이썬 설치 파일 다운로드
가장 먼저 파이썬 공식 웹사이트인 python.org로 이동합니다.
- 웹사이트 상단 메뉴에서 Downloads를 클릭합니다.
- 운영 체제(OS)에 맞는 최신 버전의 파이썬이 자동으로 표시됩니다.
- 윈도우 사용자는 일반적으로 64비트 버전을 설치하는 것이 좋습니다. 32비트 운영 체제를 사용하는 경우는 거의 없으므로 64비트 버전을 다운로드하세요.
- Download Python 3.x.x 버튼을 클릭하여 설치 파일을 내려받습니다.
2. 설치 절차 (윈도우/맥OS)
다운로드한 설치 파일을 실행하여 설치를 시작합니다.
2.1. 윈도우 사용자 필수 확인 사항
- 설치 시작 화면에서 반드시 Add python.exe to PATH[^2] 항목에 체크해야 합니다. 이 항목에 체크하지 않으면 명령 프롬프트(CMD)에서 python 명령어를 인식하지 못해 별도의 환경 변수 설정이 필요해집니다.
- 체크 후 Install Now를 클릭하여 설치를 진행합니다.
2.2. 맥OS 사용자 필수 확인 사항
- 설치 파일을 실행하고 Continue를 눌러 절차를 따릅니다.
- 설치가 완료되면 Python 3.x.x was successfully installed 메시지가 나타납니다.
- 이 화면에서 그냥 넘어가시지 마시고, **Install Certificates**를 더블클릭하여 반드시 실행해야 합니다. 이 과정을 건너뛰면 pip[^3]로 패키지를 설치하거나 HTTPS 통신을 할 때 인증서 오류가 발생할 수 있습니다.
3. 설치 확인 및 IDLE 사용
설치가 성공적으로 완료되었는지 확인하고, 내장된 IDLE를 사용해 봅니다.
- 터미널(Terminal) 또는 **명령 프롬프트(CMD)**를 엽니다.
- 다음 명령어를 입력하여 파이썬이 올바르게 설치되었는지 확인합니다.
- 윈도우: python --version 또는 py --version
- 맥OS: python3 --version
- 다음 명령어를 입력하여 파이썬의 IDLE 환경으로 진입할 수 있습니다.
- 윈도우: python 또는 py
- 맥OS: python3
- IDLE에 진입했다면, 간단한 코드를 작성해 정상 작동을 확인합니다.
- print("Hello, World!") # 결과: Hello, World! 1 + 3 # 결과: 4
4. 터미널 환경 설정 (맥OS 사용자)
맥OS 사용자의 경우, python3 명령어 대신 python만 입력해도 실행되도록 별칭(alias)[^4]을 설정할 수 있습니다.
- 터미널에서 다음 명령어를 입력합니다.
- alias python=python3
- 이 설정은 현재 터미널 창에서만 유효하므로, 터미널을 열 때마다 자동으로 적용되도록 하려면 .zshrc 또는 .bash_profile 파일에 위 명령어를 추가해야 합니다.
- 새 터미널 창을 열고 python이라고 입력하여 정상적으로 실행되는지 확인합니다.
5. 주석 및 참고문헌
주석
참고문헌
- YouTube. (752) [1/3] (왕초보를 위한) 맥에서 혹은 윈도우에서 파이썬 설치할 때 이거? 빼 먹으면 안 된다?! - 파이썬 설치 실수 없이 끝내기. (2024년 5월 20일). https://www.youtube.com/watch?v=TRMQ4HOOfc4
[^1]: IDLE: Python 설치 시 기본으로 포함되는 통합 개발 환경(Integrated Development and Learning Environment). 간단한 코드를 실행하고 테스트할 수 있는 셸(Shell) 환경을 제공합니다.
[^2]: PATH: 컴퓨터 운영 체제가 실행 가능한 프로그램이나 파일을 찾기 위해 검색하는 경로들의 목록을 의미합니다. PATH에 등록하면 터미널에서 프로그램 이름만으로 실행할 수 있습니다.
[^3]: pip: 파이썬으로 작성된 패키지 소프트웨어를 설치하고 관리하는 데 사용되는 패키지 관리 시스템입니다.
[^4]: alias(별칭): 특정 명령어에 다른 이름을 부여하여 더 편리하게 사용할 수 있도록 하는 기능입니다.
Gemini CLI와 VSCode를 활용한 데이터 분석 완전 가이드
목차
1. 개요
Gemini CLI란?
**Gemini CLI(Command Line Interface)**는 구글의 Gemini AI를 터미널에서 직접 사용할 수 있는 도구입니다. 이를 통해 과금 없이도 에이전트 모드¹를 충분히 활용하여 데이터 분석 작업을 수행할 수 있습니다.
주요 특징
- 멀티모달 지원: PDF, 이미지, CSV 등 다양한 파일 형식 처리
- 코드 생성: Python 코드 자동 생성 및 Jupyter 노트북 작성
- 문서 분석: PDF 문서에서 정보 추출 및 마크다운 변환
- 실시간 분석: 데이터 전처리부터 시각화까지 자동화
용어 설명
¹ 에이전트 모드: AI가 단순히 답변하는 것이 아니라, 파일을 읽고 분석하며 실제 작업을 수행하는 고급 모드
2. 사전 준비사항
시스템 요구사항
- Python 3.8 이상
- VSCode (Visual Studio Code)
- 인터넷 연결
- Google 계정 (Gemini API 키 발급용)
필요한 도구 목록
✅ 체크리스트:
□ Python 최신 버전 (3.13.2 권장)
□ VSCode 설치
□ Jupyter Extension 설치
□ Python Extension 설치
□ Gemini API 키
□ 분석할 데이터셋
3. 파이썬 설치 가이드
3.1 Windows 사용자
단계별 설치 절차
🪟 Windows 설치 단계:
1. python.org 접속
2. Downloads > Python 3.13.2 클릭
3. 64-bit 버전 다운로드 (권장)
4. 설치 파일 실행
5. ⚠️ 중요: "Add Python to PATH" 체크박스 반드시 선택
6. "Install Now" 클릭
7. 설치 완료 후 CMD에서 확인: python --version
환경변수 설정 확인
# CMD 또는 PowerShell에서 실행
python --version
# 출력 예시: Python 3.13.2
pip --version
# 출력 예시: pip 24.0 from...
3.2 macOS 사용자
설치 절차
🍎 macOS 설치 단계:
1. python.org 접속
2. Download Python 3.13.2 (macOS) 클릭
3. .pkg 파일 다운로드
4. 다운로드 폴더에서 .pkg 파일 더블클릭
5. 설치 마법사 따라 진행
6. ⚠️ 중요: "Install Certificates.command" 반드시 실행
7. 터미널에서 확인
인증서 설치 (중요)
macOS에서는 HTTPS 통신을 위해 반드시 인증서를 설치해야 합니다:
# 설치 완료 후 나타나는 "Install Certificates.command" 더블클릭
# 또는 터미널에서 직접 실행:
/Applications/Python\ 3.13/Install\ Certificates.command
터미널 설정
# Python 별칭 설정 (.zshrc 또는 .bash_profile에 추가)
alias python='python3'
alias pip='pip3'
# 설정 적용
source ~/.zshrc
3.3 설치 확인
IDLE 테스트
# IDLE에서 실행해보기
print("Hello World")
# 출력: Hello World
1 + 3
# 출력: 4
5 // 3 # 몫
# 출력: 1
5 % 3 # 나머지
# 출력: 2
4. Gemini CLI 설치 및 설정
4.1 Gemini CLI 설치
설치 명령어
# pip를 사용한 설치
pip install google-generativeai
# 또는 conda 사용
conda install -c conda-forge google-generativeai
4.2 API 키 설정
API 키 발급
- Google AI Studio 접속
- "Create API Key" 클릭
- API 키 복사
환경 변수 설정
# Windows (PowerShell)
$env:GEMINI_API_KEY="your-api-key-here"
# macOS/Linux (bash/zsh)
export GEMINI_API_KEY="your-api-key-here"
# 영구 설정을 위해 profile 파일에 추가
echo 'export GEMINI_API_KEY="your-api-key-here"' >> ~/.zshrc
4.3 초기 설정 파일 생성
gemini.md 설정 파일
# Gemini CLI 기본 설정
## 응답 언어
- 모든 답변은 한국어로만 해 주세요
## 가상환경 설정
- 항상 uv를 사용해 주세요
- venv 폴더에 가상환경 설정 및 활성화
- 이미 가상환경이 있다면 새로 만들지 마세요
## 데이터 시각화
- 한글 폰트 설정을 포함해 주세요
- 대용량 데이터는 샘플링 후 시각화
- 불필요한 시각화는 피해 주세요
## 코드 생성 규칙
- 주석을 충분히 포함
- 오류 처리 코드 추가
- 실행 가능한 완전한 코드 제공
5. VSCode 환경 구성
5.1 VSCode 설치
- VSCode 공식 사이트 접속
- 운영체제에 맞는 버전 다운로드
- 설치 후 실행
5.2 필수 확장 프로그램 설치
Python 개발 환경
필수 확장 프로그램:
✅ Python (Microsoft)
✅ Jupyter (Microsoft)
✅ Python Docstring Generator
✅ GitLens (선택사항)
✅ GitHub Copilot (유료, 선택사항)
설치 방법
- VSCode에서 Ctrl+Shift+X (Extensions 패널)
- 검색창에 확장 프로그램 이름 입력
- Install 클릭
5.3 Python 가상환경 설정
uv를 사용한 가상환경 생성
# uv 설치 (Python 패키지 매니저)
pip install uv
# 프로젝트 폴더 생성 및 이동
mkdir data-analysis-project
cd data-analysis-project
# 가상환경 생성
uv venv venv
# 가상환경 활성화
# Windows:
venv\Scripts\activate
# macOS/Linux:
source venv/bin/activate
필요한 패키지 설치
# 데이터 분석 필수 패키지
uv pip install pandas numpy matplotlib seaborn jupyter
uv pip install plotly scikit-learn
# 한글 폰트 설정용
uv pip install matplotlib-fontpkg
6. 데이터 분석 실습
6.1 데이터셋 준비
의약품 처방 정보 데이터 예시
실습에 사용할 데이터 구조:
data/
├── prescription_sample.csv # 처방 정보 데이터 (약 30만 건)
├── code_info.pdf # 코드 설명서
└── analysis_guide.md # 분석 가이드
데이터 컬럼 설명
# 주요 컬럼
columns = {
'가입자 번호': '환자 고유 번호',
'성별코드': '1(남성), 2(여성)',
'시도코드': '지역 코드 (서울:11, 경기:31 등)',
'연령대코드': '5세 단위 연령대',
'약품일반성분명코드': '의약품 성분 코드',
'단가': '의약품 단가',
'금액': '총 처방 금액',
'1회투약량': '1회 복용량',
'총투여일수': '총 처방 일수'
}
6.2 Gemini CLI를 활용한 분석
PDF 문서 분석 및 마크다운 생성
# Gemini CLI 실행
gemini
# PDF 파일 참조하여 분석 가이드 생성
> 파일: ./data/code_info.pdf
> 해당 문서에서 처방 정보를 분석하고자 할 때
> 해당 내용을 마크다운 파일로 생성해 달라
분석 계획 수립
# CSV 파일과 PDF 문서 함께 참조
> 파일: ./data/prescription_sample.csv
> 파일: ./data/code_info.pdf
>
> 이 파일을 바탕으로 분석할 수 있는 방안에 대해서
> 마크다운 파일에 함께 정리해 달라
6.3 Jupyter 노트북 생성
자동 노트북 생성 요청
> 파일: ./analysis_guide.md
>
> 처방 정보 분석 내용을 바탕으로
> 데이터 분석 jupyter 파일 만들고 실행까지 할 것
생성되는 노트북 구조
# 1. 라이브러리 임포트
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from IPython.display import display
# 한글 폰트 설정
plt.rc('font', family='AppleGothic') # macOS
# plt.rcParams['font.family'] = 'Malgun Gothic' # Windows
# 2. 데이터 로드
df = pd.read_csv('./data/prescription_sample.csv')
print(f"데이터 형태: {df.shape}")
display(df.head())
# 3. 데이터 전처리
# 성별 코드 매핑
gender_map = {1: '남성', 2: '여성'}
df['성별'] = df['성별코드'].map(gender_map)
# 시도 코드 매핑
sido_map = {
11: '서울특별시', 26: '부산광역시', 27: '대구광역시',
28: '인천광역시', 29: '광주광역시', 30: '대전광역시',
31: '울산광역시', 36: '세종특별자치시', 41: '경기도',
# ... 추가 매핑
}
df['시도명'] = df['시도코드'].map(sido_map)
# 연령대 매핑
age_map = {
1: '0-4세', 2: '5-9세', 3: '10-14세',
# ... 5세 단위 매핑
}
df['연령대'] = df['연령대코드'].map(age_map)
6.4 탐색적 데이터 분석
지역별 처방 현황
# 지역별 처방 건수
region_counts = df['시도명'].value_counts()
print("=== 지역별 처방 건수 TOP 10 ===")
display(region_counts.head(10))
# 시각화
plt.figure(figsize=(12, 6))
region_counts.head(10).plot(kind='bar')
plt.title('지역별 처방 건수')
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()
연령대별 분석
# 연령대별 처방 현황
age_analysis = df.groupby('연령대').agg({
'가입자 번호': 'count', # 처방 건수
'금액': ['sum', 'mean'] # 총액, 평균
}).round(2)
print("=== 연령대별 처방 현황 ===")
display(age_analysis)
성별 분석
# 성별 처방 현황
gender_analysis = df.groupby('성별').agg({
'가입자 번호': 'count',
'금액': 'sum',
'총투여일수': 'mean'
}).round(2)
print("=== 성별 처방 현황 ===")
display(gender_analysis)
6.5 고급 분석
교차 분석
# 연령대 × 성별 교차표
crosstab = pd.crosstab(df['연령대'], df['성별'], margins=True)
print("=== 연령대별 성별 분포 ===")
display(crosstab)
# 비율로 표시
crosstab_pct = pd.crosstab(df['연령대'], df['성별'], normalize='index') * 100
display(crosstab_pct.round(1))
시각화
# 히트맵으로 표시
plt.figure(figsize=(10, 8))
sns.heatmap(crosstab_pct, annot=True, fmt='.1f', cmap='Blues')
plt.title('연령대별 성별 분포 비율 (%)')
plt.tight_layout()
plt.show()
7. AI 어시스턴트 활용 전략
7.1 Gemini CLI vs GitHub Copilot vs Code Assist
사용 상황별 추천
상황 추천 도구 이유
| 전체 노트북 생성 | Gemini CLI | 문서 분석 + 코드 생성 |
| 세부 코드 수정 | GitHub Copilot | 빠른 인라인 편집 |
| 오류 수정 | Code Assist | 즉시 문제 해결 |
| 데이터 탐색 | Gemini CLI | 멀티모달 분석 |
7.2 효율적인 프롬프트 작성
파일 참조 프롬프트
# 좋은 예시
> 파일: ./data/sample.csv
> 파일: ./docs/analysis_guide.md
>
> 위 CSV 데이터와 분석 가이드를 참고하여
> 다음 조건으로 Jupyter 노트북을 생성해 주세요:
> 1. 한글 폰트 설정 포함
> 2. 데이터 전처리 자동화
> 3. 주요 변수별 기술통계 생성
> 4. 시각화 포함 (단, 대용량 데이터는 샘플링)
점진적 개선 전략
# 1단계: 기본 틀 생성 (Gemini CLI)
> 전체 분석 노트북 생성
# 2단계: 세부 수정 (GitHub Copilot 또는 Code Assist)
> 특정 함수 개선
> 오류 수정
> 추가 분석
# 3단계: 보고서 작성 (Gemini CLI)
> 분석 결과를 마크다운 보고서로 변환
7.3 VSCode에서의 활용 팁
Jupyter 노트북 실행
# 1. 커널 선택
# Ctrl+Shift+P → "Python: Select Interpreter"
# 생성한 가상환경(venv) 선택
# 2. 셀 실행
# Shift+Enter: 현재 셀 실행 후 다음으로
# Ctrl+Enter: 현재 셀만 실행
# 3. 새 셀 추가
# 'A' 키: 위에 셀 추가
# 'B' 키: 아래에 셀 추가
인라인 AI 활용
# GitHub Copilot 활용
# Ctrl+I: 인라인 채팅
# Tab: 제안 수락
# Ctrl+→: 단어별 제안 수락
# Code Assist 활용
# 코드 선택 후 우클릭 → "Generate Code"
# 오류가 있는 라인에서 "Fix Error"
8. 문제 해결 가이드
8.1 일반적인 오류와 해결방법
Python 경로 오류
# 문제: 'python' 명령어를 찾을 수 없음
# 해결방법:
# Windows: PATH 환경변수 확인
# macOS: alias 설정 확인
alias python='python3'
가상환경 활성화 실패
# 문제: 가상환경이 활성화되지 않음
# 해결방법:
# 1. 가상환경 재생성
rm -rf venv
uv venv venv
# 2. 활성화 스크립트 권한 확인
chmod +x venv/bin/activate # macOS/Linux
패키지 설치 오류
# 문제: SSL/TLS 인증 오류 (macOS)
# 해결방법: 인증서 재설치
/Applications/Python\ 3.13/Install\ Certificates.command
# 문제: pip 업그레이드 필요
# 해결방법:
python -m pip install --upgrade pip
8.2 Gemini CLI 관련 문제
API 키 오류
# 문제: API 키가 인식되지 않음
# 해결방법: 환경변수 재설정
export GEMINI_API_KEY="your-actual-api-key"
echo $GEMINI_API_KEY # 확인
파일 참조 오류
# 문제: 파일을 찾을 수 없음
# 해결방법: 절대 경로 사용
> 파일: /full/path/to/your/file.csv
# 또는 현재 디렉토리 확인
pwd
ls -la
응답 시간 지연
# 문제: Gemini CLI 응답이 너무 느림
# 해결방법:
# 1. 더 작은 파일로 테스트
# 2. 요청 분할
# 3. GitHub Copilot 등 대안 도구 병행 사용
8.3 데이터 분석 관련 문제
한글 폰트 오류
# 문제: 한글이 깨져서 표시됨
# 해결방법:
import matplotlib.pyplot as plt
import matplotlib.font_manager as fm
# macOS
plt.rc('font', family='AppleGothic')
plt.rcParams['axes.unicode_minus'] = False
# Windows
plt.rcParams['font.family'] = 'Malgun Gothic'
plt.rcParams['axes.unicode_minus'] = False
# Linux (폰트 설치 필요)
# sudo apt-get install fonts-nanum
plt.rcParams['font.family'] = 'NanumGothic'
메모리 부족 오류
# 문제: 대용량 데이터로 인한 메모리 오류
# 해결방법: 청크 단위로 읽기
chunks = []
for chunk in pd.read_csv('large_file.csv', chunksize=10000):
# 필요한 전처리 수행
processed_chunk = process_data(chunk)
chunks.append(processed_chunk)
df = pd.concat(chunks, ignore_index=True)
데이터 타입 오류
# 문제: 날짜나 숫자가 문자열로 인식됨
# 해결방법: 명시적 타입 변환
df['날짜컬럼'] = pd.to_datetime(df['날짜컬럼'])
df['숫자컬럼'] = pd.to_numeric(df['숫자컬럼'], errors='coerce')
9. 참고자료
9.1 공식 문서
9.2 Gemini AI 관련
9.3 데이터 분석 리소스
- Kaggle Learn - 무료 데이터 과학 코스
- Pandas Cheat Sheet
- Matplotlib 갤러리
- Seaborn 예제
9.4 추가 도구 및 라이브러리
# 고급 데이터 분석
pip install plotly # 인터랙티브 시각화
pip install streamlit # 웹 앱 생성
pip install scikit-learn # 머신러닝
pip install statsmodels # 통계 분석
# 데이터 처리 성능 향상
pip install polars # 빠른 DataFrame 처리
pip install dask # 병렬 처리
9.5 커뮤니티 및 지원
- Stack Overflow - Python 관련 질문
- Reddit r/Python - Python 커뮤니티
- Python Discord - 실시간 도움
- DataCamp Community - 데이터 과학 커뮤니티
참고문헌 및 주석
참고문헌
- Python Software Foundation. (2024). Python 3.13.2 Documentation. Retrieved from https://docs.python.org/3/
- McKinney, W. (2022). Python for Data Analysis: Data Wrangling with pandas, NumPy, and Jupyter (3rd ed.). O'Reilly Media.
- Google LLC. (2024). Gemini API Documentation. Retrieved from https://ai.google.dev/docs
- Microsoft Corporation. (2024). Visual Studio Code Python Tutorial. Retrieved from https://code.visualstudio.com/docs/python/python-tutorial
- 국민건강보험공단. (2020). 의약품처방정보 표준데이터. 공공데이터포털.
주석
- CLI (Command Line Interface): 텍스트 기반으로 컴퓨터와 상호작용하는 인터페이스
- API 키: 애플리케이션이 서비스에 접근할 때 사용하는 인증 키
- 가상환경 (Virtual Environment): 프로젝트별로 독립된 Python 패키지 환경을 구성하는 도구
- 멀티모달: 텍스트, 이미지, 음성 등 여러 형태의 데이터를 동시에 처리할 수 있는 능력
- EDA (Exploratory Data Analysis): 탐색적 데이터 분석, 데이터의 패턴을 찾기 위한 초기 분석
- 크로스탭 (Crosstab): 두 개 이상의 범주형 변수 간의 관계를 표로 나타내는 분석 방법
💡 추가 팁
성능 최적화
- 대용량 데이터는 샘플링 후 분석
- 메모리 사용량 모니터링: df.memory_usage(deep=True)
- 불필요한 컬럼 제거로 메모리 절약
협업 고려사항
- Git으로 코드 버전 관리
- 주석과 마크다운으로 분석 과정 문서화
- 재현 가능한 분석을 위한 시드값 설정
보안 주의사항
- API 키는 환경변수로 관리하고 코드에 직접 포함하지 않기
- 민감한 데이터는 .gitignore에 추가
- 개인정보가 포함된 데이터 처리 시 주의
이 가이드를 따라 실행하면 Gemini CLI와 VSCode를 활용한 효율적인 데이터 분석 환경을 구축할 수 있습니다.