데이터 분석 과금없이 에이전트 모드 넉넉하게 사용하고 싶다면? GEMINI CLI로 VSCode에서 주피터로 데이터 분석하기 [오늘코드todaycode]
📑 GEMINI CLI + VSCode + Jupyter를 활용한 데이터 분석 절차 정리
목차
- 개요
- 준비 사항
- GEMINI CLI 설치 및 환경 설정
- 데이터셋 준비 및 참조 방법
- 문서(PDF/CSV) 분석 절차
- Jupyter Notebook 생성 및 실행
- 데이터 전처리 및 분석 과정
- 기술 통계 및 시각화
- 보고서 작성 (마크다운/리포트 자동 생성)
- 실행 시 유의사항 및 오류 해결
- 결론
- 참고문헌 및 주석
1. 개요
본 문서는 GEMINI CLI를 활용하여 VSCode 환경에서 Jupyter Notebook으로 데이터를 분석하는 절차를 정리한다. 특히 **의약품 처방 정보 데이터셋(약 30만 건)**을 기반으로, PDF 문서 및 CSV 파일을 함께 참조하여 분석 리포트를 자동 생성하는 방법을 다룬다.
2. 준비 사항
- 필수 소프트웨어
- Python (3.10 이상 권장)
- VSCode (최신 버전)
- Jupyter Notebook / JupyterLab
- GEMINI CLI
- GitHub Copilot (선택)
- 데이터
- 의약품 처방 정보 데이터셋 (CSV)
- 데이터 코드 매핑 문서 (PDF)
3. GEMINI CLI 설치 및 환경 설정
📌 주의사항:
- 이미 가상환경이 존재하면 새로 만들지 않아도 됨.
- 데이터 시각화 시 seaborn 대신 matplotlib 권장 (속도 문제).
4. 데이터셋 준비 및 참조 방법
- CSV 데이터 복사 후 프로젝트 폴더에 저장
- PDF 문서(코드 매핑 자료)를 참조 파일로 연결
- VSCode 내에서 "Copy Path" 기능으로 파일 경로를 가져와 GEMINI CLI 프롬프트에 삽입
예시:
5. 문서(PDF/CSV) 분석 절차
- PDF → 시도 코드, 연령대 코드, 성별 코드 매핑
- CSV → 실제 처방 정보 로드
- 마크다운 파일 자동 생성:
-
gemini run --file mapping.pdf --output analysis_plan.md
6. Jupyter Notebook 생성 및 실행
- 커널 선택: .venv 환경
- 실행 시 라이브러리 자동 로드
7. 데이터 전처리 및 분석 과정
- 코드 매핑
- 시도 코드 → 시도명
- 연령대 코드 → 연령 그룹
- 성별 코드 → 남/여
- 전처리
-
df['region'] = df['region_code'].map(region_dict) df['age_group'] = df['age_code'].map(age_dict) df['gender'] = df['gender_code'].map(gender_dict)
8. 기술 통계 및 시각화
- 수치형 변수 요약
- 처방 금액, 단가, 투여일수
- 범주형 변수 빈도
- 지역별, 연령대별, 성별 처방 건수
- 시각화 예시
-
import matplotlib.pyplot as plt df['region'].value_counts().plot(kind='bar') plt.title("지역별 처방 건수") plt.show()
9. 보고서 작성 (자동 마크다운 리포트)
- 포함 내용:
- 전체 데이터 요약
- 수치형/범주형 기술 통계
- 주요 약품 TOP-N
- 연령대·성별·지역별 처방 경향
- 결론 및 인사이트
10. 실행 시 유의사항 및 오류 해결
- PDF/CSV 로드 오류: 파일 경로 확인, --file 옵션 사용
- 출력 시 프린트 문제: print() 대신 display() 사용
- 포맷 오류 발생 시: Copilot/Fix 모드 활용하여 코드 자동 수정
- 대용량 데이터 문제: 샘플링 후 분석 → 전체 적용
11. 결론
- GEMINI CLI는 데이터 분석 전체 워크플로우를 자동화할 수 있다.
- PDF, CSV 등 다양한 입력 파일을 기반으로 코드 + 리포트 + 시각화를 생성 가능하다.
- 단점: 실행 속도 지연 → Copilot, Code Assist와 병행 권장.
12. 참고문헌 및 주석
참고문헌
- Google DeepMind. GEMINI Technical Report, 2024.
- YouTube 채널, 데이터 분석 과금없이 GEMINI CLI로 VSCode에서 주피터로 데이터 분석하기, 2025.
- Wes McKinney, Python for Data Analysis, O’Reilly Media, 2018.
주석
- CLI(Command Line Interface): 명령어 기반의 인터페이스
- 매핑(Mapping): 코드값을 실제 의미 있는 값으로 변환하는 작업
- 기술 통계(Descriptive Statistics): 평균, 분산, 빈도 등 기본 통계량
- EDA(Exploratory Data Analysis): 데이터 탐색적 분석 단계
👉 정리된 절차를 그대로 따라가면 의약품 처방 데이터 분석 보고서를 GEMINI CLI와 Jupyter에서 자동 생성할 수 있습니다.
VS Code에서 Gemini CLI를 활용한 데이터 분석 가이드
이 문서는 Gemini CLI를 사용하여 VS Code 환경에서 데이터 분석을 효율적으로 수행하는 방법을 설명합니다. Gemini CLI는 단순한 코드 작성뿐만 아니라 문서 분석, 데이터 전처리, 시각화, 보고서 생성 등 복잡한 데이터 분석 워크플로우를 자동화하는 데 강력한 에이전트 역할을 합니다.
목차
- 데이터 분석을 위한 환경 설정 1.1. Node.js 및 Gemini CLI 설치 1.2. VS Code 확장 프로그램 설치
- Gemini CLI를 활용한 데이터 분석 절차 2.1. 데이터 및 문서 준비 2.2. 문서 분석 및 데이터 구조화 2.3. Jupyter Notebook 생성 및 실행 2.4. 데이터 분석 및 시각화 2.5. 분석 보고서 작성
- Gemini CLI와 보조 도구 활용 팁
- 주석 및 참고문헌
1. 데이터 분석을 위한 환경 설정
1.1. Node.js 및 Gemini CLI 설치
Gemini CLI를 사용하기 위해서는 Node.js와 npm[^1]이 필수적입니다. Windows 환경에서는 PowerShell보다 CMD를 권장합니다.
- Node.js 설치: Node.js 공식 홈페이지에서 LTS(장기 지원) 버전을 다운로드하여 설치합니다.
- 설치 확인: 터미널을 열고 다음 명령어를 입력하여 Node.js와 npm이 정상적으로 설치되었는지 확인합니다.
- node -v npm -v
- Gemini CLI 설치: 아래 명령어를 사용하여 Gemini CLI를 전역으로 설치합니다.
- npm install -g @google/gemini-cli
- Gemini CLI 실행 및 인증: 설치 완료 후, 터미널에 gemini를 입력하면 자동으로 웹 브라우저 기반의 인증 창이 나타납니다. 구글 계정으로 로그인하여 인증 절차를 완료합니다.
1.2. VS Code 확장 프로그램 설치
VS Code의 통합 환경에서 Gemini를 편리하게 사용하려면 Gemini Code Assist 확장 프로그램을 설치하는 것이 좋습니다.
- 확장 프로그램 검색 및 설치: VS Code의 확장 프로그램 탭(단축키: Ctrl+Shift+X)에서 Gemini Code Assist를 검색하여 설치합니다.
- Jupyter 확장 설치: Jupyter Notebook 파일을 VS Code에서 실행하기 위해 Jupyter 확장 프로그램을 설치합니다.
2. Gemini CLI를 활용한 데이터 분석 절차
2.1. 데이터 및 문서 준비
분석을 시작하기 전에 필요한 데이터 파일(CSV 등)과 데이터의 구조 및 의미를 설명하는 문서(PDF 등)를 한 폴더에 준비합니다. Gemini CLI는 PDF 문서의 내용을 읽고 분석에 활용할 수 있습니다.
2.2. 문서 분석 및 데이터 구조화
데이터가 코드값으로 되어 있어 의미를 파악하기 어려울 때, Gemini CLI에 문서 분석을 요청하여 데이터 구조를 명확히 할 수 있습니다.
- Gemini CLI 실행: VS Code 터미널에서 gemini를 입력하여 대화 세션을 시작합니다.
- 문서 분석 요청: PDF 문서를 참조하여 데이터셋의 처방 정보(연령대 코드, 시도 코드 등)를 마크다운 파일로 정리해달라고 요청합니다.
[PDF 파일 경로] 참조하여 처방 정보 분석 내용을 마크다운 파일로 생성해 주세요. - gemini
- 결과 확인: Gemini가 생성한 마크다운 파일(prescription_info_analysis.md)을 확인하여 데이터의 의미를 파악합니다.
2.3. Jupyter Notebook 생성 및 실행
Gemini CLI는 데이터 분석 계획을 바탕으로 Jupyter Notebook 파일을 생성하고 실행하는 작업을 자동화할 수 있습니다.
- 분석 계획 프롬프트 작성: CSV 데이터와 앞서 생성한 마크다운 파일을 바탕으로 데이터 분석 계획을 상세하게 작성합니다.
- 데이터 로드: prescription_data.csv 파일을 불러오도록 명시합니다.
- 데이터 전처리: 문서에서 파악한 코드값(시도 코드, 연령대 코드, 성별 코드 등)을 실제 의미(서울, 50대, 여성)로 매핑하는 코드를 포함하도록 요청합니다.
- 탐색적 데이터 분석(EDA): 지역별, 연령대별, 성별 처방 건수 및 월별 처방 건수 등을 시각화하도록 요청합니다.
- Jupyter Notebook 생성 요청: 작성한 프롬프트를 바탕으로 Jupyter Notebook 파일을 생성하고 실행까지 요청합니다.
[데이터셋 CSV 파일 경로]와 [마크다운 파일 경로]를 참조하여 데이터 분석 Jupyter Notebook 파일을 생성하고 실행해 주세요. - gemini
2.4. 데이터 분석 및 시각화
Gemini가 생성한 Jupyter Notebook 파일(.ipynb)을 VS Code에서 열어 실행 결과를 확인하고 수정할 수 있습니다.
- 실행: VS Code에서 생성된 .ipynb 파일을 열어 셀을 하나씩 실행합니다.
- 코드 수정: 실행 중 오류가 발생하거나 특정 부분을 수정하고 싶을 경우, Gemini Code Assist나 GitHub Copilot의 인라인 채팅 기능을 활용하여 빠르게 코드를 수정합니다.
- 예: print 구문을 display 구문으로 변경하거나, 기술 통계 코드의 오류를 수정합니다.
2.5. 분석 보고서 작성
분석 결과(기술 통계 등)를 바탕으로 최종 보고서를 작성할 수 있습니다.
- 보고서 작성 요청: Jupyter Notebook의 실행 결과(텍스트)를 복사하여 Gemini CLI 또는 Gemini Code Assist에 붙여 넣고, 이를 바탕으로 마크다운 형식의 분석 보고서를 작성해 달라고 요청합니다.
다음 기술 통계 결과를 바탕으로 분석 보고서를 작성해 주세요. [기술 통계 결과 텍스트 붙여넣기] - gemini
- 결과 활용: Gemini가 작성한 보고서를 확인하고 필요에 따라 편집하여 최종 보고서로 활용합니다.

3. Gemini CLI와 보조 도구 활용 팁
- Gemini CLI: 초기 분석 파일(Jupyter Notebook, README.md 등) 생성, 복잡한 자동화 작업, 전체 프로젝트 구조 생성 등 큰 규모의 작업에 사용합니다.
- Gemini Code Assist / GitHub Copilot: 작은 코드 수정, 오류 해결, 특정 셀의 코드 생성 등 실시간으로 빠르게 응답이 필요한 반복적인 작업에 사용합니다.
- VS Code 통합: 터미널과 파일 탐색기가 통합된 VS Code 환경에서 작업하면 파일을 열고 닫는 불편함 없이 효율적으로 작업할 수 있습니다.
4. 주석 및 참고문헌
주석
참고문헌
- YouTube. (756) 데이터 분석 과금없이 에이전트 모드 넉넉하게 사용하고 싶다면? GEMINI CLI로 VSCode에서 주피터로 데이터 분석하기. (2024년 5월 22일). https://www.youtube.com/watch?v=YSscvDczPn4
[^1]: npm (Node Package Manager): Node.js의 패키지 관리 도구입니다.