과금없이 에이전트 모드 넉넉하게 사용하고 싶다면? GEMINI CLI로 VSCode에서 주피터로 데이터 분석하기 [오늘코드todaycode]
영상 내용을 목차 기반으로 정리, 알기 쉽게 설명, 어려운 단어 주석, 실행 가능 영역 하이라이트, 참조 링크와 추가 정보, 참고문헌까지 포함해서 구조화했습니다.
GEMINI CLI와 VSCode, 주피터로 데이터 분석하기: 종합 정리
참조 영상: 과금없이 에이전트 모드 넉넉하게 사용하고 싶다면? GEMINI CLI로 VSCode에서 주피터로 데이터 분석하기 - YouTube
목차
- GEMINI CLI와 데이터 분석 개요
- 데이터 준비와 샘플 데이터셋
- GEMINI CLI 설치 및 초기 실행
- PDF 및 문서 자료 활용 분석
- CSV 데이터 분석 및 프롬프트 작성
- 주피터 노트북 생성과 실행
- 데이터 전처리 및 파생 변수 생성
- 탐색적 데이터 분석(EDA) 및 시각화
- 기술 통계 및 보고서 작성
- 코드 수정과 에러 대응 방법
- 실무 활용 팁과 추천 워크플로우
- 참고자료 및 링크
1. GEMINI CLI와 데이터 분석 개요
- GEMINI CLI: 명령어 기반(Command Line Interface)으로 GEMINI AI 기능을 실행할 수 있는 도구
- 주요 기능:
- 코드 자동 생성
- 문서 분석 및 마크다운 파일 생성
- PDF, 이미지 등 멀티모달 자료 활용 가능
- 주피터 노트북과 연동하여 데이터 분석 가능
주석:
- CLI(Command Line Interface): 터미널에서 명령어를 입력해 프로그램을 실행하는 방식
- 멀티모달(Multimodal): 텍스트뿐 아니라 이미지, PDF, 웹 자료 등 여러 형식을 동시에 다룰 수 있음
2. 데이터 준비와 샘플 데이터셋
- 데이터셋: 국가 중점 의약품 처방 정보 데이터
- 샘플 데이터: 약 30만 개 레코드
- 데이터 구성:
- 연령대 코드
- 시도 코드
- 약품 일반 성분명 코드
- 1회 투여량, 금액 등
실행 가능 영역:
🟩 데이터셋 준비 → CSV 파일 및 PDF 참조 자료 준비
3. GEMINI CLI 설치 및 초기 실행
- GEMINI 설치 후 터미널에서 gemini 명령어 실행
- 마크다운 파일 생성 예시: PDF를 기반으로 처방 정보 분석 문서를 마크다운으로 변환
- 웹 UI와 CLI 차이점:
- CLI는 개발자 친화적
- 한글 입력 시 일부 부자연스러움 존재
🟩 실행:
4. PDF 및 문서 자료 활용 분석
- PDF 참조 → 마크다운 파일 생성
- 시도 코드, 연령대 코드 등 데이터 코드값 참조 가능
- CSV 파일과 결합하여 데이터 분석 가능
🟩 PDF/문서 분석 마크다운 예시
5. CSV 데이터 분석 및 프롬프트 작성
- CSV 파일 참조 → 데이터 분석 프롬프트 생성
- 분석 항목:
- 지역별 처방 건수
- 연령대별 처방 건수
- 성별별 처방 건수
- 상위 약품 비율 분석
🟩 프롬프트 작성 예시
6. 주피터 노트북 생성과 실행
- GEMINI CLI → 마크다운 기반 주피터 노트북 자동 생성
- 가상 환경(Virtual Environment) 설정:
- 이미 있다면 재생성하지 않음
- 파이썬 환경 선택 후 실행
🟩 실행:
7. 데이터 전처리 및 파생 변수 생성
- 코드값 → 실제 값 매핑:
- 연령대 코드 → 연령 범위
- 시도 코드 → 시도명
- 성별 코드 → 남/여
- 익명화 목적: 연령/지역 코드 사용 → 개인정보 보호
🟩 파생 변수 예시
8. 탐색적 데이터 분석(EDA) 및 시각화
- 분석 항목:
- 지역별 처방 건수
- 연령대별 처방 건수
- 성별 처방 건수
- 월별 처방 건수
- 처방 금액 분포
- 시각화: 막대그래프, 파이차트, 교차표
🟩 시각화 예시
9. 기술 통계 및 보고서 작성
- 수치형 변수, 범주형 변수 통계 출력
- 보고서 작성 방법:
- 기술 통계 마크다운 셀 작성
- CSV 결과를 바탕으로 보고서 생성
- 도구:
- GEMINI CLI
- Code Assist / Copilot
🟩 보고서 작성 예시
10. 코드 수정과 에러 대응 방법
- 자주 발생 오류:
- 프린트 구문 대신 display 사용
- JSON 파일 열기 오류
- 파이썬 셀 미생성 문제
- 해결 방법:
- Code Assist / Copilot 활용
- 오류 메시지 기반 Fix 실행
🟩 실행 예시
11. 실무 활용 팁과 추천 워크플로우
- 효율적 데이터 분석 순서
- GEMINI CLI → 기본 노트북 생성
- Copilot / Code Assist → 세부 코드 수정
- 파생 변수 생성 → EDA
- 시각화 → 보고서 작성
- 대규모 데이터: CSV 참조 + 프롬프트로 분석 → 속도 개선 가능
- 유료 Cloud Code 대신 무료 CLI 활용 가능
🟩 추천 방식:
- 초기 설정: GEMINI CLI
- 세부 수정: Code Assist / Copilot
- 보고서 작성: 마크다운 셀 → 복사 후 워드/파워포인트 변환
12. 참고자료 및 링크
✅ 결론
- GEMINI CLI와 Code Assist, Copilot을 결합하면 PDF/CSV 자료를 바탕으로 데이터 분석부터 보고서 작성까지 자동화 가능
- CLI → 기본 생성, Code Assist → 세부 수정, 마크다운 → 보고서 변환
- 익명화된 코드값 데이터도 실제 값으로 매핑 후 분석 가능
- 시각화 및 EDA까지 주피터 노트북에서 한 번에 수행 가능
Gemini CLI로 똑똑하게 데이터 분석하기: 초보자를 위한 단계별 가이드
데이터 분석, 이제 더 이상 어렵게 시작하지 마세요. 방대한 데이터를 다루는 과정은 때때로 복잡하게 느껴질 수 있지만, Gemini CLI를 활용하면 놀라울 정도로 쉽게 데이터 분석 워크플로우를 자동화할 수 있습니다. 오늘은 Gemini CLI를 이용해 VS Code에서 주피터 노트북으로 데이터 분석을 하는 과정을 단계별로 상세히 알려 드릴게요.
1. Gemini CLI란 무엇일까요?
**Gemini CLI (Command Line Interface)**는 터미널 환경에서 직접 Gemini 모델과 대화하며 코드를 생성하고, 문서를 분석하며, 데이터 분석 작업을 자동화할 수 있는 강력한 도구입니다. 복잡한 GUI(그래픽 사용자 인터페이스) 없이 텍스트 명령만으로 모든 것을 제어할 수 있습니다.
- 주요 특징:
- 멀티모달리티: PDF, 이미지, CSV 등 다양한 형식의 파일을 읽고 분석할 수 있습니다.
- 에이전트 기능: 사용자의 지시에 따라 파일 생성부터 코드 작성, 실행까지 자동으로 처리합니다.
- 코드 생성: 데이터 분석에 필요한 Python 코드를 알아서 척척 만들어 줍니다.
2. 데이터 분석 워크플로우 실행하기
Gemini CLI를 활용한 실제 데이터 분석 과정을 단계별로 따라 해 보세요.
1단계: 문서 분석 및 데이터 준비
데이터 분석의 첫걸음은 데이터에 대한 깊은 이해에서 시작됩니다. Gemini CLI에 관련 문서를 첨부하여 필요한 정보를 빠르게 추출할 수 있습니다.
실행 방법
- 터미널 열기: 컴퓨터에서 터미널을 실행합니다.
- 파일 참조: Gemini CLI에 분석할 PDF 문서의 경로를 알려줍니다.
- 명령어: gemini-cli <파일 경로>
- 예시: gemini-cli ./data/의약품처방정보_설명서.pdf
- 프롬프트 입력: 프롬프트에 다음과 같이 입력하여 문서 분석을 요청합니다.
- 이 문서에서 의약품 처방 정보 분석에 필요한 내용을 마크다운 파일로 정리해 줘.
- 파일 확인: Gemini CLI가 요청에 따라 의약품처방정보_분석.md와 같은 파일을 생성해 줍니다.
2단계: 데이터 전처리 코드 생성
분석에 적합한 형태로 데이터를 가공하는 과정인 전처리는 매우 중요합니다. Gemini CLI를 사용하면 CSV 파일의 컬럼 정보를 바탕으로 전처리 코드를 손쉽게 생성할 수 있습니다.
실행 방법
- 터미널에서 Gemini CLI 실행: 터미널을 열고 gemini-cli를 입력합니다.
- 데이터 파일 참조: 분석할 CSV 파일의 경로를 입력합니다.
- 예시: gemini-cli ./data/med_prescription_sample.csv
- 프롬프트 입력: 다음과 같이 주피터 노트북 파일 생성을 요청합니다.
- 이 CSV 파일을 바탕으로 데이터 전처리, 탐색적 데이터 분석(EDA), 시각화를 포함한 주피터 노트북 파일을 생성하고 실행까지 해줘.
- 추가 요청: 시도 코드와 연령대 코드를 맵핑하여 파생 변수(시도명, 연령대)를 생성하는 코드를 추가해 줘.
- 결과 확인: Gemini CLI가 prescription_analysis.ipynb와 같은 주피터 노트북 파일을 생성하고, 코드 실행 결과까지 보여줍니다.
- 용어 설명:
- 데이터 전처리 (Data Preprocessing): 분석에 적합한 형태로 데이터를 가공하는 과정.
- 파생 변수 (Derived Variable): 기존 변수를 가공해 새로 만들어낸 변수. (예: 시도코드를 서울, 경기와 같은 시도명으로 변환)
3단계: 탐색적 데이터 분석(EDA) 및 시각화
Gemini CLI가 만들어준 주피터 노트북을 열어 분석 결과를 확인하고, 필요에 따라 추가 분석 및 시각화 코드를 요청합니다.
실행 방법
- 주피터 노트북 실행: Gemini CLI가 생성한 .ipynb 파일을 VS Code 등의 에디터에서 엽니다.
- 코드 확인 및 실행: 자동으로 생성된 코드(데이터 로드, 전처리 등)를 순서대로 실행합니다.
- 추가 분석 요청: 새로운 코드 셀을 만들고, VS Code의 Copilot이나 Gemini Code Assist를 사용하여 다음과 같이 요청합니다.
- 연령대와 성별에 따른 교차표를 만들고 막대 그래프로 시각화해 줘.
- 월별 처방 건수를 시각화하는 파이 차트 코드를 생성해 줘.
- 결과 확인: 요청한 내용에 대한 코드와 시각화 결과가 노트북에 추가됩니다.
- 용어 설명:
- 탐색적 데이터 분석 (Exploratory Data Analysis, EDA): 데이터를 본격적으로 분석하기 전에 데이터의 특징을 파악하는 과정.
- 시각화 (Visualization): 데이터를 그래프나 차트로 표현하여 한눈에 이해하기 쉽게 만드는 과정.
4단계: 분석 결과 보고서 작성
분석 결과를 바탕으로 최종 보고서를 작성하는 단계입니다. Gemini CLI를 활용해 기술 통계 결과를 포함한 보고서 초안을 만들 수 있습니다.
실행 방법
- 기술 통계 결과 복사: 주피터 노트북에서 수치형 변수 기술 통계, 범주형 변수 기술 통계 등 분석 결과를 복사합니다.
- Gemini CLI 호출: 터미널에서 gemini-cli를 실행합니다.
- 프롬프트 입력: 복사한 내용을 바탕으로 다음과 같이 보고서 작성을 요청합니다.
- 다음 기술 통계 결과를 바탕으로 분석 보고서를 마크다운 형식으로 작성해 줘.
- 결과 확인: Gemini CLI가 분석 결과를 요약하고 결론을 포함한 보고서를 작성해 줍니다.
- 용어 설명:
- 기술 통계 (Descriptive Statistics): 데이터의 특징(평균, 빈도 등)을 숫자로 요약하는 통계 기법.
3. 마무리: Gemini CLI와 다른 도구의 조합
Gemini CLI는 데이터 분석의 '기본 틀'을 빠르게 만들어주는 데 매우 효과적입니다. 하지만 세부적인 수정이나 추가 작업에는 다른 도구를 함께 사용하는 것이 좋습니다.
- Gemini CLI vs. Copilot/Gemini Code Assist:
- Gemini CLI: 전체 워크플로우를 자동화하는 데 적합합니다.
- Copilot/Gemini Code Assist: 주피터 노트북 내에서 특정 코드 셀을 수정하거나 새로운 코드를 추가할 때 효율적입니다.
참고문헌
- 유튜브 채널 '제미나이클로드AI스튜디오'의 '(563) 과금없이 에이전트 모드 넉넉하게 사용하고 싶다면? GEMINI CLI로 VSCode에서 주피터로 데이터 분석하기' 영상: https://www.youtube.com/watch?v=YSscvDczPn4
이 내용을 바탕으로 Gemini CLI를 사용해 직접 데이터 분석을 시도해 보세요. 혹시 궁금한 점이 있다면 언제든지 다시 물어봐 주세요!
'코딩' 카테고리의 다른 글
| 미쳤다.. 충격적인 챗GPT 자동 영어 학습법 및 실제 후기 (vs 제미나이) [스마트대디_SmartDaddy] (1) | 2025.09.12 |
|---|---|
| VSCode와 함께 써야 꿀조합 GEMINI CLI 그리고 Gemini Code Assist [오늘코드todaycode] (1) | 2025.09.11 |
| 상위 1% 고수들만 안다는 챗GPT의 숨은 기능 '3가지'ㅣ지식인초대석 EP.36 (김덕진 교수 1부) [지식인사이드] (1) | 2025.09.11 |
| '딸깍' 한번에 업무 시간 99% 줄어드는 AI 사용 꼼수ㅣ지식인초대석 EP.37 (김덕진 교수 2부) [지식인사이드] (1) | 2025.09.11 |
| 2025 인공지능 플랫폼 선택 가이드 - 유료사용자 기준 순위 (0) | 2025.09.11 |