코딩

AI뉴스 - 새로운 이미지 1등, MCP 지원하는 ChatGPT 개발자 모드, 클로드 엑셀·PPT 생성, Veo 3 업데이트 등 [조코딩 JoCoding]

capstone012 2025. 9. 18. 08:13
반응형
SMALL

AI뉴스 - 새로운 이미지 1등, MCP 지원하는 ChatGPT 개발자 모드, 클로드 엑셀·PPT 생성, Veo 3 업데이트 등 [조코딩 JoCoding]

🤖 AI 뉴스 총정리: 이미지 AI부터 챗GPT 개발자 모드까지 최신 동향 완벽 분석

안녕하세요, AI 기술의 최신 소식을 빠르게 전해드립니다. 이번 글에서는 바이든스의 새로운 이미지 모델부터 챗GPT의 개발자 모드, 클로드의 문서 생성 기능 등 다양한 AI 기술 동향을 알기 쉽게 정리했습니다.


목차

  1. 중국 AI의 약진: 이미지 생성 모델 C-Dream 4.0
    • 구글 '나노 바나나'를 넘어선 성능
    • 효율성을 높인 AI 모델들
  2. 오픈AI와 앤스로픽의 혁신
    • 챗GPT 개발자 모드: MCP(Multi-Channel Protocol) 지원
    • 클로드(Claude)의 문서 생성 및 편집 기능
  3. 구글의 AI 서비스 업데이트
    • 유튜브 AI 더빙 공식 출시
    • Veo 3: 세로형 영상 지원 및 가격 인하
    • 제미나이의 폭발적인 인기 상승
  4. 꼭 알아야 할 AI 용어

1. 중국 AI의 약진: 이미지 생성 모델 C-Dream 4.0

바이트댄스(ByteDance)에서 새로운 이미지 생성 AI 모델인 C-Dream 4.0을 공개했습니다. 이 모델은 AI 성능 평가 기관인 '아티피셜 아날리시스'의 리더보드에서 구글의 제미나이 2.5 플래시(나노 바나나)를 제치고 종합 1위를 차지하며 큰 주목을 받고 있습니다.

  • 용어 설명
    • 리더보드(Leaderboard): AI 모델의 성능을 다양한 기준으로 평가하여 순위를 매기는 표.
    • 바이트댄스(ByteDance): 중국의 IT 기업으로, 숏폼 영상 플랫폼 '틱톡(TikTok)'의 모회사입니다.

💡 따라 할 수 있는 실행 가능 영역

💻 C-Dream 4.0 모델 사용해보기

  1. 접속: AI 생성 API 서비스인 FileAI에 접속합니다.
  2. 모델 선택: C-Dream 4.0 모델을 선택합니다.
  3. 프롬프트 입력: 원하는 이미지에 대한 설명을 입력하고 이미지를 생성해 봅니다. (이미지당 0.03달러의 비용이 발생합니다.)

2. 오픈AI와 앤스로픽의 혁신

챗GPT 개발자 모드: MCP 지원

오픈AI는 챗GPT 개발자 모드를 공개하며 **MCP(Multi-Channel Protocol)**를 직접 지원하기 시작했습니다. 이는 챗GPT를 다른 서비스와 쉽게 연결하여 다양한 작업을 수행할 수 있도록 돕는 기능입니다.

  • 용어 설명
    • MCP(Multi-Channel Protocol): 여러 채널을 연결하여 음성, 텍스트, 이미지 등 다양한 방식으로 소통할 수 있게 해주는 기술. 예를 들어, AI가 전화를 받거나 다른 앱의 기능을 실행할 수 있게 됩니다.

💡 따라 할 수 있는 실행 가능 영역

💻 챗GPT 개발자 모드 활성화하기

  1. 접속: ChatGPT에 로그인합니다.
  2. 설정 변경: '설정(Settings)' > '개발자 모드(Developer Mode)'로 이동하여 기능을 켭니다.
  3. MCP 연결: '커넥터(Connectors)' 메뉴에서 외부 MCP를 연결하여 챗GPT를 활용한 에이전트 서비스를 만들 수 있습니다.

클로드(Claude)의 문서 생성 및 편집 기능

앤스로픽(Anthropic)의 AI 모델인 **클로드(Claude)**는 이제 엑셀, 파워포인트, PDF 등 다양한 형식의 문서를 직접 생성하고 편집할 수 있는 기능을 추가했습니다. 사용자가 요청하면 클라우드 내의 안전한 서버 환경에서 코드를 실행하여 문서 파일을 만들어 제공합니다.


3. 구글의 AI 서비스 업데이트

유튜브 AI 더빙 공식 출시

구글은 유튜브에 AI 다국어 더빙 기능을 공식 출시했습니다. 이제 일부 채널에서는 외국 영상을 시청할 때 AI가 생성한 한국어 더빙을 들을 수 있습니다.

💡 따라 할 수 있는 실행 가능 영역

💻 유튜브 AI 더빙 사용해보기

  1. 접속: AI 다국어 더빙이 적용된 유튜브 영상 페이지에 접속합니다. (일부 채널에 한해 지원)
  2. 설정 변경: 영상 플레이어의 '설정' 아이콘을 클릭합니다.
  3. 오디오 변경: '오디오 트랙' 메뉴에서 한국어 또는 다른 언어 더빙을 선택하여 시청합니다.

Veo 3: 세로형 영상 지원 및 가격 인하

구글의 영상 생성 AI Veo 3가 업데이트되었습니다. 이제 숏폼에 최적화된 세로형 영상을 만들 수 있으며, 영상 생성 가격도 대폭 인하되었습니다.

  • 가격 인하: 1초당 0.75달러에서 0.4달러(Veo 3), 0.15달러(Veo 3 Fast)로 저렴해졌습니다.

제미나이의 폭발적인 인기 상승

최근 구글의 제미나이는 '나노 바나나' 모델 출시 이후 검색량이 급증하며 챗GPT를 앞지르는 현상까지 나타나고 있습니다. 이는 가볍고 효율적인 모델의 대중적 성공 사례를 보여줍니다.


4. 꼭 알아야 할 AI 용어

  • LLM(Large Language Model): 대규모 데이터를 학습하여 사람처럼 언어를 이해하고 생성하는 AI 모델. (예: 챗GPT, 제미나이, 클로드)
  • API(Application Programming Interface): 응용 프로그램에서 사용할 수 있도록 다른 서비스나 프로그램의 기능을 제공하는 인터페이스. 개발자들은 이를 통해 AI 모델을 자신의 서비스에 쉽게 적용할 수 있습니다.

참고문헌

 

 

🤖 AI 뉴스 총정리: 이미지 AI부터 챗GPT 개발자 모드까지 최신 동향 완벽 분석

안녕하세요, AI 기술의 최신 소식을 빠르게 전해드립니다. 이번 글에서는 바이든스의 새로운 이미지 모델부터 챗GPT의 개발자 모드, 클로드의 문서 생성 기능 등 다양한 AI 기술 동향을 알기 쉽게 정리했습니다.


목차

  1. 중국 AI의 약진: 이미지 생성 모델 C-Dream 4.0
    • 구글 '나노 바나나'를 넘어선 성능
    • 효율성을 높인 AI 모델들
  2. 오픈AI와 앤스로픽의 혁신
    • 챗GPT 개발자 모드: MCP(Multi-Channel Protocol) 지원
    • 클로드(Claude)의 문서 생성 및 편집 기능
  3. 구글의 AI 서비스 업데이트
    • 유튜브 AI 더빙 공식 출시
    • Veo 3: 세로형 영상 지원 및 가격 인하
    • 제미나이의 폭발적인 인기 상승
  4. 꼭 알아야 할 AI 용어

1. 중국 AI의 약진: 이미지 생성 모델 C-Dream 4.0

바이트댄스(ByteDance)에서 새로운 이미지 생성 AI 모델인 C-Dream 4.0을 공개했습니다. 이 모델은 AI 성능 평가 기관인 '아티피셜 아날리시스'의 리더보드에서 구글의 제미나이 2.5 플래시(나노 바나나)를 제치고 종합 1위를 차지하며 큰 주목을 받고 있습니다.

  • 용어 설명
    • 리더보드(Leaderboard): AI 모델의 성능을 다양한 기준으로 평가하여 순위를 매기는 표.
    • 바이트댄스(ByteDance): 중국의 IT 기업으로, 숏폼 영상 플랫폼 '틱톡(TikTok)'의 모회사입니다.

💡 따라 할 수 있는 실행 가능 영역

💻 C-Dream 4.0 모델 사용해보기

  1. 접속: AI 생성 API 서비스인 FileAI에 접속합니다.
  2. 모델 선택: C-Dream 4.0 모델을 선택합니다.
  3. 프롬프트 입력: 원하는 이미지에 대한 설명을 입력하고 이미지를 생성해 봅니다. (이미지당 0.03달러의 비용이 발생합니다.)

2. 오픈AI와 앤스로픽의 혁신

챗GPT 개발자 모드: MCP 지원

오픈AI는 챗GPT 개발자 모드를 공개하며 **MCP(Multi-Channel Protocol)**를 직접 지원하기 시작했습니다. 이는 챗GPT를 다른 서비스와 쉽게 연결하여 다양한 작업을 수행할 수 있도록 돕는 기능입니다.

  • 용어 설명
    • MCP(Multi-Channel Protocol): 여러 채널을 연결하여 음성, 텍스트, 이미지 등 다양한 방식으로 소통할 수 있게 해주는 기술. 예를 들어, AI가 전화를 받거나 다른 앱의 기능을 실행할 수 있게 됩니다.

💡 따라 할 수 있는 실행 가능 영역

💻 챗GPT 개발자 모드 활성화하기

  1. 접속: ChatGPT에 로그인합니다.
  2. 설정 변경: '설정(Settings)' > '개발자 모드(Developer Mode)'로 이동하여 기능을 켭니다.
  3. MCP 연결: '커넥터(Connectors)' 메뉴에서 외부 MCP를 연결하여 챗GPT를 활용한 에이전트 서비스를 만들 수 있습니다.

클로드(Claude)의 문서 생성 및 편집 기능

앤스로픽(Anthropic)의 AI 모델인 **클로드(Claude)**는 이제 엑셀, 파워포인트, PDF 등 다양한 형식의 문서를 직접 생성하고 편집할 수 있는 기능을 추가했습니다. 사용자가 요청하면 클라우드 내의 안전한 서버 환경에서 코드를 실행하여 문서 파일을 만들어 제공합니다.


3. 구글의 AI 서비스 업데이트

유튜브 AI 더빙 공식 출시

구글은 유튜브에 AI 다국어 더빙 기능을 공식 출시했습니다. 이제 일부 채널에서는 외국 영상을 시청할 때 AI가 생성한 한국어 더빙을 들을 수 있습니다.

💡 따라 할 수 있는 실행 가능 영역

💻 유튜브 AI 더빙 사용해보기

  1. 접속: AI 다국어 더빙이 적용된 유튜브 영상 페이지에 접속합니다. (일부 채널에 한해 지원)
  2. 설정 변경: 영상 플레이어의 '설정' 아이콘을 클릭합니다.
  3. 오디오 변경: '오디오 트랙' 메뉴에서 한국어 또는 다른 언어 더빙을 선택하여 시청합니다.

Veo 3: 세로형 영상 지원 및 가격 인하

구글의 영상 생성 AI Veo 3가 업데이트되었습니다. 이제 숏폼에 최적화된 세로형 영상을 만들 수 있으며, 영상 생성 가격도 대폭 인하되었습니다.

  • 가격 인하: 1초당 0.75달러에서 0.4달러(Veo 3), 0.15달러(Veo 3 Fast)로 저렴해졌습니다.

제미나이의 폭발적인 인기 상승

최근 구글의 제미나이는 '나노 바나나' 모델 출시 이후 검색량이 급증하며 챗GPT를 앞지르는 현상까지 나타나고 있습니다. 이는 가볍고 효율적인 모델의 대중적 성공 사례를 보여줍니다.


4. 꼭 알아야 할 AI 용어

  • LLM(Large Language Model): 대규모 데이터를 학습하여 사람처럼 언어를 이해하고 생성하는 AI 모델. (예: 챗GPT, 제미나이, 클로드)
  • API(Application Programming Interface): 응용 프로그램에서 사용할 수 있도록 다른 서비스나 프로그램의 기능을 제공하는 인터페이스. 개발자들은 이를 통해 AI 모델을 자신의 서비스에 쉽게 적용할 수 있습니다.

참고문헌

 

 

 

🚀 2025년 최신 AI 뉴스: 새로운 이미지 생성 1위 모델부터 ChatGPT MCP 지원까지

📋 목차

  1. ByteDance C-Dream 4.0 - 새로운 이미지 생성 챔피언
  2. 중국 AI의 급속한 성장
  3. ChatGPT 개발자 모드와 MCP 지원
  4. Claude의 파일 생성 혁신
  5. Google AI 생태계 업데이트
  6. 특별 이벤트 안내

1. ByteDance C-Dream 4.0 - 새로운 이미지 생성 챔피언 {#1-bytedance-cdream}

🏆 압도적인 성능, 새로운 1등

ByteDance(TikTok 모회사)가 출시한 C-Dream 4.0 (코드명: DH3)이 이미지 생성 AI 분야에서 새로운 왕좌에 올랐습니다.

📊 성능 비교

<div style="background-color: #e6ffe6; border: 2px solid #00cc00; padding: 20px; margin: 20px 0; border-radius: 8px;">

Artificial Analysis 리더보드 결과:

  • 🥇 C-Dream 4.0 - 1위
  • 🥈 Google Gemini 2.5 Flash (나노바나) - 2위
  • 🥉 기타 모델들

주목할 점: 이미지 에디팅 부문에서는 여전히 Gemini 2.5 Flash와 근소한 차이

</div>

💰 가격 비교

  • C-Dream 4.0: $0.03 per image
  • Gemini 2.5 Flash: $0.039 per image
  • 약 23% 더 저렴한 가격

🛠️ C-Dream 4.0 사용 방법

<div style="background-color: #f0f7ff; border-left: 4px solid #0066cc; padding: 15px; margin: 20px 0;">

Step 1: API 플랫폼 접속

  1. Fal.ai 접속
  2. C-Dream 4.0 모델 선택
  3. API 키 발급

Step 2: 이미지 생성

 
 
python
# 예제 코드
import fal

client = fal.Client(api_key="YOUR_API_KEY")
result = client.run(
    "cdream-4.0",
    prompt="코딩하는 남자의 사진",
    style="realistic"
)

Step 3: 이미지 에디팅

  • 옷 갈아입히기
  • 배경 변경
  • 스타일 전환

</div>

⚠️ 현재 한계점

  • 얼굴 디테일 보존이 Gemini 2.5 Flash 대비 약간 부족
  • 한국어 프롬프트 지원 제한적

2. 중국 AI의 급속한 성장 {#2-china-ai-growth}

💸 인재 영입 전쟁

<div style="background-color: #fff3cd; border-left: 4px solid #ffc107; padding: 15px; margin: 20px 0;">

충격적인 사실:

  • OpenAI 연구원이 200억원 보상받고 Tencent로 이직
  • 실리콘밸리의 최첨단 기술 지식 중국으로 이전
  • 글로벌 AI 인재 경쟁 심화

</div>

🚀 주요 중국 AI 모델들

1. Baidu X1.1

  • GPT-4.5 기반 모델
  • 특정 분야에서 GPT-5, Gemini 2.5 능가
  • 벤치마크 점수: DeepSeek R1 대비 우위

2. HunNext 80B

  • 매개변수: 80B (실제 사용: 3B)
  • 특징:
    • Qwen 32B와 유사한 성능
    • 학습 비용 90% 절감
    • MoE 구조 (Mixture of Experts) 활용

🌍 글로벌 확산: UAE의 도전

Falcon K2 Sync

  • 개발: UAE 기술투자청
  • 특징:
    • 32B 파라미터로 GPT-5급 성능
    • 오픈소스 공개
    • 수학/코딩/과학 분야 최상위 성능

3. ChatGPT 개발자 모드와 MCP 지원 {#3-chatgpt-mcp}

🔧 드디어 ChatGPT에서도 MCP 지원!

MCP (Model Context Protocol): AI와 외부 도구를 연결하는 표준 프로토콜

<div style="background-color: #ffe6e6; border: 2px solid #cc0000; padding: 20px; margin: 20px 0; border-radius: 8px;">

ChatGPT에서 MCP 설정 방법:

  1. ChatGPT 설정 접속
    • ChatGPT 웹/앱 열기
    • Settings → Advanced Settings
  2. 개발자 모드 활성화
    • "Developer Mode" 토글 ON
    • "Connectors" 메뉴 확인
  3. 외부 MCP 연결
 
 
json
   {
     "mcp_servers": {
       "your-server": {
         "url": "https://your-mcp-server.com",
         "api_key": "YOUR_API_KEY"
       }
     }
   }
  1. 테스트 및 사용
    • 연결 상태 확인
    • MCP 도구 호출 테스트

</div>

🆕 GPT-5의 새로운 버전 루머

발견된 모델명: GPT-5-high-new

  • Codex에서 발견
  • 코딩 특화 버전으로 추정
  • 공식 발표 대기 중

4. Claude의 파일 생성 혁신 {#4-claude-files}

📄 직접 파일 생성 및 편집 기능

Claude가 이제 실제 파일을 만들고 편집할 수 있습니다!

지원 파일 형식

  • 📊 Excel (.xlsx)
  • 📑 PowerPoint (.pptx)
  • 📄 PDF
  • 📝 Word (.docx)

🔬 기술적 배경

<div style="background-color: #f0f7ff; border-left: 4px solid #0066cc; padding: 15px; margin: 20px 0;">

서버 사이드 컨테이너 환경:

  • OS: Ubuntu 24.04
  • Python: 3.12
  • Node.js: 18.19
  • 실시간 코드 실행 가능

</div>

💻 Claude 파일 생성 활용법

<div style="background-color: #e6ffe6; border: 2px solid #00cc00; padding: 20px; margin: 20px 0; border-radius: 8px;">

실습 예제: PPT 만들기

  1. Claude 접속 및 설정
    • Claude.ai 로그인
    • Settings → Features
    • "Upgrades: Files & Analysis" 활성화
  2. PPT 생성 요청
 
 
   "조코딩에 대한 소개 PPT를 만들어줘. 
   5장 분량으로 구성하고, 
   주요 콘텐츠와 채널 정보를 포함해줘."
  1. 결과물 다운로드
    • 생성된 파일 미리보기
    • Download 버튼 클릭
    • 로컬에서 편집 가능

</div>

🚀 활용 가능성

  • 보고서 자동 생성
  • 데이터 분석 결과 문서화
  • 프레젠테이션 초안 작성
  • 엑셀 데이터 처리 자동화

5. Google AI 생태계 업데이트 {#5-google-updates}

🎬 Veo 3 주요 업데이트

1. 세로형 영상 지원

  • 9:16 비율 (쇼츠/릴스용)
  • 1:1 정사각형
  • 16:9 기존 가로형

2. 대폭 인하된 가격

<div style="background-color: #fff3cd; border-left: 4px solid #ffc107; padding: 15px; margin: 20px 0;">

가격 변화 (1초당):

  • Veo 3 Standard: $0.75 → $0.40 (47% 인하)
  • Veo 3 Fast: $0.30 → $0.15 (50% 인하)

</div>

📈 Gemini의 급성장

검색 트렌드 분석:

  • 나노바나 출시 후 검색량 급증
  • 일부 지역에서 ChatGPT 검색량 추월
  • App Store 1위 달성

🎙️ YouTube AI 더빙 공식 출시

<div style="background-color: #f0f7ff; border-left: 4px solid #0066cc; padding: 15px; margin: 20px 0;">

YouTube Studio에서 AI 더빙 설정:

  1. YouTube Studio 접속
  2. 콘텐츠 → 원하는 동영상 선택
  3. 더빙 → 언어 추가
  4. AI 더빙 활성화
  5. 처리 완료 후 확인

참고: 현재 무료이나 향후 유료화 가능성 있음

</div>

🔮 Gemini 3.0 루머

  • "Gemini 3.0 Flash가 현재 Pro 모델보다 성능 우수"
  • 차세대 경량 모델이 현재 고성능 모델 능가 예상

6. 특별 이벤트 안내 {#6-special-event}

🎯 OpenAI 최초 한국인 입사자와의 라이브

<div style="background-color: #ffe6e6; border: 2px solid #cc0000; padding: 20px; margin: 20px 0; border-radius: 8px;">

📅 일시: 2025년 9월 18일 (목) 저녁 7시

🎤 게스트: 김태우 님

  • OpenAI 최초 한국인 입사자
  • GPT-3 개발 핵심 멤버
  • Jeff Dean, John Schulman 추천

📝 주요 내용:

  • OpenAI 내부 이야기
  • Sam Altman 저택설의 진실
  • GPT-3 개발 비화
  • AI 연구의 최전선

🔔 참여 방법: YouTube 알림 설정 필수!

</div>


📚 참고 자료 및 링크

공식 문서 및 플랫폼

API 및 개발 자료

오픈소스 모델

추천 영상


💡 용어 설명

  • 파라미터(Parameter): AI 모델의 학습 가능한 변수의 수. 많을수록 복잡한 패턴 학습 가능
  • MoE (Mixture of Experts): 여러 전문가 모델을 결합하여 효율성을 높이는 기술
  • 벤치마크(Benchmark): AI 성능을 측정하는 표준화된 테스트
  • 컨테이너(Container): 격리된 실행 환경을 제공하는 가상화 기술
  • API (Application Programming Interface): 프로그램 간 통신을 위한 인터페이스
  • 더빙(Dubbing): 원본 음성을 다른 언어로 교체하는 작업

🎯 핵심 요약

  1. C-Dream 4.0이 이미지 생성 AI 새로운 1위 등극
  2. ChatGPT가 드디어 MCP 지원 시작
  3. Claude가 실제 파일 생성/편집 기능 추가
  4. Veo 3 가격 50% 인하 및 세로형 영상 지원
  5. 중국 AI의 빠른 성장과 인재 영입 경쟁 심화
반응형
LIST