본문 바로가기
320x100
320x100

"한빛미디어 서평단 <나는리뷰어다> 활동을 위해서 책을 협찬 받아 작성된 서평입니다."

제대로 시작하는 챗GPT와 AI활용 with 파이썬

 

 

 

제대로 시작하는 챗GPT와 AI 활용 with 파이썬

파이썬으로 배우는AI와 챗GPT 활용법! 매혹적인 인공지능의 세계를 탐험하며 실제 문제를 해결해 보세요

www.hanbit.co.kr

 

책 정보

OpenAI의 ChatGPT, DALL-E, Whiper 등 여러 도구(라이브러리)를 파이썬 코드를 사용해서 여러가지 AI/ML를 실습해볼 수 있는 책입니다. 챗봇, 시맨틱 검색 엔진, 분류 시스템, 추천 엔진 등 다양한  자연어/이미지/음성 처리 플랫폼을 구축하고자 한다면 이 책이 실질적인 도움을 줄 것입니다.

 

- 출간: 2025년 3월 24일

- 페이지: 504쪽

- 난이도: 초중급

 

목차

[PART 1 오픈AI와 챗GPT 제대로 이해하기]

더보기

1장 생성형 AI 서비스
_1.1 생성형 AI 개요 
_1.2 대표적인 생성형 AI 서비스

 

2장 오픈AI와 챗GPT
_2.1 오픈AI와 챗GPT 개요 
_2.2 GPT 모델 및 사용 사례

 

3장 개발 사전 준비
_3.1 구글 코랩 사용 방법 
_3.2 API 개요 
_3.3 오픈AI API 키 얻기 
_3.4 오픈AI API 키 활용 실습 
_3.5 API 사용량 및 요금 확인

 

4장 오픈AI API 활용 첫걸음
_4.1 GPT-4o mini로 시작하는 대화 생성 
_4.2 system, user, assistant 역할의 기본 이해 
_4.3 퓨샷 학습 소개 
_4.4 GPT 모델을 활용한 맞춤형 출력 생성 
_4.5 대화 출력 길이 제어 
_4.6 AI 응답 제어

 

5장 오픈AI API 모델 탐색하기
_5.1 사용 가능 모델 확인 및 소개 
_5.2 사용할 모델 선택 
_5.3 오픈AI 모델 시리즈 
_5.4 오픈AI 모델 가격 
_5.5 오픈AI 모델의 발전과 선택 가이드

 

[PART 2 오픈AI GPT 대화 생성 실전 가이드]

더보기

6장 대화 생성의 고급 기술
_6.1 창의성 조절 기법 
_6.2 페널티로 독창성과 다양성 확보하기 
_6.3 n 파라미터로 여러 응답 생성하기 
_6.4 실시간 스트리밍으로 즉시 출력하기

 

7장 GPT 모델의 성능을 극대화하는 프롬프트 엔지니어링 기법
_7.1 프롬프트 엔지니어링 개요 
_7.2 퓨샷 학습: 키워드 추출 성능 높이기 
_7.3 프롬프트 체이닝: 트윗 생성 최적화하기 
_7.4 일반 지식 프롬프팅: 올드 스쿨 랩 가사 완성하기 
_7.5 문맥 채우기: AI의 이해도 높이기 
_7.6 동적 토큰 제어: AI 응답 길이 유연하게 조절하기 
_7.7 프롬프트 템플릿 최적화: 리눅스 학습용 CLI 어시스턴트 개발하기 
_7.8 다음으로 나아가기

 

[PART 3 음성 및 이미지 인식: 위스퍼와 CLIP의 실전 활용]

더보기

8장 위스퍼 음성 인식 기초
_8.1 위스퍼 개요 
_8.2 위스퍼 설치 방법 및 기본 예제 
_8.3 파이썬에서 위스퍼 SDK 사용하기

 

9장 위스퍼 텍스트 변환 최적화 기법
_9.1 오픈AI 음성-텍스트 API 사용하기 
_9.2 위스퍼 텍스트 변환 개선하기

 

10장 오픈AI TTS를 활용한 음성 변환
_10.1 오픈 AI TTS 소개 
_10.2 오픈 AI TTS 사용 방법

 

11장 오픈AI CLIP을 사용한 이미지 분류
_11.1 CLIP 소개 
_11.2 CLIP 사용 방법 
_11.3 이미지를 텍스트로 변환하기

 

[PART 4 생성형 AI를 활용한 이미지 제작과 편집 기술]

더보기

12장 DALL·E로 이미지 생성하기
_12.1 DALL·E 소개 
_12.2 프롬프트 기반의 이미지 생성 기본 예제 
_12.3 다른 크기의 이미지 생성하기 
_12.4 여러 이미지 생성하기 
_12.5 이미지 프롬프트 개선 방법 
_12.6 프롬프트 조합으로 다양한 랜덤 이미지 만들기

 

13장 DALL·E로 이미지 편집하기
_13.1 이미지 편집 예제

 

14장 다른 이미지에서 영감 얻기
_14.1 이미지 변형 방법 
_14.2 이미지 변형 사용 사례

 

[PART 5 임베딩: 복잡한 데이터를 쉽게 이해하는 방법]

더보기

15장 임베딩 소개
_15.1 임베딩의 의미 
_15.2 임베딩 사용 사례

 

16장 텍스트 임베딩 활용 방법
_16.1 텍스트 임베딩의 핵심 이해하기 
_16.2 다중 입력 사용 예제 
_16.3 사용자의 의도를 읽어내는 시맨틱 검색 
_16.4 코사인 유사도 쉽게 이해하기 
_16.5 오픈AI 텍스트 임베딩 사용 예제 
_16.6 임베딩의 내부 작동 원리

 

17장 고급 임베딩 예제
_17.1 선호하는 커피 예측하기 
_17.2 퍼지 검색으로 더 유연한 커피 검색 구현하기 
_17.3 제로샷 분류기로 뉴스 기사 분류하기 
_17.4 제로샷 분류기의 정밀도 평가 
_17.5 제로샷 분류기의 정밀도 활용 예시

 

[PART 6 파인 튜닝과 모델의 실전 활용]

더보기

18장 퓨샷 학습 이해하기
_18.1 퓨샷 학습의 기본 개념과 정의 
_18.2 파인 튜닝으로 퓨샷 학습 성능 향상하기

 

19장 파인 튜닝의 이해 및 구현
_19.1 파인 튜닝 실제 적용
_19.2 파인 튜닝 최적화

 

20장 파인 튜닝 고급 예제: 정신 건강 코치
_20.1 예제에서 사용한 데이터셋 
_20.2 데이터셋 준비하기 
_20.3 실제 애플리케이션에서 발생할 수 있는 한계

 

21장 기억력 및 문맥 문제와 해결책
_21.1 GPT의 기억력 및 문맥 문제 
_21.2 문맥 유지의 중요성 
_21.3 대화 문맥 유지의 해법: 대화 이력 추가 
_21.4 대화 이력 관리의 문제점 
_21.5 후입선출 방식으로 최신 문맥 유지하기 
_21.6 후입선출 메모리의 한계 
_21.7 선택적 문맥으로 최적의 대화 문맥 선택하기

[PART 7 부록]

더보기

부록 A 챗GPT 및 클로드 실습
_A.1 코딩 공부에 활용하기 
_A.2 유튜브 영상에서 텍스트를 추출하고 요약하기 
_A.3 간단한 고객 데이터 분석 수행하기 
_A.4 맞춤형 GPT 소개 및 구현

 

부록 B 오픈AI 플레이그라운드 실습
_B.1 오픈AI 플레이그라운드 소개 
_B.2 취업 진로 상담하기 
_B.3 이모지 만들기 
_B.4 웹 페이지 작성하기

 

부록 C 건강 상담 챗봇 구현하기
_C.1 스트림릿으로 간단한 웹 앱 서비스 구현하기 
_C.2 건강 상담 챗봇 웹 서비스 구현하기

 

부록 D 작가 스타일 이미지 생성 앱
_D.1 풍경화 이미지 생성하기 
_D.2 특정 작가 스타일의 이미지 생성하기

 

부록 E RAG로 노트북 추천받기
_E.1 RAG 소개 
_E.2 RAG 실습

 

부록 F 오토젠을 활용한 AI 에이전트 이해하기
_F.1 오토젠 소개 
_F.2 멀티 에이전트 활용 실습

 

 

독서&실습

이번에 읽은 책은 제대로 시작하는 챗GPT와 AI활용 with 파이썬입니다.

독서

GPT 정의
AI API 종류
OpenAI API Model

저는 ChatGPT, Perplexity, Claude, Gemini, Clova-x 등을 사용해봤었는데 주로 ChatGPT를 사용합니다.

GPT가 LLM을 기반으로 만들어졌다는 사실은 알고 있었습니다.

하지만! GPT가 왜 GPT일까에 대해서 생각해본 적은 없었는데... Generative Pre-trained Transformer(생성형 사전 학습 트랜스포머)의 뜻을 갖고 있는 것은 몰랐습니다.

추가로 GPT-4o, GPT o4-mini, GPT o4-mini-high에 대해서 어떤 차이점이 있었는지 자세하게 알지 못했었고, 왜 o란 스펠링이 붙었는지도 몰랐는데 omni(모든, 어디서나)라는 의미였는지도 이 책을 통해 알게됐습니다!

역시 이름이 가진 의미를 해석만 해도 반은 넘었다는 것을 깨달았습니다..ㅎㅎ

 

실습

OpenAI Developer Platform에서 결제카드를 등록 후 API Key를 발급받아서 실습을 진행할 수 있었습니다.

 

코드 실행 환경은 구글 코랩(Google Colab), Pycharm Professional, IntelliJ Ultimate 등을 사용했습니다.

맨 처음 시작은 Colab으로 시작했지만 애용하던 Jetbrains의 IDEA에서도 실행이 가능하다는 것을 깨닫고는 집에서는 Pycharm을 사용하고, 들고다니는 맥북에서는 IntelliJ를 사용했습니다.

시 짓기
랩 가사 만들기
Whisper 모델
CPU 사용 AI 모델 실행 & btop 모니터링

간단한 시 짓기, 배경 지식 제공 후 랩 가사 생성, 음성 -> 텍스트 변환, CPU를 사용하고 btop으로 모니터링 등을 해봤습니다.

추후에 조금의 코드 수정이 필요하지만 M시리즈 Mac에서 CPU 대신 MPS를 사용할 수도 있다는 사실 또한 알았습니다.

 

CLIP 1
CLIP 2
CLIP & TTS

CLIP 모델을 사용하여 이미지를 분석하기도 하고, TTS voice model을 사용하여 여러 음성을 만들어봤습니다.

 

DALL-E
반 고흐 스타일의 그림1
반 고흐 스타일의 그림2

예제를 조금 수정해서 txt파일에서 작가 스타일을 선택할 수 있도록 함수로 모듈화를 진행하고 반 고흐 스타일을 선택해서 만든 그림 2개

 

실패작

종종 이런 이상한.... 그림도 만들어주기도 하였습니다..ㅋㅋ DALL-E 사용 예제가 무조건 성공적이었던것만은 아닌 사실!!

 

왼쪽(기존) 그림으로 오른쪽(새로운 3개 그림)

왼쪽 그림을 바탕으로 우측 3개 그림을 재생성한 모습

 

작성한 여러 코드들

이후로 임베딩/고급 임베딩, 파인 튜닝, 퓨샷, 챗봇 코치, GPT의 한계(기억력 문제)와 해결법, RAG, AI 에이전트 등에 대해 실습하며 AI의 발전에 놀라며 여러가지 재미있는 코드 실습을 진행했습니다!!

 

사용 비용

 

총평

처음 책 소개와 목차를 봤을 때 실습 위주의 책일 것 같았고, 그래서 더 흥미롭게 느껴졌습니다.

실제로 책을 펼쳐보니, 어려운 AI의 이론보다는 코드를 통해 직접 결과물을 빠르게 볼 수 있게 구성이 되어 있어서 좋았습니다.

AI와 거리가 멀었던 백엔드 개발자로서 GPT model의 종류 선택, GPT에 주로 쓰이는 파라미터명, 적절한 API 사용 및 활용 방법, 애플리케이션 활용 등에 대해서 학습할 수 있었습니다.

더 나아가 개인 프로젝트 또는 팀 프로젝트를 하게 된다면 저 또는 팀원이 "이러한 결과물을 만드는 AI를 써보고 싶은데......"라고 한다면 곧바로 "이러한 GPT 모델을 쓰면 될 것 같은데요? 정확도 및 창의성은 이러한 파라미터를 쓰면 될 것 같고, 무제한으로 토큰을 보내면 비용 및 성능의 과부하로 이어지니깐 limit을 이 파라미터를 통해서 줄 수 도 있습니다." 라고 말 할 수 있을 것 같습니다.

이 책을 통해 좋은 프롬프트 엔지니어링 기법을 익힐 수 있었고, AI 활용에 대한 자신감을 얻었습니다.

2025년 현재 우리는 대 AI의 시대에 살아가고 있고, 이 물결은 더욱 더 가속화 될 것이라고 생각합니다.

지금이라도 한 발 더 빨리 [제대로 시작하는 챗GPT와 AI활용 with 파이썬] 책과 함께 그 물결 위에서도 흔들림 없이 견딜 수 있는 나만의 배를 만들어보는 것은 어떨까요?

320x100

댓글