본문 바로가기
리뷰/도서

쉽고 빠르게 익히는 LLM

by Remover 2024. 2. 10.
반응형

 

이번에 리뷰하게 된 책은 쉽고 바르게 익히는 실전 LLM이라는 책이다.

ChatGPT, 구글 제미나이(Bard), 네이버 하이버클로바X 등 다양하게 서비스들이 많이 등장하고 있는 시점에 해당 내용을 다룬 책이라 재미있게 읽을 수 있었다.

 

책의 Part는 크게 3개로 나눠져있다.

- Part1. LLM 기본 소개

- Part2. LLM 활용

- Part3. LLM 고급

 

이 책은 다음과 같은 목표를 가지고 있다.

모델 선택, 데이터 형식, 파인튜닝 파라미터, 그리고 더 많은 것에 대해 가장 좋은 선택을 내릴 수 있도록 모델의 내부 작동 원리에 대한 충분한 통장력을 제공하는 동시에 모든 종류의 LLM을 실용적인 애플리케이션을 위해 어떻게 사용하고 훈련하며 최적화할지에 대한 방법을 안내하는 것

 

 

Part.1에서는 LLM에 대한 기본 소개를 해준다.

비전공자가 읽을 수 있도록 최대한 간단하면서도 자세하게 설명해주는 느낌을 받을 수 있었다.

BERT와 GPT 계열에 대한 차이점을 그림으로 설명해주니 이해하기가 더 쉬웠다.

 

Part.2에서 부터는 파인튜닝을 통해 LLM을 커스터마이징 할 수 있는 작업을 진행한다.

파인튜닝
LLM을 작업에 특화된 상대적으로 작은 크기의 데이터셋에서 훈련시켜, 특정 작업을 위한 파라미터를 조정하는 것

 

이러한 작업을 통해 원하는 카테고리에 대한 LLM을 만들 수 있고, 모델을 통해 서비스에 적용해볼 수 있지 않을까 하는 생각을 하게 되었다. 나중에 나에게 맞는 카테고리를 만들게 된다면 컴퓨터 혹은 게임에 대한 내용으로 만들고 싶다는 생각이 들었다.

 

Part.3 부터는 고급 LLM에 대해서 다루고 있다.

텍스트 처리 뿐 아니라 비전 트랜스포머를 통한 이미치 처리 등에 대해서 다룬다.

 

정리

LLM에 대한 정리들이 잘 되어 있는 책이다. Part.1에서 LLM에 대한 간단한 소개를 시작으로 활용, 고급에 대해서 다루고 있다. 뒤로 가면 갈수록 어려운 내용들이 많이 있지만 코드 제공을 통해 파인튜닝된 LLM을 만들어 볼 수 있다는 점에서 신기하고 재미있는 책이었다. 본인의 카테고리에 대해서 LLM을 파인튜닝하여 모델링 해보고 싶은 사람이 있다면 읽어보면 좋을 책이다.

 

한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다.

댓글