LLM

AI

방대한 텍스트 코퍼스로 사전 학습된 트랜스포머 기반 언어 모델. 문맥에 따른 다음 토큰을 확률적으로 생성한다.

동의어: Large Language Model, 대규모 언어 모델

정의

LLM(Large Language Model)은 수십억~수조 개의 매개변수를 가진 트랜스포머 아키텍처 기반 언어 모델이다. 대규모 텍스트 코퍼스로 사전 학습된 뒤, 입력 문맥에 이어질 다음 토큰을 확률 분포로 예측한다.

특징

문맥 기반 생성 — 이전 토큰의 연속으로 다음 토큰을 결정
범용성 — 별도 학습 없이 프롬프트만으로 다양한 작업 수행(요약, 번역, 추론, 코드 생성 등)
확률적 — 같은 입력이어도 실행마다 결과가 달라질 수 있음(temperature, top_p 등으로 제어)

ai-agent와의 관계

LLM은 Agent의 “두뇌” 역할을 한다. Agent는 LLM의 추론 능력을 루프·도구·메모리와 결합해 단일 LLM 호출로는 불가능한 복합 작업을 수행한다.

참고 자료

Attention Is All You Need ↗

관련 용어