Tokenization
토큰화 · AI가 문장을 작은 조각으로 나누어 처리하는 방식
개념
토큰화는 사람이 쓰는 문장을 AI가 처리할 수 있는 작은 단위로 쪼개는 과정입니다. AI는 문장을 통째로 읽지 않고 토큰이라는 조각 단위로 입력을 계산합니다. 예를 들어 하나의 한국어 문장도 모델 내부에서는 여러 조각으로 분해됩니다. 이 토큰 흐름을 기반으로 모델은 다음 단어를 예측하고 답변을 생성합니다.
실제 사례
기업용 챗봇에 회사 정책, 고객 기록, FAQ, 이전 상담 내역을 매번 전부 넣으면 토큰이 폭증합니다. 그 결과 응답 속도는 느려지고 비용은 올라갑니다. 에이전트 시스템에서는 로그, 툴 호출 결과, 이전 작업 기록까지 계속 오가기 때문에 토큰 최적화가 더 중요해집니다.
왜 앞으로 필수인가
AI 비용은 대부분 입력 토큰과 출력 토큰 기준으로 계산됩니다. 토큰을 모르면 AI 운영비, 컨텍스트 한계, RAG 비용, 에이전트 실행 비용을 이해하기 어렵습니다.