Question 1

토큰 수가 정확한가요?

Accepted Answer

지원하는 모델에 대해서는 정확합니다. 이 도구는 OpenAI의 GPT-4o, GPT-4, GPT-3.5 모델이 내부적으로 사용하는 것과 동일한 실제 토크나이저(BPE)를 사용합니다. '글자 수 나누기 4'와 같은 근사값이 아닙니다.

Question 2

모델을 바꾸면 토큰 수가 달라지는 이유는 무엇인가요?

Accepted Answer

GPT-4o와 GPT-4o mini는 o200k_base 인코딩을, GPT-4와 GPT-3.5는 cl100k_base 인코딩을 사용합니다. 이 두 인코딩은 어휘가 달라서 같은 텍스트도 다르게 분할되어 토큰 수가 달라질 수 있습니다.

Question 3

Claude나 Gemini의 토큰 수도 알 수 있나요?

Accepted Answer

아니요. 이 도구는 OpenAI GPT 모델(GPT-4o, GPT-4, GPT-3.5)만 지원합니다. Claude, Gemini 등 다른 모델은 각자의 전용 토크나이저를 사용하므로, 이 도구의 수치는 해당 모델에 적용되지 않습니다.

Question 4

입력한 텍스트가 서버로 전송되나요?

Accepted Answer

아니요. 토크나이저 라이브러리는 페이지에 번들로 포함되어 있으며 브라우저에서만 실행됩니다. 텍스트는 기기를 떠나지 않으며 업로드되거나 저장되지 않습니다.

Question 5

한국어, 중국어, 일본어가 토큰을 더 많이 소비하는 이유는?

Accepted Answer

BPE 토크나이저는 텍스트를 서브워드 단위로 분할합니다. 라틴 문자는 더 효율적으로 인코딩되는 반면, CJK 문자는 글자당 더 많은 토큰을 소비하는 경향이 있습니다. 최신 o200k_base(GPT-4o) 인코딩은 cl100k_base보다 이 부분이 개선되었습니다.

Question 6

여기서 API 비용을 추정할 수 있나요?

Accepted Answer

대략적인 추정이 가능합니다. '비용 추정' 섹션을 펼치고 1K 입력 토큰당 가격(달러)을 입력하면 토큰 수에 해당 가격을 곱해 대략적인 금액을 계산합니다. 실제 비용은 입출력 토큰 구분, 구체적인 모델 버전, 현재 OpenAI 요금에 따라 달라지므로 공식 요금 페이지에서 확인하세요.

Question 7

API 키가 필요한가요?

Accepted Answer

필요하지 않습니다. 토크나이저는 번들로 포함된 데이터를 사용하여 브라우저에서만 실행됩니다. OpenAI API 호출은 이루어지지 않습니다.

토큰 수 계산기 — GPT-4o·GPT-4 토큰을 정확히 계산하고 분할 시각화 (무료)

토큰 분할 시각화

관련 외부 도구

관련 도구

사용 방법

토큰이란?

모델 인코딩: cl100k_base와 o200k_base

토큰 시각화 읽는 법

글자 수, 단어 수, 토큰 수의 차이

활용 사례

프롬프트 관리 및 컨텍스트 창 제한

API 비용 추정 (참고)

언어별 토큰 효율 비교

자주 묻는 질문