256 Tools

Contador de Tokens — Cuenta Tokens de GPT-4o y GPT-4 con Precisión (Gratis)

Codificación: o200k_base
0
Tokens
0
Caracteres
0
Palabras
Caracteres/Token

Visualización de tokens

Los colores distinguen tokens adyacentes (sin significado semántico)

Introduce texto arriba para ver la visualización de tokens.

Herramientas externas relacionadas

Algunos enlaces son enlaces de afiliados.

Herramientas relacionadas

Este contador de tokens gratuito usa un tokenizador real (BPE de OpenAI) para contar con exactitud los tokens de GPT-4o, GPT-4 y GPT-3.5. Pega cualquier texto para ver el recuento exacto de tokens, una visualización en color de cómo se divide el texto en tokens, además del número de caracteres y palabras, todo en tiempo real. Cambia entre modelos (GPT-4o=o200k_base, GPT-4=cl100k_base) para comparar. Todo funciona en tu navegador — tu texto nunca se envía a ningún servidor.

Cómo usarlo

  1. Selecciona un modelo (GPT-4o, GPT-4, GPT-3.5) — esto determina la codificación del tokenizador.
  2. Pega o escribe tu prompt en el área de texto. El recuento de tokens y caracteres se actualiza en tiempo real.
  3. La visualización de colores muestra cómo se divide el texto en tokens. Cada ficha es un token. Los espacios aparecen como · y los saltos de línea como ↵.
  4. Usa 'Limpiar' para reiniciar o 'Copiar' para copiar el texto.
  5. Opcionalmente, despliega 'Estimación de coste' e introduce el precio por 1 000 tokens para calcular un coste aproximado de API.
  6. Sin instalación, sin registro — tu texto nunca se sube. El tokenizador se ejecuta íntegramente en tu navegador.

¿Qué es un token?

Un token es la unidad básica con la que los LLM como GPT procesan el texto. Las palabras se dividen en piezas de subpalabras, por lo que una palabra puede ser uno o varios tokens. En inglés, un token equivale aproximadamente a 4 caracteres o 0,75 palabras de media, pero es solo una guía aproximada. El recuento real depende del texto concreto, el idioma y la codificación. Esta herramienta usa el tokenizador real para darte un recuento exacto, no una estimación.

Codificaciones: cl100k_base y o200k_base

Los distintos modelos GPT usan diferentes codificaciones de tokenizador. GPT-4 y GPT-3.5 usan cl100k_base, mientras que GPT-4o y GPT-4o mini usan la más reciente o200k_base, más eficiente para texto multilingüe. El mismo texto puede tener un recuento de tokens diferente según la codificación — usa el selector de modelo para comparar. Nota: esta herramienta cubre solo los modelos OpenAI GPT. Claude, Gemini y otros usan tokenizadores distintos, por lo que sus recuentos de tokens diferirán.

Cómo leer la visualización de tokens

Cada ficha de color representa exactamente un token. Los tokens adyacentes alternan colores para que puedas ver dónde acaba uno y empieza el siguiente. Los espacios dentro de un token se muestran como · y los saltos de línea como ↵. Si tu texto produce más de 2 000 tokens, solo se dibujan las primeras 2 000 fichas, pero el recuento total siempre es exacto.

Caracteres, palabras y tokens

El recuento de caracteres es el número de puntos de código Unicode (emoji y caracteres CJK cuentan como uno). El recuento de palabras es el número de secuencias de letras o dígitos, útil solo para idiomas con separación por espacios. El recuento de tokens es diferente: es el número real de tokens BPE que ve el LLM y lo que determina el coste de la API y el uso de la ventana de contexto.

Casos de uso

Gestión de prompts y límites de ventana de contexto

Pega tu prompt completo para comprobar si cabe dentro de la ventana de contexto del modelo (por ejemplo, 128 000 tokens para GPT-4o). Si estás cerca del límite, recorta tu prompt hasta que el recuento sea cómodamente inferior.

Estimación del coste de API

El coste de la API se cobra por token. Introduce tu texto, anota el recuento de tokens y multiplícalo por el precio del token de entrada para obtener una estimación aproximada. Despliega el panel 'Estimación de coste' e introduce el precio por 1 000 tokens. El precio real depende del modelo, si los tokens son de entrada o salida y el precio actual de OpenAI — consulta siempre la página oficial de precios.

Comparación de eficiencia de tokens entre idiomas

El mismo significado expresado en japonés, chino o coreano suele usar más tokens que en inglés, porque los scripts no latinos se codifican con menos compactación con BPE. La codificación o200k_base de GPT-4o mejora la eficiencia multilingüe respecto a cl100k_base — prueba a cambiar de modelo para comparar la diferencia con tu texto.

Preguntas frecuentes

¿Es exacto el recuento de tokens?
Sí, para los modelos compatibles. Esta herramienta usa el mismo tokenizador real (BPE) que los modelos GPT-4o, GPT-4 y GPT-3.5 de OpenAI, por lo que el recuento coincide con lo que cobra la API. No es una aproximación como 'caracteres divididos entre 4'.
¿Por qué cambia el recuento al cambiar de modelo?
GPT-4o y GPT-4o mini usan la codificación o200k_base, mientras que GPT-4 y GPT-3.5 usan cl100k_base. Estas codificaciones tienen vocabularios distintos, así que el mismo texto se divide diferente y puede producir un número distinto de tokens.
¿Puedo contar tokens para Claude o Gemini?
No. Esta herramienta solo es compatible con los modelos OpenAI GPT (GPT-4o, GPT-4, GPT-3.5). Claude, Gemini y otros modelos usan sus propios tokenizadores propietarios, por lo que los recuentos aquí no se aplican a ellos.
¿Mi texto se envía a algún servidor?
No. La biblioteca del tokenizador está incluida en la página y se ejecuta íntegramente en tu navegador. Tu texto nunca sale de tu dispositivo — no se sube ni almacena.
¿Por qué el japonés, chino y coreano usan más tokens?
Los tokenizadores BPE dividen el texto en piezas de subpalabras. Los scripts de caracteres latinos se codifican con más compactación, mientras que los caracteres CJK suelen asignarse a más tokens por carácter. La codificación o200k_base más reciente (GPT-4o) mejora esto algo respecto a cl100k_base.
¿Puedo estimar mi coste de API aquí?
Puedes obtener una estimación aproximada. Despliega la sección 'Estimación de coste' e introduce el precio de token de entrada en dólares por 1 000 tokens. La herramienta multiplica el recuento de tokens por ese precio. El coste real depende del modelo concreto, si los tokens son de entrada o salida y el precio actual de OpenAI — verifica siempre en la página oficial de precios.
¿Necesito una clave de API?
No. El tokenizador se ejecuta íntegramente en tu navegador usando los datos del tokenizador incluidos. No se hacen llamadas a la API de OpenAI.

Usamos cookies para anuncios y análisis.