Traducción pendiente. Esta definición aún no está traducida al español. Leer la versión en inglés.

Tokens Per Second

The standard throughput metric for language-model serving: how many output tokens the system generates per second. TPS depends on the model size, the hardware, the batch size, the context length, and the serving framework. Cost per million tokens is the dual metric on the billing side.

Definición editorial de DecipherU. Para definiciones técnicas autorizadas, consulta NIST AI RMF, ISO/IEC 42001, o las publicaciones oficiales de los laboratorios de IA.