Tradução pendente. Esta definição ainda não foi traduzida para o português brasileiro. Ler a versão em inglês.

Tokens Per Second

The standard throughput metric for language-model serving: how many output tokens the system generates per second. TPS depends on the model size, the hardware, the batch size, the context length, and the serving framework. Cost per million tokens is the dual metric on the billing side.

Definição editorial da DecipherU. Para definições técnicas autorizadas, consulte NIST AI RMF, ISO/IEC 42001, ou as publicações oficiais dos laboratórios de IA.