Tradução pendente. Esta definição ainda não foi traduzida para o português brasileiro. Ler a versão em inglês.

Streaming

An inference mode where the server returns tokens to the client as they are generated, instead of waiting for the full response. Streaming reduces perceived latency dramatically and is the default for chat interfaces. Most LLM APIs support server-sent events (SSE) or websocket streaming.

Definição editorial da DecipherU. Para definições técnicas autorizadas, consulte NIST AI RMF, ISO/IEC 42001, ou as publicações oficiais dos laboratórios de IA.