Il punto di partenza
Un agente di IA è un sistema che, dato un obiettivo, pianifica i propri passi, usa strumenti e si adatta in base a ciò che osserva, invece di seguire uno script fisso. Quell'autonomia è ciò che rende potenti gli agenti, ed è anche ciò che li rende rischiosi: un agente che può agire nel mondo può agire in modo sbagliato, costoso, e alla velocità della macchina.
La domanda interessante per un'azienda non è quasi mai come costruire un agente. È se il compito che hai davanti ne ha davvero bisogno. La maggior parte dei problemi etichettati come agentici è risolta meglio da un flusso deterministico con una o due chiamate al modello: più economico, più prevedibile, molto più facile da testare e da cui farsi fidare.
Questo testo è la versione onesta: cos'è davvero un agente, il piccolo insieme di casi in cui si guadagna davvero il suo posto, perché un semplice flusso di solito vince, e come tenere un agente sicuro e accessibile se ne costruisci uno.
Questo compito ha davvero bisogno di un agente?
Un agente costruito dove sarebbe bastato un flusso è una fonte permanente di costo, latenza e sorprese.
Un flusso è lo schema giusto quando i passi sono noti in anticipo: fai questo, poi chiama quello, poi formatta il risultato. La maggior parte dei compiti aziendali è così. Classifica un ticket e instradalo. Estrai campi da un documento e scrivili in un sistema. Recupera del contesto e abbozza una risposta. Questi possono usare un modello in uno o due passi, ma l'orchestrazione è fissa, il che significa che è testabile, debuggabile ed economica.
Un agente si guadagna il suo posto solo quando il compito davvero non può essere espresso come una sequenza fissa: quando deve decidere quali passi compiere in base a ciò che trova, usare strumenti in un ordine non noto in anticipo, e recuperare da vicoli ciechi su più turni. La ricerca aperta tra sistemi, la risoluzione di problemi a più passi, e i compiti in cui il percorso si dirama in modo imprevedibile sono vero territorio per agenti. Il test è semplice: se riesci a disegnare il diagramma di flusso, costruisci il flusso.
Azzeccare questa scelta è la maggior parte del valore che aggiungiamo, e di solito significa dissuadere un cliente da un agente. Un agente introduce non-determinismo, costo più alto, testing più difficile e nuovi modi di guasto; te li accolli solo quando il compito li ripaga.

Autonomia che il compito richiede davvero
Il caso più chiaro è il lavoro aperto su molti strumenti in cui il passo successivo dipende dall'ultimo risultato. Un agente che indaga su un incidente in produzione potrebbe interrogare i log, poi, in base a ciò che vede, aprire una dashboard correlata, poi controllare un deploy recente, poi formulare un'ipotesi, un percorso che nessun flusso fisso potrebbe enumerare in anticipo. Un agente di ricerca che raccoglie e concilia informazioni tra diversi sistemi è simile: il valore sta nell'adattare il piano man mano che apprende.
Anche allora, i design più solidi tengono l'agente al guinzaglio corto: un insieme limitato di strumenti, un numero limitato di passi, e un umano nel ciclo ovunque un'azione sia importante o difficile da annullare. Gli agenti di produzione più affidabili sono ristretti e supervisionati, non a mondo aperto e autonomi. L'ampiezza di capacità è di solito una passività, non una funzionalità.
E la domanda è raramente tutto o niente. Molti buoni sistemi sono per lo più flusso con un piccolo nucleo agentico: una pipeline deterministica che cede il controllo a un agente vincolato solo per l'unico passo davvero aperto, poi riprende il controllo. Questo mantiene gran parte del sistema testabile, riservando l'autonomia a dove serve davvero.

Guardrail, valutazioni e un tetto di costo rigido
Un agente che può compiere azioni ha bisogno di guardrail su quali azioni può compiere, e su quali richiedono l'approvazione di un umano. Il raggio d'impatto di un errore è definito dagli strumenti che gli dai; un agente in sola lettura è un rischio molto diverso da uno che può inviare e-mail, spostare denaro o modificare record. Limita gli strumenti al minimo che il compito richiede.
Ha bisogno anche di un'infrastruttura di valutazione: un insieme graduato di scenari che ti dice, a ogni cambiamento, se l'agente sta migliorando o peggiorando, perché il comportamento di un agente è emergente e una modifica al prompt può rompere in silenzio un percorso che funzionava. E ha bisogno di tetti rigidi di costo e di passi, così che un ciclo di ragionamento che va storto sia limitato per design anziché scoperto su una fattura. Un agente senza un limite di budget è una passività finanziaria in attesa di una brutta giornata.
Questi non sono extra opzionali per la produzione. Il divario tra una demo impressionante di un agente e un agente su cui puoi davvero contare è quasi interamente guardrail, valutazioni, monitoraggio e la disciplina di tenere la cosa ristretta.

Tre impegni su ogni progetto di agente
Ti diremo onestamente se il compito ha bisogno di un agente o di un flusso, poi costruiamo e gestiamo quello giusto, e lo consegniamo.
Prima il flusso, l'agente solo quando serve
Ci orientiamo al design più semplice che risolve il compito. Un agente è giustificato da una vera apertura, non dall'ambizione, e lo diciamo prima di costruire qualsiasi cosa.
Ristretto, vincolato, supervisionato
Gli agenti di produzione ricevono un set minimo di strumenti, tetti di passi e di costo, e un umano nel ciclo ovunque la posta in gioco lo richieda. Il raggio d'impatto è progettato, non scoperto.
Valutato e gestito
Ogni agente è consegnato con un'infrastruttura di valutazione e monitoraggio, e lo gestiamo con te durante una finestra di supporto prima di consegnare il codice e i runbook.
Un agente che si guadagna il posto, o un flusso che ha fatto il lavoro
Un anno dopo, o stai gestendo un agente ristretto e supervisionato che fa in modo affidabile un lavoro che nessun flusso potrebbe, o hai risparmiato i soldi e hai consegnato il flusso che era la risposta giusta fin dall'inizio.
Il segno di un programma di IA maturo non è quanti agenti gestisce; è che ogni agente in produzione è lì per una ragione che regge alla verifica, e ogni compito che non ne aveva bisogno è un flusso pulito, economico e testabile. L'hype premia l'opposto, agenti dappertutto, ed è così che i team finiscono con sistemi che non possono testare, non possono prevedere e non possono permettersi.
Gli agenti che durano sono ristretti e supervisionati, con guardrail e valutazioni che c'erano fin dall'inizio. Quelli che vengono spenti in silenzio erano ampi, autonomi e impressionanti nella demo. La differenza è disciplina ingegneristica, non capacità del modello.
Da qualunque lato cada il compito, dovresti possedere il risultato: il codice nei tuoi repository, le valutazioni, e un team che capisce perché è un agente o un flusso. Quella comprensione è ciò che ti permette di costruire bene il prossimo.

IA per i fondatori
le domande che ci fanno più spesso.
Risposte dirette alle domande che ci vengono poste più spesso. Se la tua non c'è, scrivi al team.