Cos'è Mistral?
Mistral AI è un laboratorio IA con sede a Parigi che sviluppa sia modelli a pesi aperti scaricabili ed eseguibili localmente, sia un assistente ospitato chiamato Le Chat. È la più importante fonte occidentale di modelli aperti di alta qualità.
Il portafoglio comprende modelli a pesi aperti (abbastanza piccoli da poter essere self-hosted) e modelli commerciali più grandi disponibili via API, oltre a Codestral per il codice. Poiché i modelli chiave sono scaricabili, Mistral è una scelta naturale quando devi eseguire l'IA sulla tua infrastruttura per motivi di costo, latenza o residenza dei dati.
Se vuoi una qualità vicina al livello più alto senza inviare dati a un hyperscaler americano, o se vuoi possedere il modello che alimenta il tuo prodotto, Mistral è quello da valutare.
Dove eccelle
- Il self-hosting: modelli a pesi aperti che puoi eseguire sui tuoi server per controllare costi, latenza e dati.
- I deployment sensibili ai dati dove conta tenere l'inferenza nel proprio ambiente (o in una regione europea).
- Un'inferenza conveniente e veloce: ottima qualità rispetto al costo, soprattutto con i modelli più piccoli.
- La generazione di codice con Codestral, un modello specializzato in programmazione.
- La creazione di prodotti su un'API di un fornitore indipendente dai grandi cloud americani.
- L'uso quotidiano di un assistente tramite Le Chat (chat, ricerca Web, caricamento di documenti, generazione di immagini).
Dove fa cilecca
- Il ragionamento assolutamente in testa alle classifiche: i modelli chiusi più grandi di OpenAI, Anthropic e Google tendono ancora a guidare nei test di ragionamento più difficili.
- Il set di funzionalità consumer più ampio: Le Chat è più leggero di ChatGPT o Gemini.
- I team senza voglia di gestire modelli, se scelgono la via del self-hosting (l'API evita questo).
Due modi per accedere: Le Chat o i pesi
Per un assistente normale, usa Le Chat su chat.mistral.ai: registrati e inizia a chattare, con ricerca Web, caricamento di documenti e generazione di immagini disponibili.
Per l'ingegneria, hai una scelta unica in questo gruppo: chiama i modelli tramite l'API di Mistral (La Plateforme), oppure scarica i modelli a pesi aperti ed eseguili tu stesso sul tuo hardware o cloud.
Self-hosting dei modelli aperti
I modelli Mistral a pesi aperti sono pubblicati su piattaforme come Hugging Face e possono funzionare tramite runtime comuni (per esempio vLLM o Ollama). Questo colloca l'inferenza interamente nel tuo ambiente: nulla esce dalla tua rete.
Questo controllo è il vantaggio principale: costo prevedibile su scala, bassa latenza e dati che non toccano mai una terza parte, le stesse ragioni per cui i team fanno self-hosting dei database.
Codestral e l'API
Codestral punta sul completamento e sulla generazione di codice ed è progettato per integrarsi negli strumenti di sviluppo. L'API espone anche i modelli generali e commerciali più grandi con un prezzo a token.
Scegli il modello più piccolo che supera le tue valutazioni: i modelli più piccoli di Mistral sono economici e veloci, e spesso sufficienti per la classificazione, l'estrazione e il routing.
Quanto costa Mistral
Indicativo, in USD, aggiornato al gennaio 2026. I prezzi cambiano spesso. Verifica sul sito ufficiale prima di farci affidamento.
Pesi aperti
0 $ (self-hosting)
Scarica ed esegui tu stesso i modelli aperti; paghi solo per la tua infrastruttura di calcolo.
Le Chat Gratuito
$0
Assistente ospitato con limiti: chat, ricerca Web e caricamento di documenti.
Le Chat Pro
~15 $ / mese
Limiti più elevati e accesso ai modelli più performanti nell'assistente.
API (La Plateforme)
A consumo
Prezzo a token su tutta la gamma di modelli; i modelli piccoli sono economici.
Esempi di prompt
Copiali in Mistral come punto di partenza, poi adattali al tuo compito.
Scegliere un modello per un compito
Devo classificare ticket di assistenza in 8 categorie ad alto volume e basso costo. Quale modello Mistral dovrei usare, e scrivimi un prompt di sistema conciso per questo.
Programmare con Codestral
Scrivi una funzione Python che valida e normalizza i numeri di telefono nel formato E.164, con test per i casi difficili. Spiega i casi limite che hai coperto.
Estrarre dati strutturati
Dal testo qui sotto, estrai un oggetto JSON con i campi: azienda, ruolo, sede, fascia_salariale. Restituisci solo JSON valido, null per tutto ciò che manca.
Scegliere tra self-hosting e API
Elaboriamo circa 2 milioni di brevi richieste di classificazione al mese e ci interessa la residenza dei dati. Guidami nel decidere se fare self-hosting di un modello Mistral aperto o usare l'API, con i compromessi in termini di costo e operatività.
Mistral
domande frequenti.
Risposte dirette alle domande che ci vengono poste più spesso. Se la tua non c'è, scrivi al team.