Modelli gestiti
Modelli disponibili in Digio oggi
Assegna un modello predefinito per agente o sostituisci per attività. L'utilizzo viene misurato in token Digio dal saldo del tuo piano: lo stesso portafoglio indipendentemente dal fatto che l'agente chiami Sonnet, GPT-4o o Gemini Flash.
Claude antropico
-
Claude Opus 4.7
Ragionamento di punta, contesto lungo, architettura e lavoro strategico.
-
Claude Opus 4.6
Opus di generazione precedente per analisi stabili e di alta qualità.
-
Claude Sonnet 4.6
Driver quotidiano: codifica, scrittura e loop agente in più fasi.
-
Claude Sonnet 4.5 / 4
Livelli Sonnet veloci con memorizzazione nella cache immediata sui carichi di lavoro supportati.
-
Claude Haiku 4.5
Bozze a bassa latenza, classificazione e attività secondarie ad alto volume.
Etichetta dell'interfaccia utente del sito Web SaaS B2B. Traducilo in naturale: OpenAI
-
GPT-5.5 / GPT-5.4 / GPT-5.2
Ultima famiglia GPT-5 per carichi di lavoro generali e per agenti.
-
GPT-4.1 & GPT-4o
Chat multimodale affidabile e utilizzo di strumenti per gli agenti di produzione.
-
GPT-4o mini
Routing conveniente per riepiloghi e passaggi leggeri.
-
o3 / o3-pro / o3-mini / o4-mini
Modelli incentrati sul ragionamento per matematica, pianificazione e verifica.
-
GPT-5.3 Codex & Codex mini
Generazione di codice, refactoring e competenze degli agenti repo-aware.
Google Gemelli
-
Gemini 2.5 Pro
Ricerca a lungo contesto ed estrazione strutturata.
-
Gemini 2.5 Flash
Passaggi dell'agente ad alto rendimento con tariffe token competitive.
-
Gemini 2.0 Flash
Passaggi ultraveloci per analisi, etichettatura e lavori batch.
API aperte e specializzate
-
DeepSeek Chat & Reasoner
Forte valore per le attività in stile chat e catena di pensiero.
-
Mistral Large
Opzione con hosting europeo per team di agenti multilingue.
-
Llama 3.3 70B
Modello di classe a pesi aperti tramite API: si abbina bene alla GPU privata.
-
Grok 3
Modello orientato al tempo reale per agenti di monitoraggio di notizie e social.
-
Sonar Pro
Risposte basate sulla ricerca per agenti di ricerca.
-
Command R+
Chat aziendale e flussi di lavoro di recupero compatibili con RAG.
Model list and token economics evolve with provider releases. Your workspace shows live options when you assign a model to an agent; Digio Tokens debit from the same balance as in
pricing.
-
1
Prenota GPU
Scegli VRAM, regione e tempo di attività (burst o sempre attivo). Lo spazio di archiviazione per i pesi viene fornito con l'istanza o si monta sul bucket.
-
2
Distribuisci lo stack
Avvia un'immagine di servizio o SSH, installa i driver CUDA e carica i checkpoint. I controlli sanitari confermano che il modello è pronto.
-
3
Registra l'endpoint
Aggiungi URL di base, chiave API e ID modello nelle impostazioni dell'area di lavoro. Digio convalida la latenza e il formato del token prima di andare in diretta.
-
4
Assegna agli agenti
Scegli il tuo modello privato come predefinito per gli agenti selezionati; i modelli Claude/GPT gestiti rimangono disponibili fianco a fianco.
Il noleggio della GPU viene fatturato separatamente dagli abbonamenti al piano Digio. Contattaci per la pianificazione della capacità, gli SLA e la migrazione da un cluster di inferenza esistente.