Ideogram 4.0: la svolta open weight con prompt JSON

Ideogram 4.0 apre i pesi di un modello da 9,3 miliardi di parametri e porta prompt JSON, layout controllabile e immagini native 2K. Ecco come provarlo.

C. Petrolillo Redazione
7 min di lettura
4 Giugno 2026
Ideogram 4.0 genera un poster complesso da un prompt JSON strutturato

Ideogram ha rilasciato il 3 giugno 2026 Ideogram 4.0, il suo primo modello open weight, cioè con pesi scaricabili, per la generazione di immagini: conta 9,3 miliardi di parametri, produce output nativi fino a 2K e accetta prompt strutturati in JSON.

La notizia conta perché cambia il livello di controllo disponibile a chi crea poster, campagne e interfacce visive. Invece di affidarsi soltanto a una descrizione in linguaggio naturale, sviluppatori e designer possono indicare al modello quali elementi inserire, che testo mostrare e dove collocarli. Il risultato promesso è meno tentativi casuali e più lavoro riproducibile.

Ideogram 4.0 trasforma il prompt in una mappa

Secondo la documentazione tecnica pubblicata su GitHub, Ideogram 4.0 è stato addestrato da zero e usa un Diffusion Transformer, cioè un'architettura che genera l'immagine raffinando progressivamente il rumore iniziale. Testo e token visivi attraversano lo stesso trasformatore a 34 livelli, mentre Qwen3-VL-8B viene usato come encoder, il componente che traduce il prompt in rappresentazioni comprensibili dal modello.

La differenza operativa è nel formato dei comandi. Il modello è stato addestrato esclusivamente su prompt JSON: una descrizione generale dell'immagine può essere affiancata da indicazioni su stile, luce, colori, sfondo e singoli elementi. Le bounding box, coordinate che delimitano una zona dell'immagine, permettono inoltre di assegnare una posizione precisa a soggetti e testi.

Ideogram dichiara che il modello gestisce risoluzioni da 256 a 2.048 pixel per lato, in multipli di 16, e rapporti d'aspetto fino a 6:1. Questo consente di usare lo stesso sistema per una miniatura quadrata, un poster verticale o un banner molto largo senza cambiare modello.

“Today, we are releasing Ideogram 4.0 as a state-of-the-art open weight image model for developers and enterprises to build with us.” — Ideogram

La frase arriva dall'annuncio ufficiale e va letta insieme alla scelta tecnica più importante: il prompt non è più soltanto una richiesta, ma può diventare una specifica strutturata del layout. Anche i prompt normali continuano a funzionare, ma la guida di Ideogram avverte che il JSON offre risultati migliori per controllo spaziale e fedeltà allo stile.

Benchmark, prezzi e limiti dell'apertura

Nei test pubblicati da Contra Labs, Ideogram 4.0 è stato preferito nel 47,9% dei confronti effettuati da 10 designer professionisti su 240 immagini generate da quattro modelli. Al momento dell'annuncio, Ideogram segnala inoltre il secondo posto complessivo nella classifica indipendente DesignArena. Sono dati rilevanti, ma misurano preferenze su specifici compiti di design: non dimostrano una superiorità assoluta in ogni genere di immagine.

Anche la parola “open” richiede precisione. Ideogram distribuisce su Hugging Face pesi quantizzati, quindi compressi, nei formati NF4 e FP8, utilizzabili gratuitamente per ricerca, valutazione e progetti personali. Il codice di inferenza è pubblicato con licenza Apache 2.0, ma l'uso dei pesi pubblici in produzione, in prodotti commerciali o in lavori per clienti non è consentito. Per questi casi servono l'API o una licenza commerciale con accesso al modello a precisione completa.

L'API parte da 0,03 dollari per immagine in modalità Turbo, sale a 0,06 dollari in Default e a 0,10 dollari in Quality. Alcune funzioni presentate nella roadmap, come gli sfondi trasparenti e i livelli di testo modificabili direttamente dall'inferenza, non fanno ancora parte di questa prima versione.

La domanda che il termine “open” rischia di nascondere è semplice: se non potete usare i pesi pubblici per un lavoro destinato a un cliente, quanto è davvero aperto il percorso verso la produzione?

Come provare Ideogram 4.0 con un prompt JSON

Per verificare concretamente il salto di controllo, aprite la pagina Ideogram Explore, effettuate l'accesso e selezionate 4.0 nel menu del modello. Incollate poi nel campo di generazione il prompt JSON riportato sotto e avviate la creazione, preferibilmente con un formato verticale adatto a un poster.

Il test è impegnativo per tre ragioni: richiede più scritte leggibili, combina fotografie e grafica e assegna al modello numerosi oggetti sovrapposti. Il JSON separa descrizione generale, sfondo, testi ed elementi, ma non impone bounding box; permette quindi di valutare quanto Ideogram 4.0 riesca a organizzare autonomamente una composizione affollata.

{
"high_level_description": "A black and white collage-style poster featuring Jung Kook, with the text 'SEVEN' and 'Jung Kook' at the top. The composition includes multiple photos of Jung Kook, a black and white checkered pattern, an 8-ball, a guitar silhouette, and various graphic elements like stars and question marks.",
"compositional_deconstruction": {
"background": "A light gray background with a subtle texture. The overall composition is a collage of various elements including photographs of Jung Kook, graphic shapes, and text overlays.",
"elements": [
{
"type": "text",
"text": "SEVEN",
"desc": "Large, bold sans-serif font in black. Positioned at the top center of the image."
},
{
"type": "text",
"text": "Jung Kook",
"desc": "Medium-sized sans-serif font in black. Located directly below 'SEVEN'."
},
{
"type": "text",
"text": "1997",
"desc": "White text inside a black oval shape. Positioned on the left side of the central photograph."
},
{
"type": "text",
"text": "140723",
"desc": "Medium-sized sans-serif font in black. Located at the bottom center of the image."
},
{
"type": "text",
"text": ">> 1uvchae on pinterest <<",
"desc": "Small centered credit text at the very bottom of the image, written in a simple sans-serif font."
},
{
"type": "obj",
"desc": "A large photograph of Jung Kook positioned centrally within a circular wireframe globe frame. He has dark hair and is wearing a light-colored button-down shirt over a white t-shirt with Calvin Klein branding visible on his chest. This is a colored image."
},
{
"type": "obj",
"desc": "A large photograph of Jung Kook positioned to the left side of the central globe frame. He has dark hair styled upward with bangs covering his forehead, and wears a dark Calvin Klein sweatshirt with embroidered logos on the sleeve and chest."
},
{
"type": "obj",
"desc": "A large photograph of Jung Kook positioned to the right side behind the globe frame. He has dark hair styled upward with bangs covering his forehead, and wears a dark Calvin Klein sweatshirt with an embroidered logo on his chest."
},
{
"type": "obj",
"desc": "A stylized graphic silhouette of an electric guitar in black outline against a white background, located in the lower right quadrant."
},
{
"type": "obj",
"desc": "A large 8-ball pool ball graphic located in the lower left quadrant, partially overlapping checkered patterns."
},
{
"type": "obj",
"desc": "A large black and white checkered pattern located in the lower left quadrant behind other elements like stars and an 8-ball."
},
{
"type": "obj",
"desc": "Several hand-drawn style star shapes are scattered throughout the collage, including around the central portrait, the side figures, the checkered area, and the guitar."
},
{
"type": "obj",
"desc": "Two hand-drawn style question mark shapes are positioned above Jung Kook's head on both sides, with nearby doodle accents including a heart shape."
},
{
"type": "obj",
"desc": "A stylized silver clip or paperclip graphic is attached to the top edge of the central photo frame containing the '1997' text."
}
]
}
}

Per leggere il risultato, controllate prima l'accuratezza delle parole “SEVEN”, “Jung Kook”, “1997” e “140723”; osservate poi se la figura centrale resta distinta dalle immagini laterali e se chitarra, palla numero 8 e motivo a scacchi compaiono nelle zone richieste. Ripetere lo stesso prompt con un modello precedente, quando disponibile nel vostro account, rende il confronto più utile di una selezione di immagini scelte dal produttore.

Il prompt cita una persona reale, un marchio e un credito Pinterest: è adatto a verificare le capacità tecniche del modello, ma non garantisce diritti di pubblicazione o uso commerciale sull'immagine ottenuta.