Wann wurde MAI-Image-2.5 eingeführt und welche Varianten sind verfügbar?

Microsoft kündigte MAI-Image-2.5 am 2. Juni 2026 zusammen mit MAI-Image-2.5-Flash an. MAI-Image-2.5 zielt auf maximale Wiedergabetreue ab, während MAI-Image-2.5-Flash als schnellere, kostengünstigere Option für skalierbare Workloads positioniert ist.

Wie schneidet MAI-Image-2.5 in den Arena-Bestenlisten ab?

Microsoft berichtet, dass MAI-Image-2.5 auf Platz 3 der Text-zu-Bild-Bestenliste von Arena und auf Platz 2 der Image Edit (Einzelbildbearbeitung)-Bestenliste von Arena liegt, vor Nano Banana 2.1, und dass die Arena-Scores GPT-Image-1.5 und Nano Banana Pro 2K übertreffen.

Was sind die wichtigsten Funktionen von MAI-Image-2.5?

Microsoft hebt Verbesserungen bei der Text-zu-Bild-Qualität (Detail, Kohärenz, Textwiedergabe, Produktbilder, Prompt-Adhärenz), komplexem visuellem Denken (Szenenstruktur, Beleuchtung, Skalierung, räumliche Beziehungen), feinkörniger lokalisierter Bearbeitung (Objekte ersetzen, Text aktualisieren, Bewegungsunschärfe entfernen, ohne den Rest zu ändern) und Gesichts-/Identitätskonsistenz über Bearbeitungen hinweg hervor.

Wo können Entwickler auf MAI-Image-2.5 zugreifen?

Microsoft sagt, dass MAI-Image-2.5 und MAI-Image-2.5-Flash Entwicklern in Microsoft Foundry (Azure AI Foundry) zur Verfügung stehen und im MAI Playground ausprobiert werden können.

Welche Microsoft-Produkte verwenden MAI-Image-2.5?

Microsoft gibt an, dass MAI-Image-2.5 in PowerPoint für die hochwertige Bildgenerierung live ist und in OneDrive für die präzise Fotobearbeitung (z. B. Entfernen von Ablenkungen, Bereinigen von Hintergründen, Verbessern von Bildern unter Beibehaltung der Szene) eingeführt wird.

Wie viel kostet MAI-Image-2.5 in Foundry?

Microsoft listet die Preise für MAI-Image-2.5 mit 5 US-Dollar pro 1 Million Texteingabe-Token, 8 US-Dollar pro 1 Million Bildeingabe-Token und 47 US-Dollar pro 1 Million Bildausgabe-Token auf. MAI-Image-2.5-Flash wird mit 1,75 US-Dollar pro 1 Million Texteingabe-Token, 1,75 US-Dollar pro 1 Million Bildeingabe-Token und 19,50 US-Dollar pro 1 Million Bildausgabe-Token gelistet.

Welche Sicherheitsbeschränkungen nennt Microsoft für MAI-Image-2.5?

Microsoft sagt, dass MAI-Image-2.5 mehrschichtige Sicherheitsvorkehrungen (Prompt- und Ausgabefilterung) enthält, um schädliche oder gegen Richtlinien verstoßende Inhalte zu erkennen und zu blockieren. Microsoft warnt auch davor, dass es, wie alle Bildmodelle, Vorurteile widerspiegeln und plausible, aber ungenaue oder irreführende Details generieren kann. Daher sollten die Ausgaben vor der Verwendung in sensiblen Kontexten (z. B. Identität, Recht, Medizin, Finanzen oder Nachrichten-bezogene Workflows) überprüft werden.

MAI-Image-2.5

WebsitePaidText to Image

MAI-Image-2.5 ist Microsofts stärkstes Bildmodell, das hochpräzise Text-zu-Bild-Generierung und präzise, kontrollierbare Bild-zu-Bild-Bearbeitung mit starker Prompt-Einhaltung, verbesserter Textwiedergabe und identitätskonsistenter Gesichtserhaltung liefert.

Website besuchen

Dieses Tool bewerben

https://microsoft.ai/news/introducing-mai-image-2-5?ref=producthunt&utm_source=aipure

Überblick
Video
Alternativen

Produktinformationen

Aktualisiert:Jun 8, 2026

Was ist MAI-Image-2.5

MAI-Image-2.5 ist ein Microsoft AI (MAI) Bildgenerierungs- und Bearbeitungsmodell, das für produktionsreife kreative Workflows entwickelt wurde. Es konzentriert sich auf hochwertige, kohärente Text-zu-Bild-Ausgaben und eine feinkörnige Bildbearbeitung, die die ursprüngliche Szene bewahrt, während gezielte Änderungen vorgenommen werden. In Arena-Evaluierungen von Drittanbietern belegt MAI-Image-2.5 Platz 3 für Text-zu-Bild und Platz 2 für Bildbearbeitung (vor Nano Banana 2.1), was eine starke menschliche Präferenzleistung bei Erstellungs- und Bearbeitungsaufgaben widerspiegelt. Microsoft bietet auch MAI-Image-2.5-Flash an, eine schnellere, kostengünstigere Variante, die für skalierbare, latenzempfindliche Workloads entwickelt wurde. Die Modellfamilie steht Entwicklern über Microsoft Foundry zur Verfügung und kann im MAI Playground ausprobiert werden. Sie treibt bereits Funktionen in Microsoft-Produkten wie PowerPoint (Bildgenerierung) und OneDrive (präzise Fotobearbeitung) an.

Hauptfunktionen von MAI-Image-2.5

MAI-Image-2.5 ist Microsofts Modell zur Bildgenerierung und -bearbeitung mit der höchsten Wiedergabetreue, das für produktionsreife kreative Workflows mit starker Prompt-Adhärenz, verbesserter Textwiedergabe und steuerbaren, lokalisierten Bearbeitungen, die den Rest des Bildes erhalten, entwickelt wurde. Es erweitert die Bild-zu-Bild-Bearbeitung um die Funktion „Kontrolle mit Erhaltung“, unterstützt komplexe visuelle Schlussfolgerungen (Beleuchtung, Skalierung, räumliche Beziehungen) und bewahrt die Gesichts-/Identitätskonsistenz über Bearbeitungen hinweg. Es rangiert hoch auf Arena (Nr. 3 Text-zu-Bild; Nr. 2 Bildbearbeitung) und ist in Microsoft Foundry und MAI Playground verfügbar, mit Produktintegrationen wie PowerPoint (Generierung) und OneDrive (präzise Fotobearbeitung). Eine schnellere, kostengünstigere Variante (MAI-Image-2.5-Flash) zielt auf skalierbare Workloads ab.

Hochpräzise Text-zu-Bild-Generierung: Erzeugt detailliertere und kohärentere Bilder aus Prompts mit stärkerer Prompt-Adhärenz und verbesserten kommerziellen Ausgaben, einschließlich besserer Typografie und Layoutstabilität.

Bild-zu-Bild-Bearbeitung mit lokalisierter Steuerung: Unterstützt präzise Bearbeitungen – Objekte ersetzen, Text aktualisieren, Bewegungsunschärfe entfernen, Hintergründe bereinigen – während der Rest des Bildes unverändert bleibt („Kontrolle mit Erhaltung“).

Komplexe visuelle Schlussfolgerungen für realistische Bearbeitungen: Versteht Szenenstruktur, Beleuchtung, Perspektive, Skalierung und räumliche Beziehungen, sodass eingefügte oder geänderte Elemente zum Kontext passen (z. B. korrekte Schatten und Blickwinkel).

Gesichts- und Identitätskonsistenz: Bewahrt die erkennbare Gesichtsidentität über Bearbeitungen hinweg, selbst bei Änderung von Pose, Ausdruck oder Blickwinkel – nützlich für iterative kreative Arbeiten mit Personen.

Zwei Bereitstellungsoptionen: Wiedergabetreue vs. Geschwindigkeit: MAI-Image-2.5 zielt auf maximale Qualität ab; MAI-Image-2.5-Flash bietet schnellere, kostengünstigere Generierung und Bearbeitung für Hochdurchsatz-Produktionspipelines.

Unternehmenszugang und Microsoft-Produktintegration: Verfügbar über Microsoft Foundry APIs und MAI Playground; integriert in PowerPoint für präsentationsreife Visuals und wird in OneDrive für präzise Fotobearbeitung eingeführt.

Anwendungsfälle von MAI-Image-2.5

Marketing- & Werbekreation: Generieren Sie Kampagnenkonzepte, Produkt-Hero-Shots und markenorientierte Visuals mit verbesserter Typografie und Prompt-Treue; iterieren Sie schnell durch kontrollierte Bearbeitungen.

Verpackungen, Etiketten und Poster-Mockups: Erstellen Sie Designentwürfe, bei denen lesbarer Text wichtig ist – Poster, Etiketten, Verpackungskonzepte und Laden-/Regalvisuals – und verfeinern Sie dann bestimmte Bereiche, ohne das gesamte Bild neu zu erstellen.

E-Commerce- und Einzelhandels-Content-Pipelines: Produzieren Sie skalierbare Produktbildvariationen (Hintergründe, Requisiten, Beleuchtung) und führen Sie Bereinigungen/Bearbeitungen für Kataloge durch, während das Kernproduktbild erhalten bleibt.

Präsentationen und Unternehmenskommunikation: Generieren Sie in PowerPoint präsentationsreife Visuals aus Prompts; erstellen Sie konsistente Folienbilder und iterieren Sie an bestimmten Elementen (Symbole, Titel, Diagramme).

Verbraucher-Fotobearbeitung und Inhaltsrestaurierung: Entfernen Sie in OneDrive-ähnlichen Workflows Ablenkungen, bereinigen Sie Hintergründe und verbessern Sie Fotos, während die ursprüngliche Szenenkomposition erhalten bleibt.

Bildung und Lehrgrafiken: Generieren Sie Diagramme, Poster und erklärende Visuals, die strukturierte Layouts und eingebetteten Text erfordern, und wenden Sie dann gezielte Bearbeitungen an, um Beschriftungen oder Elemente zu korrigieren.

Vorteile

Starke Generierungs- und Bearbeitungsleistung auf unabhängigen Arena-Bestenlisten (Spitzenklasse sowohl für Text-zu-Bild als auch für Bildbearbeitung).

Fein abgestimmte, lokalisierte Bearbeitungen mit Erhaltung reduzieren Nacharbeit und ermöglichen iterative, produktionsähnliche Workflows.

Verbesserte Textwiedergabe und kommerzielle Bildqualität im Vergleich zu früheren Versionen, wodurch die Ausgaben designfertiger werden.

Flexibler Kosten-/Latenz-Kompromiss über die Flash-Variante für skalierbare Produktions-Workloads.

Nachteile

Wie alle Bildmodelle kann es Trainingsdaten-Bias widerspiegeln und plausible, aber ungenaue/irreführende Details generieren – erfordert menschliche Überprüfung in sensiblen Kontexten (Identität, Recht, Medizin, Finanzen, Nachrichten).

Sicherheitsfilter und Richtlinienleitplanken können bestimmte Prompts/Bearbeitungen einschränken, was einige kreative oder Edge-Case-Workflows einschränken kann.

Die Nutzung mit hoher Wiedergabetreue kann teurer sein als Flash, was Kostenkontrollen für große Pipelines erfordert.

Wie verwendet man MAI-Image-2.5

1) Wählen Sie, wie Sie auf MAI-Image-2.5 zugreifen möchten: Wählen Sie den Einstiegspunkt, der zu Ihrem Workflow passt: (a) Microsoft Foundry (API/Produktion), (b) MAI Playground (interaktives Testen) oder (c) Microsoft-Produkte, in die es integriert ist (PowerPoint für die Generierung; OneDrive für die präzise Bearbeitung).

2) Entscheiden Sie, welche Modellvariante Sie verwenden möchten (Qualität vs. Geschwindigkeit/Kosten): Verwenden Sie MAI-Image-2.5 für maximale Wiedergabetreue und feinkörnige Kontrolle. Verwenden Sie MAI-Image-2.5-Flash für schnellere, skalierbare und kostengünstigere Generierungs-/Bearbeitungs-Workloads.

3) Probieren Sie es schnell im MAI Playground aus (No-Code-Evaluierung): Öffnen Sie den MAI Playground unter https://playground.microsoft.ai/chat, wählen Sie MAI-Image-2.5 (oder MAI-Image-2.5-Flash) aus der Modellauswahl und führen Sie dann Text-zu-Bild-Prompts aus, um Stil, Prompt-Einhaltung und insbesondere die Textwiedergabe im Bild zu bewerten.

4) Generieren Sie ein Bild aus einem Text-Prompt (Text-zu-Bild): Geben Sie im Playground (oder später über die API) einen detaillierten Prompt ein, der Motiv, Umgebung, Beleuchtung, Kamera/Stil und jeglichen erforderlichen Text auf dem Bild beschreibt. MAI-Image-2.5 ist besonders stark für Produktbilder, stilisierte Illustrationen und schärfere Textwiedergabe positioniert.

5) Führen Sie eine Bild-zu-Bild-Bearbeitung durch (laden Sie ein Bild hoch und beschreiben Sie dann die Bearbeitung): Stellen Sie ein vorhandenes Bild bereit und geben Sie die gewünschte Änderung an (z. B. ein Objekt ersetzen, Text auf einem Etikett/Poster aktualisieren, Bewegungsunschärfe entfernen, einen Hintergrund bereinigen). MAI-Image-2.5 wurde entwickelt, um den Rest des Bildes stabil zu halten, während lokalisierte Bearbeitungen angewendet werden.

6) Verwenden Sie feinkörnige, lokalisierte Bearbeitungsanweisungen: Seien Sie beim Bearbeiten explizit darüber, was sich ändern muss und was unverändert bleiben muss (z. B. „Nur das Logo auf dem Flaschenetikett ersetzen; Beleuchtung, Reflexionen und Hintergrund identisch halten“). Das Modell wird als Unterstützung präziser, kontrollierbarer Bearbeitungen beschrieben, ohne den Rest der Szene zu verändern.

7) Nutzen Sie die Szenenstruktur-Erkennung für realistische Bearbeitungen: Fügen Sie bei Ergänzungen/Entfernungen Einschränkungen bezüglich Perspektive, Schatten und Maßstab hinzu (z. B. „Fügen Sie eine Tasse auf dem Tisch mit passender Perspektive und einem weichen Schatten hinzu, der mit dem Fensterlicht übereinstimmt“). MAI-Image-2.5 wird als Verständnis von Beleuchtung und räumlichen Beziehungen beschrieben, um kontextgerechte Bearbeitungen vorzunehmen.

8) Bewahren Sie die Gesichts-/Identitätskonsistenz bei Bearbeitungen (falls zutreffend): Wenn Sie Porträts bearbeiten, geben Sie an, dass die Identität erhalten bleiben muss, während Pose/Ausdruck/Blickwinkel geändert werden (z. B. „Dieselbe Person beibehalten; Ausdruck in ein subtiles Lächeln ändern; Hautton und Gesichtszüge konsistent halten“). MAI-Image-2.5 wird als Erhaltung der erkennbaren Ähnlichkeit bei Bearbeitungen beschrieben.

9) Gehen Sie über Microsoft Foundry in Produktion (Entwickler-/API-Route): Suchen Sie in Microsoft Foundry die Modellkarte MAI-Image-2.5 oder MAI-Image-2.5-Flash und stellen Sie sie als Modellendpunkt für Ihre Anwendung bereit/verwenden Sie sie. Foundry wird als primärer Entwicklerzugangsweg für den Aufruf des Modells über die API beschrieben.

10) Optimieren Sie Kosten und Durchsatz mit der richtigen Variante: Für die Stapelgenerierung oder Pipelines mit hohem Volumen bevorzugen Sie MAI-Image-2.5-Flash; für hochwertige kreative Assets und maximale Bearbeitungstreue bevorzugen Sie MAI-Image-2.5. Die offizielle Quelle hebt Flash als schneller/kostengünstiger und MAI-Image-2.5 als maximale Wiedergabetreue hervor.

11) Verwenden Sie es in Microsoft-Produkten (sofern verfügbar): PowerPoint: Verwenden Sie Copilot in PowerPoint, um präsentationsreife Visuals/Folien aus Prompts zu generieren. OneDrive: Verwenden Sie KI-Fotobearbeitungsfunktionen (wird eingeführt) für präzise Bearbeitungen wie das Entfernen von Ablenkungen und das Bereinigen von Hintergründen, während die ursprüngliche Szene erhalten bleibt.

12) Fügen Sie einen menschlichen Überprüfungsschritt für sensible Anwendungsfälle hinzu: Microsoft weist darauf hin, dass das Modell plausible, aber ungenaue/irreführende visuelle Details erzeugen und Trainingsdaten-Bias widerspiegeln kann. Überprüfen Sie die Ausgaben vor der Verwendung in sensiblen Kontexten (Identität, rechtliche, medizinische, finanzielle oder nachrichtenbezogene Workflows).

MAI-Image-2.5 FAQs

MAI-Image-2.5 ist Microsoft AIs neuestes Bildmodell für hochwertige Text-zu-Bild-Generierung und präzise, steuerbare Bildbearbeitung. Microsoft beschreibt es als sein bisher stärkstes Bildmodell, das für produktionsreife Workflows entwickelt wurde.

MAI-Image-2.5 Video

Beliebte Artikel

Atoms: Eine Multi-Agenten-KI-Plattform, die Ideen in startbereite Produkte verwandelt

May 22, 2026

Nano Banana SBTI: Was es ist, wie es funktioniert und wie man es im Jahr 2026 einsetzt

Apr 15, 2026

Atoms Review – Der KI-Produkt-Builder, der die digitale Erstellung im Jahr 2026 neu definiert

Apr 10, 2026

Kilo Claw: Wie man einen echten "Do-It-For-You" KI-Agenten bereitstellt und verwendet (2026 Update)

Apr 3, 2026

Neueste KI-Tools ähnlich wie MAI-Image-2.5

Flux AI Lab

Free TrialText to Image AI Photo & Image Generator AI Art &Design Creator

Flux AI Lab ist eine hochmoderne KI-Bildgenerierungsplattform, die von der FLUX.1-Modellreihe von Black Forest Labs betrieben wird und eine hochmoderne Leistung bei der Erstellung hochwertiger, vielfältiger Bilder mit außergewöhnlichen Fähigkeiten zur Befolgung von Eingabeaufforderungen bietet.

PixelHaha

Free TrialText to Image AI Art &Design Creator AI Illustration Generator

PixelHaha ist eine KI-gestützte Kunstgenerierungsplattform, die Texteingabeaufforderungen in hochwertige digitale Kunstwerke umwandelt, indem sie fortschrittliche KI-Modelle verwendet.

BlogBud AI

Contact for PricingAI Blog Writer AI SEO Tools Text to Image

BlogBud AI ist eine leistungsstarke, KI-gestützte Plattform zur Inhaltserstellung, die Nutzern hilft, Tausende von SEO-optimierten Blogartikeln in großem Maßstab mit den Technologien GPT-4o und DALL-E 3 zu erstellen.

Flux 1.1 PRO

PaidText to Image AI Photo & Image Generator AI Illustration Generator

Flux 1.1 Pro ist ein hochmodernes KI-Modell für Text-zu-Bild, das eine sechs Mal schnellere Generierung als sein Vorgänger bietet und gleichzeitig überlegene Bildqualität, Einhaltung von Eingabeaufforderungen und Ausgabediversität liefert und den höchsten Elo-Score in der Artificial Analysis Bildarena erreicht.

Beliebte KI-Tools wie MAI-Image-2.5

Kolors

Free TrialText to Image

Kolors ist ein groß angelegtes zweisprachiges Text-zu-Bild-Generierungsmodell, das von Kuaishou entwickelt wurde und in visueller Qualität, komplexer semantischer Genauigkeit und Textdarstellung für sowohl chinesische als auch englische Inhalte herausragt.

Wand AI

FreeAI Art &Design Creator Text to Image

Wand AI ist ein innovatives, KI-gestütztes Kreativwerkzeug, das Textaufforderungen und Skizzen in anpassbare digitale Kunstwerke verwandelt, die speziell für Künstler und kreative Fachleute auf iPhone und iPad entwickelt wurden.

Freepik AI Image Generator

FreemiumText to Image

Der AI-Bildgenerator von Freepik ist ein leistungsstarkes Text-zu-Bild-Tool, das hochwertige, fotorealistische Bilder in Echtzeit mit anpassbaren Stilen und unendlichen Variationen erstellt.

Seaart.ai

AI Art &Design Creator Text to Image

SeaArt.ai ist ein kostenloser KI-Kunstgenerator, der die Erstellung von Text-zu-Bild, KI-Charakterdesign, schnelle KI-Tools und die Möglichkeit zum Training benutzerdefinierter Modelle bietet.

Rangliste

Einreichen & BewerbenNew

MAI-Image-2.5

Produktinformationen

Was ist MAI-Image-2.5

Hauptfunktionen von MAI-Image-2.5

Anwendungsfälle von MAI-Image-2.5

Vorteile

Nachteile

Wie verwendet man MAI-Image-2.5

MAI-Image-2.5 FAQs

1. Was ist MAI-Image-2.5?

2. Wann wurde MAI-Image-2.5 eingeführt und welche Varianten sind verfügbar?

3. Wie schneidet MAI-Image-2.5 in den Arena-Bestenlisten ab?

4. Was sind die wichtigsten Funktionen von MAI-Image-2.5?

5. Wo können Entwickler auf MAI-Image-2.5 zugreifen?

6. Welche Microsoft-Produkte verwenden MAI-Image-2.5?

7. Wie viel kostet MAI-Image-2.5 in Foundry?

8. Welche Sicherheitsbeschränkungen nennt Microsoft für MAI-Image-2.5?

MAI-Image-2.5 Video

Beliebte Artikel

Neueste KI-Tools ähnlich wie MAI-Image-2.5

Beliebte KI-Tools wie MAI-Image-2.5