MAI-Image-2.5는 언제 출시되었으며 어떤 변형이 있습니까?

Microsoft는 2026년 6월 2일 MAI-Image-2.5-Flash와 함께 MAI-Image-2.5를 발표했습니다. MAI-Image-2.5는 최대 충실도를 목표로 하며, MAI-Image-2.5-Flash는 확장 가능한 워크로드에 더 빠르고 저렴한 옵션으로 자리매김했습니다.

MAI-Image-2.5는 Arena 리더보드에서 어떻게 순위를 매깁니까?

Microsoft 보고서에 따르면 MAI-Image-2.5는 Arena의 텍스트-이미지 리더보드에서 3위, Arena의 이미지 편집(단일 이미지 편집) 리더보드에서 2위를 차지했으며, Nano Banana 2.1을 앞서고 Arena 점수는 GPT-Image-1.5 및 Nano Banana Pro 2K를 능가하는 것으로 보고되었습니다.

MAI-Image-2.5의 주요 기능은 무엇입니까?

Microsoft는 텍스트-이미지 품질(세부 사항, 일관성, 텍스트 렌더링, 제품 이미지, 프롬프트 준수), 복잡한 시각적 추론(장면 구조, 조명, 스케일, 공간 관계), 세분화된 지역화된 편집(객체 교체, 텍스트 업데이트, 나머지 변경 없이 모션 블러 제거), 편집 전반의 얼굴/신원 일관성 개선을 강조합니다.

개발자는 MAI-Image-2.5에 어디에서 액세스할 수 있습니까?

Microsoft는 MAI-Image-2.5 및 MAI-Image-2.5-Flash가 Microsoft Foundry(Azure AI Foundry)에서 개발자에게 제공되며 MAI Playground에서 시험해 볼 수 있다고 말합니다.

어떤 Microsoft 제품이 MAI-Image-2.5를 사용하고 있습니까?

Microsoft는 MAI-Image-2.5가 고품질 이미지 생성을 위해 PowerPoint에 적용되었으며 정밀한 사진 편집(예: 방해 요소 제거, 배경 정리, 장면을 보존하면서 이미지 향상)을 위해 OneDrive에 출시되고 있다고 밝혔습니다.

Foundry에서 MAI-Image-2.5의 비용은 얼마입니까?

Microsoft는 MAI-Image-2.5의 가격을 100만 텍스트 입력 토큰당 5달러, 100만 이미지 입력 토큰당 8달러, 100만 이미지 출력 토큰당 47달러로 책정했습니다. MAI-Image-2.5-Flash는 100만 텍스트 입력 토큰당 1.75달러, 100만 이미지 입력 토큰당 1.75달러, 100만 이미지 출력 토큰당 19.50달러로 책정되었습니다.

Microsoft는 MAI-Image-2.5에 대해 어떤 안전 제한 사항을 언급합니까?

Microsoft는 MAI-Image-2.5에 유해하거나 정책을 위반하는 콘텐츠를 감지하고 차단하는 데 도움이 되는 계층화된 안전 가드레일(프롬프트 및 출력 필터링)이 포함되어 있다고 말합니다. Microsoft는 또한 모든 이미지 모델과 마찬가지로 편향을 반영할 수 있으며 그럴듯하지만 부정확하거나 오해의 소지가 있는 세부 정보를 생성할 수 있으므로 민감한 컨텍스트(예: 신원, 법률, 의료, 금융 또는 뉴스 관련 워크플로우)에서 사용하기 전에 출력을 검토해야 한다고 경고합니다.

MAI-Image-2.5

WebsitePaidText to Image

MAI-Image-2.5는 Microsoft의 가장 강력한 이미지 모델로, 강력한 프롬프트 준수, 향상된 텍스트 렌더링 및 ID 일관된 얼굴 보존을 통해 고충실도 텍스트-이미지 생성 및 정밀하고 제어 가능한 이미지-이미지 편집을 제공합니다.

웹사이트 방문

이 도구 광고하기

https://microsoft.ai/news/introducing-mai-image-2-5?ref=producthunt&utm_source=aipure

개요
동영상
대안

제품 정보

업데이트됨:Jun 8, 2026

MAI-Image-2.5이란?

MAI-Image-2.5는 프로덕션 준비가 된 크리에이티브 워크플로우를 위해 구축된 Microsoft AI(MAI) 이미지 생성 및 편집 모델입니다. 고품질의 일관된 텍스트-이미지 출력과 대상 변경을 적용하면서 원본 장면을 보존하는 세밀한 이미지 편집에 중점을 둡니다. 타사 아레나 평가에서 MAI-Image-2.5는 텍스트-이미지 부문에서 3위, 이미지 편집 부문에서 2위(Nano Banana 2.1보다 앞서)를 차지하여 생성 및 편집 작업 모두에서 강력한 인간 선호도 성능을 반영합니다. Microsoft는 확장 가능하고 지연 시간에 민감한 워크로드를 위해 설계된 더 빠르고 저렴한 변형인 MAI-Image-2.5-Flash도 제공합니다. 이 모델 제품군은 Microsoft Foundry를 통해 개발자에게 제공되며 MAI Playground에서 시험해 볼 수 있으며, 이미 PowerPoint(이미지 생성) 및 OneDrive(정밀 사진 편집)와 같은 Microsoft 제품의 기능을 강화하고 있습니다.

MAI-Image-2.5의 주요 기능

MAI-Image-2.5는 Microsoft의 최고 충실도 이미지 생성 및 편집 모델로, 강력한 프롬프트 준수, 향상된 텍스트 렌더링, 이미지의 나머지 부분을 보존하는 제어 가능하고 지역화된 편집 기능을 통해 프로덕션 준비가 된 크리에이티브 워크플로우를 위해 설계되었습니다. 이 모델은 "보존을 통한 제어" 기능을 갖춘 이미지-이미지 편집 기능을 추가하고, 복잡한 시각적 추론(조명, 스케일, 공간 관계)을 지원하며, 편집 전반에 걸쳐 얼굴/신원 일관성을 유지합니다. Arena에서 높은 순위(텍스트-이미지 3위, 이미지 편집 2위)를 차지했으며, Microsoft Foundry 및 MAI Playground에서 사용할 수 있으며, PowerPoint(생성) 및 OneDrive(정밀 사진 편집)와 같은 제품 통합을 제공합니다. 더 빠르고 저렴한 변형(MAI-Image-2.5-Flash)은 확장 가능한 워크로드를 대상으로 합니다.

고충실도 텍스트-이미지 생성: 더 강력한 프롬프트 준수와 향상된 상업적 품질 출력(더 나은 타이포그래피 및 레이아웃 안정성 포함)을 통해 프롬프트로부터 더 상세하고 일관된 이미지를 생성합니다.

지역화된 제어를 통한 이미지-이미지 편집: 나머지 이미지를 변경하지 않고("보존을 통한 제어") 개체 교체, 텍스트 업데이트, 모션 블러 제거, 배경 정리와 같은 정밀한 편집을 지원합니다.

현실적인 편집을 위한 복잡한 시각적 추론: 장면 구조, 조명, 원근, 스케일 및 공간 관계를 이해하여 삽입되거나 수정된 요소가 컨텍스트와 일치하도록 합니다(예: 올바른 그림자 및 시점).

얼굴 및 신원 일관성: 포즈, 표정 또는 시점을 변경하더라도 편집 전반에 걸쳐 인식 가능한 얼굴 신원을 보존합니다. 이는 사람과 관련된 반복적인 크리에이티브 작업에 유용합니다.

두 가지 배포 옵션: 충실도 vs. 속도: MAI-Image-2.5는 최대 품질을 목표로 하며, MAI-Image-2.5-Flash는 높은 처리량의 프로덕션 파이프라인을 위해 더 빠르고 저렴한 생성 및 편집을 제공합니다.

엔터프라이즈 액세스 및 Microsoft 제품 통합: Microsoft Foundry API 및 MAI Playground를 통해 사용 가능하며, 프레젠테이션 준비가 된 비주얼을 위해 PowerPoint에 통합되었고, 정밀 사진 편집을 위해 OneDrive에 출시될 예정입니다.

MAI-Image-2.5의 사용 사례

마케팅 및 광고 크리에이티브: 향상된 타이포그래피와 프롬프트 충실도로 캠페인 컨셉, 제품 히어로 샷, 브랜드 지향적인 비주얼을 생성하고, 제어된 편집을 통해 빠르게 반복합니다.

패키징, 라벨 및 포스터 목업: 읽기 쉬운 텍스트가 중요한 디자인 초안(포스터, 라벨, 패키징 컨셉, 상점/선반 비주얼)을 만들고, 전체 이미지를 다시 만들 필요 없이 특정 영역을 정교하게 다듬습니다.

전자상거래 및 소매 콘텐츠 파이프라인: 확장 가능한 제품 이미지 변형(배경, 소품, 조명)을 생성하고, 핵심 제품 외관을 보존하면서 카탈로그를 위한 정리/편집을 수행합니다.

프레젠테이션 및 기업 커뮤니케이션: PowerPoint에서 프롬프트로부터 프레젠테이션 준비가 된 비주얼을 생성하고, 일관된 슬라이드 이미지를 만들고 특정 요소(아이콘, 제목, 다이어그램)를 반복합니다.

소비자 사진 편집 및 콘텐츠 복원: OneDrive 스타일 워크플로우에서 방해 요소를 제거하고, 배경을 정리하며, 원본 장면 구성을 보존하면서 사진을 향상시킵니다.

교육 및 교육용 그래픽: 구조화된 레이아웃과 내장 텍스트가 필요한 다이어그램, 포스터 및 설명 비주얼을 생성하고, 라벨이나 요소를 수정하기 위해 특정 편집을 적용합니다.

장점

독립 Arena 리더보드에서 강력한 생성 및 편집 성능(텍스트-이미지 및 이미지 편집 모두에서 최고 수준).

보존 기능을 갖춘 세밀하고 지역화된 편집은 재작업을 줄이고 반복적인 프로덕션 스타일 워크플로우를 가능하게 합니다.

이전 버전에 비해 향상된 텍스트 렌더링 및 상업적 이미지 품질로, 출력을 디자인 준비 상태로 만듭니다.

확장 가능한 프로덕션 워크로드를 위한 Flash 변형을 통한 유연한 비용/지연 시간 트레이드오프.

단점

모든 이미지 모델과 마찬가지로 훈련 데이터 편향을 반영할 수 있으며, 그럴듯하지만 부정확하거나 오해의 소지가 있는 세부 정보를 생성할 수 있습니다. 민감한 컨텍스트(신원, 법률, 의료, 금융, 뉴스)에서는 사람의 검토가 필요합니다.

안전 필터 및 정책 가드레일은 특정 프롬프트/편집을 제한할 수 있으며, 이는 일부 크리에이티브 또는 엣지 케이스 워크플로우를 제약할 수 있습니다.

고충실도 사용은 Flash보다 비용이 더 많이 들 수 있으므로 대규모 파이프라인의 경우 비용 관리가 필요합니다.

MAI-Image-2.5 사용 방법

1) MAI-Image-2.5에 액세스하는 방법을 선택하세요.: 워크플로우에 맞는 진입점을 선택하세요: (a) Microsoft Foundry (API/프로덕션), (b) MAI Playground (대화형 테스트), 또는 (c) 통합된 Microsoft 제품 (생성을 위한 PowerPoint; 정밀 편집 출시를 위한 OneDrive).

2) 사용할 모델 변형을 결정하세요 (품질 vs 속도/비용).: 최대 충실도 및 세밀한 제어를 위해 MAI-Image-2.5를 사용하세요. 더 빠르고 확장 가능하며 저렴한 생성/편집 워크로드를 위해 MAI-Image-2.5-Flash를 사용하세요.

3) MAI Playground에서 빠르게 시도해 보세요 (코드 없는 평가).: https://playground.microsoft.ai/chat에서 MAI Playground를 열고, 모델 선택기에서 MAI-Image-2.5 (또는 MAI-Image-2.5-Flash)를 선택한 다음, 텍스트-이미지 프롬프트를 실행하여 스타일, 프롬프트 준수, 특히 이미지 내 텍스트 렌더링을 평가하세요.

4) 텍스트 프롬프트에서 이미지를 생성하세요 (텍스트-이미지).: Playground (또는 나중에 API를 통해)에서 주제, 환경, 조명, 카메라/스타일, 필요한 이미지 내 텍스트를 설명하는 상세한 프롬프트를 입력하세요. MAI-Image-2.5는 제품 이미지, 양식화된 일러스트레이션, 더 선명한 텍스트 렌더링에 특히 강력한 것으로 평가됩니다.

5) 이미지-이미지 편집을 수행하세요 (이미지를 업로드한 다음 편집을 설명하세요).: 기존 이미지를 제공하고 원하는 변경 사항을 지정하세요 (예: 개체 교체, 레이블/포스터의 텍스트 업데이트, 모션 블러 제거, 배경 정리). MAI-Image-2.5는 로컬 편집을 적용하는 동안 이미지의 나머지 부분을 안정적으로 유지하도록 설계되었습니다.

6) 세밀하고 로컬화된 편집 지침을 사용하세요.: 편집할 때 변경해야 할 것과 변경하지 않아야 할 것을 명확히 하세요 (예: "병 라벨의 로고만 교체하세요; 조명, 반사, 배경은 동일하게 유지하세요"). 이 모델은 장면의 나머지 부분을 변경하지 않고 정밀하고 제어 가능한 편집을 지원하는 것으로 설명됩니다.

7) 사실적인 편집을 위해 장면 구조 인식을 활용하세요.: 추가/제거의 경우, 원근, 그림자, 스케일에 대한 제약 조건을 포함하세요 (예: "창문 빛과 일치하는 부드러운 그림자와 일치하는 원근으로 테이블에 머그잔을 추가하세요"). MAI-Image-2.5는 컨텍스트에 맞는 편집을 위해 조명 및 공간 관계를 이해하는 것으로 설명됩니다.

8) 편집 전반에 걸쳐 얼굴/ID 일관성을 유지하세요 (해당하는 경우).: 초상화를 편집하는 경우, 포즈/표정/시점을 변경하는 동안 ID를 보존해야 한다고 지정하세요 (예: "동일한 사람을 유지하고; 표정을 미묘한 미소로 변경하고; 피부 톤과 얼굴 특징을 일관되게 유지하세요"). MAI-Image-2.5는 편집 전반에 걸쳐 인식 가능한 유사성을 보존하는 것으로 설명됩니다.

9) Microsoft Foundry를 통해 프로덕션으로 이동하세요 (개발자/API 경로).: Microsoft Foundry에서 MAI-Image-2.5 또는 MAI-Image-2.5-Flash 모델 카드를 찾아 애플리케이션의 모델 엔드포인트로 배포/사용하세요. Foundry는 API를 통해 모델을 호출하기 위한 주요 개발자 액세스 경로로 설명됩니다.

10) 올바른 변형을 사용하여 비용 및 처리량을 최적화하세요.: 일괄 생성 또는 대량 파이프라인의 경우 MAI-Image-2.5-Flash를 선호하고; 프리미엄 크리에이티브 자산 및 최대 편집 충실도의 경우 MAI-Image-2.5를 선호하세요. 공식 소스는 Flash를 더 빠르고 저렴하며 MAI-Image-2.5를 최대 충실도로 강조합니다.

11) Microsoft 제품 내에서 사용하세요 (사용 가능한 경우).: PowerPoint: PowerPoint의 Copilot을 사용하여 프롬프트에서 프레젠테이션 준비가 된 시각 자료/슬라이드를 생성하세요. OneDrive: AI 사진 편집 기능 (출시 예정)을 사용하여 방해 요소를 제거하고 배경을 정리하는 등 정밀한 편집을 수행하면서 원본 장면을 보존하세요.

12) 민감한 사용 사례에 대해 인간 검토 단계를 추가하세요.: Microsoft는 이 모델이 그럴듯하지만 부정확하거나 오해의 소지가 있는 시각적 세부 정보를 생성할 수 있으며 훈련 데이터 편향을 반영할 수 있다고 언급합니다. 민감한 컨텍스트 (ID, 법률, 의료, 금융 또는 뉴스 관련 워크플로우)에서 사용하기 전에 출력을 검토하세요.

MAI-Image-2.5 자주 묻는 질문

MAI-Image-2.5는 고품질 텍스트-이미지 생성 및 정밀하고 제어 가능한 이미지 편집을 위한 Microsoft AI의 최신 이미지 모델입니다. Microsoft는 이 모델을 프로덕션 준비 워크플로우를 위해 설계된 현재까지 가장 강력한 이미지 모델이라고 설명합니다.