Gemma 4 ファミリーにはどのようなモデルが含まれていますか？

Gemma 4 には、エッジデバイス向けに最適化された E2B (Effective 2B) および E4B (Effective 4B)、推論中に 38 億のパラメータをアクティブにする 26B Mixture of Experts (MoE) モデル、および最高の品質と微調整のための 31B Dense モデルの 4 つのモデルサイズが含まれています。

Gemma 4 はモバイルデバイスやエッジハードウェアで実行できますか？

はい。E2B および E4B モデルは、Android スマートフォン、Raspberry Pi、NVIDIA Jetson Orin Nano などのエッジデバイスで完全にオフラインで実行できるように特別に設計されています。E2B モデルは、一部のデバイスで 1.5GB 未満のメモリで実行できます。

Gemma 4 の主な機能は何ですか？

Gemma 4 は、マルチステッププランニングによる高度な推論、関数呼び出しや構造化された JSON 出力を含むエージェントワークフローのネイティブサポート、高品質のコード生成、ネイティブのビジョンおよびオーディオ処理、最大 256K トークンのコンテキストウィンドウ、および 140 以上の言語のサポートを備えています。

Gemma 4 は他のオープンモデルと比較してどのように機能しますか？

31B モデルは、オープンモデルの Arena AI テキストリーダーボードで 3 位にランクインし、26B モデルは 6 位にランクインしています。Gemma 4 は、パラメータ数の割に最先端のパフォーマンスを提供し、20 倍のサイズのモデルを凌駕します。

Gemma 4 をサポートするプラットフォームとツールは何ですか？

Gemma 4 は、Hugging Face (Transformers, TRL)、LiteRT-LM、vLLM、llama.cpp、MLX、Ollama、NVIDIA NIM および NeMo、LM Studio、Unsloth、SGLang、Baseten、Docker、MaxText、Keras を day-one でサポートしています。Google AI Studio、Vertex AI、Kaggle、Hugging Face から入手できます。

特定のユースケースに合わせて Gemma 4 を微調整できますか？

はい。Gemma 4 は、Google Colab、Vertex AI、またはコンシューマー GPU などのプラットフォームを使用して微調整できます。微調整のサポートは、TRL を使用した Hugging Face Transformers、メモリ効率の高いトレーニングのための Unsloth、およびエンタープライズパイプライン用の NVIDIA NeMo を介して利用できます。

Gemma 4 を使用するにはインターネット接続が必要ですか？

いいえ。ダウンロードすると、Gemma 4 は API キー、クラウドコール、または使用コストを必要とせずに完全にオフラインで動作します。これにより、プライバシーに配慮したアプリケーションや接続が制限された環境に最適です。

Google Gemma 4

Q: Gemma 4 は商用利用は無料ですか？

はい。Gemma 4 は Apache 2.0 ライセンスの下でリリースされており、ロイヤリティ、月間アクティブユーザー制限、または利用規定の強制制限なしに、商用利用、再配布、および変更が可能です。

WebsiteFreeLarge Language Models (LLMs)Multi-purpose Tools

Google Gemma 4 は、Apache 2.0 ライセンスでリリースされた最先端のオープンウェイト AI モデルのファミリーであり、高度な推論、マルチモーダル機能、およびスマートフォンからワークステーションまでのデバイスで効率的に実行できるエージェントワークフローを備えています。

ウェブサイトを訪問

このツールを宣伝する

https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4?ref=producthunt&utm_source=aipure

概要
分析
動画
代替案

製品情報

更新日:2026年04月10日

Google Gemma 4 の月間トラフィック傾向

Google Gemma 4は先月8.5mのアクセスを記録し、-12.1%のわずかな減少を示しました。分析によると、このトレンドはAIツール分野の一般的な市場動向と一致しています。

過去のトラフィックを表示

Google Gemma 4とは

2026 年 4 月 2 日に発表された Google Gemma 4 は、Gemini 3 と同じ研究および技術基盤上に構築された、Google DeepMind の最新世代のオープン AI モデルです。商用利用が可能な Apache 2.0 ライセンスでリリースされた Gemma 4 は、最先端レベルの AI 機能を開発者、研究者、企業が広く利用できるように設計されています。このモデルファミリーには、E2B (実効 20 億パラメータ)、E4B (実効 40 億パラメータ)、26B Mixture of Experts (MoE)、および 31B Dense の 4 つの異なるサイズがあり、それぞれがモバイルデバイスや IoT ハードウェアからプロフェッショナルワークステーションやクラウドインフラストラクチャまで、さまざまなハードウェア構成向けに最適化されています。4 億回以上ダウンロードされ、10 万を超えるコミュニティ作成のバリアントの「Gemmaverse」を生み出した、以前の Gemma 世代の成功に基づいて構築された Gemma 4 は、前例のないインテリジェンス/パラメータを提供し、31B モデルは Arena AI テキストリーダーボードでオープンモデルの中で 3 位、26B モデルは 6 位にランクインし、最大 20 倍のサイズのモデルを上回っています。

Google Gemma 4の主な機能

Google Gemma 4は、Gemini 3と同じ研究基盤上に構築された、Apache 2.0ライセンスでリリースされた最先端のオープンAIモデルのファミリーです。モバイルデバイスからワークステーションまで、さまざまなハードウェア向けに最適化された4つのサイズ（E2B、E4B、26B MoE、31B Dense）があります。このモデルは、高度な推論、エージェントワークフローのためのネイティブ関数呼び出し、マルチモーダル機能（テキスト、画像、ビデオ、および小型モデルでのオーディオ）、140以上の言語のサポート、最大256Kトークンまでの拡張コンテキストウィンドウ、および卓越したコード生成を特徴としています。オンデバイスでの展開向けに設計されたGemma 4は、最小限のハードウェア要件で最先端のAI機能を提供し、完全なデータ主権とプライバシーを維持します。

高度な推論とエージェントワークフロー: マルチステッププランニング、関数呼び出し、構造化されたJSON出力、およびシステム命令のネイティブサポートにより、開発者はツール、APIと対話し、複雑なワークフローを確実に実行できる自律型AIエージェントを構築できます。

マルチモーダル理解: すべてのモデルは、可変解像度でテキスト、画像、およびビデオをネイティブに処理し、OCRやチャートの理解などの視覚タスクに優れています。E2BおよびE4Bモデルは、複数の言語での音声認識および翻訳のためのネイティブオーディオ入力もサポートしています。

ニアゼロレイテンシでのオンデバイス展開: スマートフォン、Raspberry Pi、およびIoTハードウェアを含むエッジデバイス向けに最適化されており、Qualcomm、MediaTek、およびGoogle Pixelチームとのコラボレーションを通じて、最小限のメモリフットプリント（一部のデバイスではE2Bが<1.5GBを使用）で完全にオフラインで実行されます。

大規模な多言語サポート: 140以上の言語で事前トレーニングされ、35以上の言語をすぐにサポートできるため、開発者はグローバルオーディエンス向けの適切な文化的コンテキスト理解を備えた包括的で高性能なアプリケーションを構築できます。

拡張コンテキストウィンドウ: エッジモデルは128Kトークンのコンテキストウィンドウを備えており、より大きなモデルは最大256Kトークンを提供するため、開発者は単一のプロンプトでコードリポジトリ全体、長いドキュメント、または広範な会話を処理できます。

Apache 2.0オープンソースライセンス: 月間アクティブユーザー制限または許容される使用ポリシーの制限がない商用的に寛容なライセンスにより、完全な開発者の柔軟性、デジタル主権、およびデータ、インフラストラクチャ、およびモデル展開の完全な制御が提供されます。

Google Gemma 4のユースケース

ローカルAIコーディングアシスタント: 開発者は、Android StudioおよびIDEでGemma 4を使用して、コードをクラウドに送信せずにローカルコードの生成、補完、および修正を強化し、プライバシーを維持し、開発ワークフローのレイテンシを削減できます。

オフラインモバイルアプリケーション: 音声アシスタント、リアルタイム翻訳、ドキュメントの要約、画像分析などの機能を備えたインテリジェントなAndroidアプリを構築し、インターネット接続なしで完全にデバイス上で実行し、ユーザーのプライバシーと即時の応答を保証します。

エンタープライズソブリンAIソリューション: 組織および政府機関は、厳格なデータ所在地、コンプライアンス、および主権の要件を満たすローカライズされたAIサービスを展開し、地域のニュアンスを尊重し、機密データを完全に制御できます。

ヘルスケアおよび科学研究: イェール大学のCell2Sentence-Scaleで実証されているように、がん治療の発見など、特殊な医療または科学アプリケーション向けにGemma 4を微調整し、オンプレミス展開を通じてHIPAAコンプライアンスとデータセキュリティを維持します。

自律型AIエージェント: 顧客サービスワークフローから複雑なビジネスプロセス自動化まで、マルチステップタスクを自動化するために、個人のファイル、アプリケーション、データベース、および外部APIと対話できる常時オンのAIアシスタントを構築します。

多言語コンテンツ処理: 適切な文化的コンテキストで140以上の言語にわたってコンテンツを理解および生成するアプリケーションを作成し、グローバルビジネスがローカライズされた顧客体験、翻訳サービス、および国際サポートシステムを提供できるようにします。

メリット

Apache 2.0ライセンスは、Llama 4などの競合他社とは異なり、ユーザー制限や制限的なポリシーなしに、完全な商用自由を提供します

Arena AIリーダーボードでグローバルに3位と6位にランクインし、競合他社の20倍のサイズを上回るモデルで卓越した効率を実現します

最小限のメモリフットプリント（E2Bの場合は<1.5GB）を備えた真のオンデバイス展開機能により、スマートフォンおよびエッジデバイスでのオフライン操作が可能になります

主要なフレームワークおよびツール（Hugging Face、vLLM、llama.cpp、Ollama、NVIDIA NIMなど）の包括的な初日サポートにより、簡単な統合が保証されます

デメリット

オープンウェイトモデルは、厳格な集中管理または監視なしに、誤用に関する潜在的な懸念を引き起こします

マネージドクラウドサービスと比較して、特定のユースケース向けに展開、微調整、および最適化するには、技術的な専門知識が必要です

小型モデル（E2B、E4B）は、効率のために一部の機能をトレードオフし、高度に複雑なタスクでのパフォーマンスを制限する可能性があります

Gemini Nano 4との前方互換性は2026年後半に約束されており、一部のプロダクション機能はまだプレビューまたは開発中です

Google Gemma 4の使い方

1. デプロイ環境を選択する: Gemma 4 を実行する場所を決定します: オンデバイス (Android、Raspberry Pi、デスクトップ)、クラウド (Google Cloud、Vertex AI)、または開発マシン上でローカルに。適切なモデルサイズを選択します: モバイル/IoT 向けには E2B (20 億パラメータ)、エッジデバイス向けには E4B (40 億パラメータ)、高速推論向けには 26B MoE、または最高の品質を求める場合は 31B Dense。

2. 好みのプラットフォームから Gemma 4 にアクセスする: 迅速な実験には、Google AI Studio (31B および 26B モデルの場合) または Google AI Edge Gallery (E4B および E2B モデルの場合) を使用します。モデルの重みをダウンロードするには、Hugging Face、Kaggle、または Ollama にアクセスします。Android 開発の場合は、AICore Developer Preview または Android Studio からアクセスします。

3. 必要な依存関係とツールをインストールする: 初日からサポートされているお好みのフレームワークをインストールします: Hugging Face Transformers、vLLM、llama.cpp、MLX、Ollama、LM Studio、または Unsloth。ローカルデプロイメントの場合は、最小モデル (E2B) で少なくとも 4GB の RAM、または最大モデル (31B) で最大 19GB の RAM が必要です。Python ベースのワークフローの場合は、pip を使用して必要なライブラリをインストールします。

4. モデルをロードして初期化する: 選択したプラットフォームからモデルの重みをダウンロードします。Hugging Face の場合は、Transformers ライブラリを使用してモデルをロードします。ローカル CLI の使用法については、litert-lm CLI ツール (Linux、macOS、および Raspberry Pi で利用可能) を使用します。Ollama の場合は、'ollama pull gemma4' を実行し、次に特定のモデルバリアントを実行します。Unsloth Studio の場合は、'curl -fsSL https://unsloth.ai/install.sh | sh' を使用してインストールし、'unsloth studio -H 0.0.0.0 -p 8888' で起動します。

5. モデルパラメータとシステムプロンプトを構成する: コンテキストウィンドウ (エッジモデルの場合は 128K、より大きなモデルの場合は最大 256K) を含む推論パラメータを設定します。構造化された会話のために 'system' ロールを指定して、ネイティブシステムプロンプトサポートを利用します。ユースケースに基づいて、温度、top-p、およびその他の生成パラメータを構成します。

6. 基本的なテキスト生成を実装する: モデルをテストするために、簡単なテキストプロンプトから始めます。チャットアプリケーションの場合は、適切なロールタグ (system、user、assistant) を使用して入力をフォーマットします。モデルは、テキスト、画像、およびオーディオ入力をサポートします (オーディオは E2B および E4B モデルのみ)。応答を処理し、必要に応じてストリーミング出力を処理します。

7. エージェントワークフローの関数呼び出しを設定する: 明確な説明と引数仕様 (例: 天気検索関数) を使用して、ツールと関数を定義します。Gemma 4 の関数呼び出しスキーマに従ってツール定義をフォーマットします。利用可能なツールとともにユーザープロンプトを送信すると、モデルは必要に応じて JSON 形式で構造化された関数呼び出しオブジェクトを生成します。

8. ツールの実行と応答処理を実装する: モデルの関数呼び出し出力を解析して、関数名と引数を抽出します。提供されたパラメータを使用して、要求された関数を実行します。関数結果を会話コンテキストでモデルに返します。モデルは、ツール結果を組み込んだ自然言語応答を生成します。

9. マルチモーダル機能を有効にする (オプション): ビジョンタスクの場合は、チャート、図、OCR、または視覚コンテンツを分析するために、テキストプロンプトとともに画像を渡します。すべての Gemma 4 モデルは、可変解像度で画像およびビデオ入力をサポートします。E2B および E4B モデルの場合は、自動音声認識 (ASR) および複数の言語間での音声から翻訳されたテキスト翻訳のために、オーディオ入力を含めます。

10. 本番環境へのデプロイメントに最適化する: Android アプリの場合は、ML Kit GenAI Prompt API を使用して、AICore を使用して Gemma 4 をオンデバイスで実行します。クラウドデプロイメントの場合は、Google Cloud で Vertex AI、Cloud Run、または GKE を使用します。量子化 (Q4_K_M など) を適用して、ローカルデプロイメントのメモリフットプリントを削減します。トークン/秒やレイテンシなどのパフォーマンスメトリックを監視します。Android の場合、Gemma 4 用に記述されたコードは、Gemini Nano 4 デバイスとの前方互換性があります。

11. 特定のユースケースに合わせて微調整する (オプション): Google Colab、Vertex AI、または Unsloth などのプラットフォームを使用して、特定のタスクに合わせて Gemma 4 をカスタマイズします。適切な形式でトレーニングデータセットを準備します。トレーニングパラメータを構成し、効率的な微調整のために Hugging Face TRL などのツールを活用します。Apache 2.0 ライセンスにより、完全なカスタマイズと商用利用が可能です。

12. 安全対策とセキュリティ対策を実装する: 安全ガイドラインについては、責任ある生成 AI ツールキットとモデルカードを確認してください。アプリケーション要件に基づいてコンテンツフィルタリングを実装します。物理アクチュエータを備えたエッジ/ロボティクスデプロイメントの場合は、署名付き委任トークンを検証し、ツールの実行前に不可逆性によってアクションを分類するために、HDP (Helix Delegation Protocol) などのセキュリティミドルウェアを検討してください。