Apa spesifikasi teknis utama dari QwQ-32B?

QwQ-32B memiliki total 32,5 miliar parameter (31,0 miliar non-embedding), 64 layer, 40 attention head untuk Q dan 8 untuk KV (GQA), dan mendukung panjang konteks 131.072 token. Ia menggunakan transformer dengan RoPE, SwiGLU, RMSNorm, dan arsitektur bias Attention QKV.

Apa panduan penggunaan yang disarankan untuk kinerja optimal?

Panduan utama meliputi: 1) Terapkan output yang bijaksana dengan memulai dengan '<think>\n', 2) Gunakan Temperature=0.6 dan TopP=0.95 untuk pengambilan sampel, 3) Gunakan TopK antara 20-40, 4) Kecualikan konten pemikiran dalam riwayat percakapan, 5) Aktifkan YaRN untuk input yang melebihi 32.768 token.

Apa saja persyaratan untuk menggunakan QwQ-32B?

QwQ-32B didasarkan pada Qwen2.5 dan memerlukan versi terbaru dari pustaka 'transformers' Hugging Face (versi 4.37.0 atau lebih baru). Menggunakan versi yang lebih lama akan menghasilkan kesalahan 'KeyError: qwen2'.

Bagaimana cara saya mengakses atau mencoba QwQ-32B?

Anda dapat mengakses QwQ-32B melalui tiga cara: 1) Coba demo di Hugging Face Spaces, 2) Akses melalui platform QwenChat (chat.qwen.ai), atau 3) Sebarkan sendiri menggunakan cuplikan kode yang disediakan dengan pustaka transformers.

QwQ-32B

WebsiteContact for PricingLarge Language Models (LLMs)Research Tools

QwQ-32B adalah model bahasa fokus penalaran parameter 32,5 miliar dari seri Qwen yang unggul dalam pemecahan masalah kompleks melalui peningkatan kemampuan berpikir dan penalaran dibandingkan dengan model yang disetel instruksi konvensional.

Kunjungi Situs Web

Iklankan Alat Ini

https://huggingface.co/Qwen/QwQ-32B?ref=aipure&utm_source=aipure

Ikhtisar
Alternatif

Informasi Produk

Diperbarui:Aug 16, 2025

Apa itu QwQ-32B

QwQ-32B adalah model penalaran berukuran sedang dalam seri Qwen, yang dikembangkan oleh Tim Qwen sebagai bagian dari keluarga model Qwen2.5 mereka. Ini adalah model bahasa kausal dengan 32,5 miliar parameter yang telah menjalani pra-pelatihan dan pasca-pelatihan (termasuk penyetelan halus yang diawasi dan pembelajaran penguatan). Model ini menampilkan arsitektur transformer dengan RoPE, SwiGLU, RMSNorm, dan bias Perhatian QKV, yang berisi 64 lapisan dengan 40 kepala perhatian untuk Q dan 8 untuk KV. Model ini mendukung panjang konteks penuh 131.072 token dan dirancang untuk mencapai kinerja kompetitif terhadap model penalaran canggih lainnya seperti DeepSeek-R1 dan o1-mini.

Fitur Utama QwQ-32B

QwQ-32B adalah model penalaran berukuran sedang dari seri Qwen dengan 32,5 miliar parameter, dirancang untuk meningkatkan kinerja dalam tugas penalaran kompleks. Model ini memiliki arsitektur canggih termasuk transformer dengan RoPE, SwiGLU, RMSNorm, dan bias Atensi QKV, mendukung panjang konteks 131.072 token. Model ini menunjukkan kemampuan penalaran yang unggul dibandingkan dengan model yang disetel instruksi konvensional dan mencapai kinerja kompetitif terhadap model penalaran canggih seperti DeepSeek-R1 dan o1-mini.

Arsitektur Penalaran Tingkat Lanjut: Menggabungkan komponen khusus seperti RoPE, SwiGLU, RMSNorm, dan bias Atensi QKV dengan 64 lapisan dan 40/8 kepala atensi untuk Q dan KV

Pemrosesan Konteks yang Diperluas: Mampu menangani hingga 131.072 token dengan dukungan penskalaan YaRN untuk pemrosesan informasi urutan panjang yang ditingkatkan

Pembuatan Output yang Bijaksana: Menampilkan proses berpikir unik yang ditandai dengan tag <think> untuk memastikan respons berkualitas tinggi dan beralasan baik

Opsi Penerapan yang Fleksibel: Mendukung beberapa kerangka penerapan termasuk vLLM dan berbagai format kuantisasi (GGUF, 4-bit bnb, 16-bit)

Kasus Penggunaan QwQ-32B

Pemecahan Masalah Matematika: Unggul dalam memecahkan masalah matematika kompleks dengan penalaran langkah demi langkah dan format jawaban standar

Analisis dan Pembuatan Kode: Menunjukkan kemampuan yang kuat dalam tugas pengkodean dan penalaran teknis

Penilaian Pilihan Ganda: Menangani tanya jawab terstruktur dengan format respons standar dan penalaran terperinci

Kelebihan

Kinerja yang kuat dalam tugas penalaran kompleks

Dukungan panjang konteks yang luas

Beberapa opsi penerapan dan kuantisasi

Kekurangan

Membutuhkan format perintah khusus untuk kinerja optimal

Dapat mencampur bahasa atau beralih di antara keduanya secara tak terduga

Keterbatasan kinerja dalam penalaran akal sehat dan pemahaman bahasa yang bernuansa

Cara Menggunakan QwQ-32B

Instal Dependensi yang Diperlukan: Pastikan Anda memiliki versi terbaru dari pustaka transformer Hugging Face (versi 4.37.0 atau lebih tinggi) yang terinstal untuk menghindari masalah kompatibilitas

Impor Pustaka yang Diperlukan: Impor AutoModelForCausalLM dan AutoTokenizer dari pustaka transformer

Muat Model dan Tokenizer: Inisialisasi model menggunakan model_name='Qwen/QwQ-32B' dengan pemetaan perangkat otomatis dan dtype. Muat tokenizer yang sesuai

Siapkan Input: Format input Anda sebagai daftar kamus pesan dengan kunci 'role' dan 'content'. Gunakan format templat obrolan

Hasilkan Respons: Gunakan model.generate() dengan parameter yang direkomendasikan: Temperature=0.6, TopP=0.95, dan TopK antara 20-40 untuk hasil optimal

Proses Output: Dekode token yang dihasilkan menggunakan tokenizer.batch_decode() untuk mendapatkan respons akhir

Opsional: Aktifkan Konteks Panjang: Untuk input lebih dari 32.768 token, aktifkan YaRN dengan menambahkan konfigurasi rope_scaling ke config.json

Ikuti Panduan Penggunaan: Pastikan model dimulai dengan '<think>\n', kecualikan konten pemikiran dari riwayat percakapan, dan gunakan perintah standar untuk tugas-tugas tertentu seperti masalah matematika atau pertanyaan pilihan ganda

FAQ QwQ-32B

QwQ-32B adalah model penalaran dari seri Qwen, yang dirancang untuk kemampuan berpikir dan bernalar yang ditingkatkan. Ini adalah model berukuran sedang dengan 32,5 miliar parameter yang dapat mencapai kinerja kompetitif terhadap model penalaran canggih seperti DeepSeek-R1 dan o1-mini.

Artikel Populer

Ulasan Lmarena Nano Banana 2025: Apakah Generator Gambar AI Ini Raja Baru? (Tes Nyata & Umpan Balik Pengguna)

Aug 20, 2025

Cara Menggunakan Nano Banana Lmarena Gratis (2025): Panduan Utama untuk Pembuatan Gambar AI yang Cepat & Kreatif

Aug 18, 2025

Nano-Banana: Generator Gambar AI Misterius yang Lebih Baik dari Flux Kontext di Tahun 2025

Aug 15, 2025

Google Veo 3: Generator Video AI Pertama yang Mendukung Audio Secara Native

Aug 14, 2025

Alat AI Terbaru Serupa dengan QwQ-32B

Athena AI

FreemiumAI Productivity Tools Large Language Models (LLMs)

Athena AI adalah platform bertenaga AI yang serbaguna yang menawarkan bantuan belajar yang dipersonalisasi, solusi bisnis, dan pelatihan hidup melalui fitur seperti analisis dokumen, pembuatan kuis, kartu flash, dan kemampuan obrolan interaktif.

Aguru AI

Free TrialMonitor & Log Management Large Language Models (LLMs)

Aguru AI adalah solusi perangkat lunak on-premises yang menyediakan pemantauan komprehensif, keamanan, dan alat optimisasi untuk aplikasi berbasis LLM dengan fitur seperti pelacakan perilaku, deteksi anomali, dan optimisasi kinerja.

GOAT AI

FreemiumSummarizer Large Language Models (LLMs)

GOAT AI adalah platform yang didukung AI yang menyediakan kemampuan ringkasan satu klik untuk berbagai jenis konten termasuk artikel berita, makalah penelitian, dan video, sambil juga menawarkan orkestrasi agen AI canggih untuk tugas spesifik domain.

GiGOS

Free TrialLarge Language Models (LLMs)Multi-purpose Tools

GiGOS adalah platform AI yang menyediakan akses ke berbagai model bahasa canggih seperti Gemini, GPT-4, Claude, dan Grok dengan antarmuka intuitif bagi pengguna untuk berinteraksi dan membandingkan berbagai model AI.

Alat AI Populer Seperti QwQ-32B

ChatGPT

Large Language Models (LLMs)AI Chatbot

ChatGPT adalah chatbot canggih yang didukung AI yang dikembangkan oleh OpenAI yang menggunakan pemrosesan bahasa alami untuk terlibat dalam percakapan mirip manusia dan membantu dengan berbagai tugas.

SearchGPT

Free TrialAI Search Engine Large Language Models (LLMs)

SearchGPT adalah prototipe pencarian yang didukung AI oleh OpenAI yang memberikan jawaban cepat, percakapan dengan sumber yang jelas menggunakan model GPT.

Gemini 2.5 Pro Preview 05-06

Free TrialLarge Language Models (LLMs)AI Chatbot

Gemini adalah keluarga model AI multimodal paling canggih dan mampu dari Google yang dapat memahami dan bernalar secara mulus di seluruh teks, gambar, video, audio, dan kode untuk mendukung berbagai aplikasi dan layanan AI.

OpenAI

Free TrialLarge Language Models (LLMs)

OpenAI adalah perusahaan penelitian kecerdasan buatan terkemuka yang mengembangkan model dan teknologi AI canggih untuk manfaat umat manusia.

Peringkat

Kirim & PromosikanNew