Step 3.5 Flash
Step 3.5 Flash adalah model fondasi sumber terbuka yang dibangun di atas arsitektur Mixture of Experts (MoE) yang jarang yang secara selektif hanya mengaktifkan 11B dari 196B parameter per token, memberikan penalaran tingkat atas dan kemampuan agentik dengan efisiensi luar biasa.
https://static.stepfun.com/blog/step-3.5-flash?ref=producthunt&utm_source=aipure

Informasi Produk
Diperbarui:Mar 6, 2026
Apa itu Step 3.5 Flash
Step 3.5 Flash adalah model fondasi sumber terbuka StepFun yang paling mumpuni, yang direkayasa untuk mengubah model statis menjadi agen aktif melalui kemampuan penalaran dan penggunaan alat yang canggih. Ini mendukung jendela konteks 256K dan mencapai throughput generasi 100-300 token/detik melalui Prediksi Multi-Token 3 arah (MTP-3). Model ini dirancang agar dapat diakses baik melalui API cloud (melalui OpenRouter dan Platform StepFun) maupun untuk penyebaran lokal pada perangkat keras konsumen kelas atas seperti Mac Studio M4 Max dan NVIDIA DGX Spark.
Fitur Utama Step 3.5 Flash
Step 3.5 Flash adalah model fondasi sumber terbuka mutakhir yang dikembangkan oleh StepFun yang menggunakan arsitektur Mixture of Experts (MoE) yang jarang, secara selektif hanya mengaktifkan 11B dari 196B parameternya per token. Fitur ini memiliki jendela konteks 256K, mencapai kecepatan generasi 100-350 token per detik, dan unggul dalam tugas-tugas agentik, penalaran matematis, pengkodean, dan penelitian mendalam sambil mempertahankan efisiensi tinggi dan aksesibilitas untuk penyebaran lokal.
Penggunaan Parameter yang Efisien: Menggunakan arsitektur MoE yang jarang yang hanya mengaktifkan 11B dari 196B parameter per token, memungkinkan kinerja tinggi sambil mempertahankan efisiensi komputasi
Kemampuan Penalaran Tingkat Lanjut: Menunjukkan kemahiran luar biasa dalam mengelola proses multi-tahap, termasuk penyerapan data, pembersihan, konstruksi fitur, dan interpretasi hasil dengan kinerja yang kuat pada tolok ukur matematika dan pengkodean
Pemrosesan Kecepatan Tinggi: Mencapai throughput generasi 100-350 token per detik dengan dukungan jendela konteks 256K, didukung oleh Prediksi Multi-Token 3 arah (MTP-3)
Dukungan Penyebaran Lokal: Dioptimalkan untuk penyebaran lokal pada perangkat keras pribadi kelas atas seperti Apple M4 Max, NVIDIA DGX Spark, atau AMD AI Max+ 395, memastikan eksekusi pribadi dan aman
Kasus Penggunaan Step 3.5 Flash
Analisis Data Profesional: Menangani tugas analisis data ujung-ke-ujung termasuk penyerapan data, pembersihan, konstruksi fitur, dan interpretasi hasil untuk aplikasi intelijen bisnis
Asisten Penelitian Mendalam: Melakukan penelitian komprehensif dengan merencanakan, mencari, merefleksikan, dan menulis, mencapai skor tinggi pada tolok ukur kualitas penelitian sambil mempertahankan akurasi faktual
Pengkodean dan Pengembangan: Membantu dalam pengembangan perangkat lunak dengan kinerja tinggi pada tolok ukur pengkodean, mampu menangani tugas pemrograman kompleks dan analisis arsitektur repositori
Analisis Investasi Saham: Menghasilkan rekomendasi perdagangan profesional dengan menganalisis data pasar, indikator teknis, dan mengelola peringatan otomatis melalui integrasi dengan beberapa alat
Kelebihan
Efisiensi tinggi dengan aktivasi parameter selektif
Kinerja yang kuat di berbagai tolok ukur
Mendukung penyebaran lokal untuk privasi yang ditingkatkan
Kecepatan inferensi cepat dengan 100-350 token per detik
Kekurangan
Membutuhkan lintasan generasi yang lebih panjang dibandingkan dengan beberapa pesaing
Mungkin mengalami penurunan stabilitas selama pergeseran distribusi
Kinerja terbatas dalam domain yang sangat terspesialisasi
Dapat menunjukkan inkonsistensi dalam dialog multi-giliran jangka panjang
Cara Menggunakan Step 3.5 Flash
Pilih metode akses: Anda dapat mengakses Step 3.5 Flash melalui: 1) OpenRouter 2) API Platform StepFun 3) Penyebaran lokal melalui format GGUF
Pengaturan API Cloud (Opsi 1 - OpenRouter): Mendaftar di OpenRouter untuk mendapatkan kunci API Anda. Gunakan URL dasar: https://openrouter.ai/api/v1 dengan model: stepfun/step-3.5-flash
Pengaturan API Cloud (Opsi 2 - Platform StepFun): Mendaftar di platform.stepfun.ai (Internasional) atau platform.stepfun.com (Tiongkok). Gunakan URL dasar: https://api.stepfun.ai/v1 (Internasional) atau https://api.stepfun.com/v1 (Tiongkok) dengan model: step-3.5-flash
Instal OpenClaw untuk kemampuan agen: Jalankan: curl -fsSL https://openclaw.ai/install.sh | bash
Konfigurasi OpenClaw: 1) Jalankan 'openclaw onboard' 2) Di WebUI, buka Config → Models 3) Tambahkan penyedia dengan tipe: openai-completions dan URL dasar: https://api.stepfun.ai/v1
Pengaturan Penyebaran Lokal: 1) Unduh model dari Hugging Face: stepfun-ai/Step-3.5-Flash-FP8 atau versi INT4 2) Gunakan vLLM atau llama.cpp untuk inferensi 3) Membutuhkan perangkat keras kelas atas seperti NVIDIA DGX Spark atau Apple M4 Max
Akses Antarmuka Web: Kunjungi stepfun.ai (Internasional) atau stepfun.com (Tiongkok) untuk menggunakan antarmuka web
Akses Aplikasi Seluler: Unduh aplikasi StepFun dari iOS App Store atau Google Play Store
Bergabung dengan Komunitas: Bergabung dengan komunitas Discord di https://discord.gg/RcMJhNVAQc untuk pembaruan dan dukungan
FAQ Step 3.5 Flash
Step 3.5 Flash adalah model fondasi sumber terbuka yang direkayasa untuk penalaran tingkat lanjut dan kemampuan agentik. Ia menggunakan arsitektur Mixture of Experts (MoE) yang jarang, hanya mengaktifkan 11B dari 196B parameternya per token. Ia unggul dalam penalaran mendalam, pengkodean, dan tugas-tugas agentik dengan kecepatan generasi 100-300 token/detik.
Artikel Populer

Tutorial Atoms 2026: Bangun Dasbor SaaS Lengkap dalam 20 Menit (Praktik Langsung AIPURE)
Mar 2, 2026

Kode Kupon OpenArt AI Gratis di Tahun 2026 dan Cara Menukarkannya
Feb 25, 2026

Alat AI Terpopuler Tahun 2025 | Pembaruan 2026 oleh AIPURE
Feb 10, 2026

Moltbook AI: Jaringan Sosial Agen AI Murni Pertama Tahun 2026
Feb 5, 2026







