Step 3.5 Flash

Step 3.5 Flash adalah model fondasi sumber terbuka yang dibangun di atas arsitektur Mixture of Experts (MoE) yang jarang yang secara selektif hanya mengaktifkan 11B dari 196B parameter per token, memberikan penalaran tingkat atas dan kemampuan agentik dengan efisiensi luar biasa.
https://static.stepfun.com/blog/step-3.5-flash?ref=producthunt&utm_source=aipure
Step 3.5 Flash

Informasi Produk

Diperbarui:Mar 6, 2026

Apa itu Step 3.5 Flash

Step 3.5 Flash adalah model fondasi sumber terbuka StepFun yang paling mumpuni, yang direkayasa untuk mengubah model statis menjadi agen aktif melalui kemampuan penalaran dan penggunaan alat yang canggih. Ini mendukung jendela konteks 256K dan mencapai throughput generasi 100-300 token/detik melalui Prediksi Multi-Token 3 arah (MTP-3). Model ini dirancang agar dapat diakses baik melalui API cloud (melalui OpenRouter dan Platform StepFun) maupun untuk penyebaran lokal pada perangkat keras konsumen kelas atas seperti Mac Studio M4 Max dan NVIDIA DGX Spark.

Fitur Utama Step 3.5 Flash

Step 3.5 Flash adalah model fondasi sumber terbuka mutakhir yang dikembangkan oleh StepFun yang menggunakan arsitektur Mixture of Experts (MoE) yang jarang, secara selektif hanya mengaktifkan 11B dari 196B parameternya per token. Fitur ini memiliki jendela konteks 256K, mencapai kecepatan generasi 100-350 token per detik, dan unggul dalam tugas-tugas agentik, penalaran matematis, pengkodean, dan penelitian mendalam sambil mempertahankan efisiensi tinggi dan aksesibilitas untuk penyebaran lokal.
Penggunaan Parameter yang Efisien: Menggunakan arsitektur MoE yang jarang yang hanya mengaktifkan 11B dari 196B parameter per token, memungkinkan kinerja tinggi sambil mempertahankan efisiensi komputasi
Kemampuan Penalaran Tingkat Lanjut: Menunjukkan kemahiran luar biasa dalam mengelola proses multi-tahap, termasuk penyerapan data, pembersihan, konstruksi fitur, dan interpretasi hasil dengan kinerja yang kuat pada tolok ukur matematika dan pengkodean
Pemrosesan Kecepatan Tinggi: Mencapai throughput generasi 100-350 token per detik dengan dukungan jendela konteks 256K, didukung oleh Prediksi Multi-Token 3 arah (MTP-3)
Dukungan Penyebaran Lokal: Dioptimalkan untuk penyebaran lokal pada perangkat keras pribadi kelas atas seperti Apple M4 Max, NVIDIA DGX Spark, atau AMD AI Max+ 395, memastikan eksekusi pribadi dan aman

Kasus Penggunaan Step 3.5 Flash

Analisis Data Profesional: Menangani tugas analisis data ujung-ke-ujung termasuk penyerapan data, pembersihan, konstruksi fitur, dan interpretasi hasil untuk aplikasi intelijen bisnis
Asisten Penelitian Mendalam: Melakukan penelitian komprehensif dengan merencanakan, mencari, merefleksikan, dan menulis, mencapai skor tinggi pada tolok ukur kualitas penelitian sambil mempertahankan akurasi faktual
Pengkodean dan Pengembangan: Membantu dalam pengembangan perangkat lunak dengan kinerja tinggi pada tolok ukur pengkodean, mampu menangani tugas pemrograman kompleks dan analisis arsitektur repositori
Analisis Investasi Saham: Menghasilkan rekomendasi perdagangan profesional dengan menganalisis data pasar, indikator teknis, dan mengelola peringatan otomatis melalui integrasi dengan beberapa alat

Kelebihan

Efisiensi tinggi dengan aktivasi parameter selektif
Kinerja yang kuat di berbagai tolok ukur
Mendukung penyebaran lokal untuk privasi yang ditingkatkan
Kecepatan inferensi cepat dengan 100-350 token per detik

Kekurangan

Membutuhkan lintasan generasi yang lebih panjang dibandingkan dengan beberapa pesaing
Mungkin mengalami penurunan stabilitas selama pergeseran distribusi
Kinerja terbatas dalam domain yang sangat terspesialisasi
Dapat menunjukkan inkonsistensi dalam dialog multi-giliran jangka panjang

Cara Menggunakan Step 3.5 Flash

Pilih metode akses: Anda dapat mengakses Step 3.5 Flash melalui: 1) OpenRouter 2) API Platform StepFun 3) Penyebaran lokal melalui format GGUF
Pengaturan API Cloud (Opsi 1 - OpenRouter): Mendaftar di OpenRouter untuk mendapatkan kunci API Anda. Gunakan URL dasar: https://openrouter.ai/api/v1 dengan model: stepfun/step-3.5-flash
Pengaturan API Cloud (Opsi 2 - Platform StepFun): Mendaftar di platform.stepfun.ai (Internasional) atau platform.stepfun.com (Tiongkok). Gunakan URL dasar: https://api.stepfun.ai/v1 (Internasional) atau https://api.stepfun.com/v1 (Tiongkok) dengan model: step-3.5-flash
Instal OpenClaw untuk kemampuan agen: Jalankan: curl -fsSL https://openclaw.ai/install.sh | bash
Konfigurasi OpenClaw: 1) Jalankan 'openclaw onboard' 2) Di WebUI, buka Config → Models 3) Tambahkan penyedia dengan tipe: openai-completions dan URL dasar: https://api.stepfun.ai/v1
Pengaturan Penyebaran Lokal: 1) Unduh model dari Hugging Face: stepfun-ai/Step-3.5-Flash-FP8 atau versi INT4 2) Gunakan vLLM atau llama.cpp untuk inferensi 3) Membutuhkan perangkat keras kelas atas seperti NVIDIA DGX Spark atau Apple M4 Max
Akses Antarmuka Web: Kunjungi stepfun.ai (Internasional) atau stepfun.com (Tiongkok) untuk menggunakan antarmuka web
Akses Aplikasi Seluler: Unduh aplikasi StepFun dari iOS App Store atau Google Play Store
Bergabung dengan Komunitas: Bergabung dengan komunitas Discord di https://discord.gg/RcMJhNVAQc untuk pembaruan dan dukungan

FAQ Step 3.5 Flash

Step 3.5 Flash adalah model fondasi sumber terbuka yang direkayasa untuk penalaran tingkat lanjut dan kemampuan agentik. Ia menggunakan arsitektur Mixture of Experts (MoE) yang jarang, hanya mengaktifkan 11B dari 196B parameternya per token. Ia unggul dalam penalaran mendalam, pengkodean, dan tugas-tugas agentik dengan kecepatan generasi 100-300 token/detik.

Alat AI Terbaru Serupa dengan Step 3.5 Flash

Athena AI
Athena AI
Athena AI adalah platform bertenaga AI yang serbaguna yang menawarkan bantuan belajar yang dipersonalisasi, solusi bisnis, dan pelatihan hidup melalui fitur seperti analisis dokumen, pembuatan kuis, kartu flash, dan kemampuan obrolan interaktif.
Aguru AI
Aguru AI
Aguru AI adalah solusi perangkat lunak on-premises yang menyediakan pemantauan komprehensif, keamanan, dan alat optimisasi untuk aplikasi berbasis LLM dengan fitur seperti pelacakan perilaku, deteksi anomali, dan optimisasi kinerja.
GOAT AI
GOAT AI
GOAT AI adalah platform yang didukung AI yang menyediakan kemampuan ringkasan satu klik untuk berbagai jenis konten termasuk artikel berita, makalah penelitian, dan video, sambil juga menawarkan orkestrasi agen AI canggih untuk tugas spesifik domain.
GiGOS
GiGOS
GiGOS adalah platform AI yang menyediakan akses ke berbagai model bahasa canggih seperti Gemini, GPT-4, Claude, dan Grok dengan antarmuka intuitif bagi pengguna untuk berinteraksi dan membandingkan berbagai model AI.