Step 3.5 Flash
3.5 Flash는 토큰당 196B 파라미터 중 11B만 선택적으로 활성화하는 희소 MoE(Mixture of Experts) 아키텍처를 기반으로 구축된 오픈 소스 기반 모델로, 뛰어난 효율성으로 최첨단 추론 및 에이전트 기능을 제공합니다.
https://static.stepfun.com/blog/step-3.5-flash?ref=producthunt&utm_source=aipure

제품 정보
업데이트됨:Mar 6, 2026
Step 3.5 Flash이란?
3.5 Flash는 StepFun의 가장 강력한 오픈 소스 기반 모델로, 고급 추론 및 도구 사용 기능을 통해 정적 모델을 활성 에이전트로 변환하도록 설계되었습니다. 256K 컨텍스트 창을 지원하고 3-way Multi-Token Prediction(MTP-3)을 통해 100-300 토큰/초 생성 처리량을 달성합니다. 이 모델은 클라우드 API(OpenRouter 및 StepFun 플랫폼을 통해)와 Mac Studio M4 Max 및 NVIDIA DGX Spark와 같은 고급 소비자 하드웨어의 로컬 배포를 통해 액세스할 수 있도록 설계되었습니다.
Step 3.5 Flash의 주요 기능
Step 3.5 Flash는 StepFun에서 개발한 최첨단 오픈 소스 기반 모델로, 희소 MoE(Mixture of Experts) 아키텍처를 사용하여 토큰당 1960억 개의 파라미터 중 110억 개만 선택적으로 활성화합니다. 256K 컨텍스트 창을 특징으로 하며, 초당 100-350 토큰의 생성 속도를 달성하고, 에이전트 작업, 수학적 추론, 코딩 및 심층 연구에 탁월하며, 로컬 배포를 위한 높은 효율성과 접근성을 유지합니다.
효율적인 파라미터 사용: 토큰당 1960억 개의 파라미터 중 110억 개만 활성화하는 희소 MoE 아키텍처를 사용하여 계산 효율성을 유지하면서 높은 성능을 가능하게 합니다.
고급 추론 능력: 데이터 수집, 정리, 기능 구성 및 결과 해석을 포함한 다단계 프로세스 관리에 탁월한 능력을 보여주며, 수학 및 코딩 벤치마크에서 강력한 성능을 보입니다.
고속 처리: 3-way MTP(Multi-Token Prediction)에 의해 구동되는 256K 컨텍스트 창 지원으로 초당 100-350 토큰의 생성 처리량을 달성합니다.
로컬 배포 지원: Apple M4 Max, NVIDIA DGX Spark 또는 AMD AI Max+ 395와 같은 고급 개인 하드웨어에서 로컬 배포에 최적화되어 개인적이고 안전한 실행을 보장합니다.
Step 3.5 Flash의 사용 사례
전문 데이터 분석: 비즈니스 인텔리전스 애플리케이션을 위한 데이터 수집, 정리, 기능 구성 및 결과 해석을 포함한 엔드 투 엔드 데이터 분석 작업을 처리합니다.
심층 연구 지원: 계획, 검색, 반영 및 작성을 통해 포괄적인 연구를 수행하여 사실적 정확성을 유지하면서 연구 품질 벤치마크에서 높은 점수를 얻습니다.
코딩 및 개발: 코딩 벤치마크에서 높은 성능으로 소프트웨어 개발을 지원하며, 복잡한 프로그래밍 작업 및 리포지토리 아키텍처 분석을 처리할 수 있습니다.
주식 투자 분석: 시장 데이터, 기술 지표를 분석하고 여러 도구와의 통합을 통해 자동화된 알림을 관리하여 전문적인 거래 권장 사항을 생성합니다.
장점
선택적 파라미터 활성화를 통한 높은 효율성
여러 벤치마크에서 강력한 성능
향상된 개인 정보 보호를 위한 로컬 배포 지원
초당 100-350 토큰의 빠른 추론 속도
단점
일부 경쟁사에 비해 더 긴 생성 궤적 필요
분포 이동 중 감소된 안정성 경험 가능
고도로 전문화된 도메인에서 제한된 성능
장기적인 다중 턴 대화에서 불일치 발생 가능
Step 3.5 Flash 사용 방법
액세스 방법 선택: 다음과 같은 방법으로 3.5 Flash에 액세스할 수 있습니다. 1) OpenRouter 2) StepFun 플랫폼 API 3) GGUF 형식을 통한 로컬 배포
클라우드 API 설정(옵션 1 - OpenRouter): OpenRouter에 가입하여 API 키를 받으세요. 모델과 함께 기본 URL https://openrouter.ai/api/v1을 사용하세요: stepfun/step-3.5-flash
클라우드 API 설정(옵션 2 - StepFun 플랫폼): platform.stepfun.ai(국제) 또는 platform.stepfun.com(중국)에 가입하세요. 모델과 함께 기본 URL https://api.stepfun.ai/v1(국제) 또는 https://api.stepfun.com/v1(중국)을 사용하세요: step-3.5-flash
에이전트 기능을 위해 OpenClaw 설치: 실행: curl -fsSL https://openclaw.ai/install.sh | bash
OpenClaw 구성: 1) 'openclaw onboard' 실행 2) WebUI에서 구성 → 모델로 이동 3) 유형이 openai-completions이고 기본 URL이 https://api.stepfun.ai/v1인 공급자 추가
로컬 배포 설정: 1) Hugging Face에서 모델 다운로드: stepfun-ai/Step-3.5-Flash-FP8 또는 INT4 버전 2) 추론을 위해 vLLM 또는 llama.cpp 사용 3) NVIDIA DGX Spark 또는 Apple M4 Max와 같은 고급 하드웨어 필요
웹 인터페이스 액세스: stepfun.ai(국제) 또는 stepfun.com(중국)을 방문하여 웹 인터페이스 사용
모바일 앱 액세스: iOS App Store 또는 Google Play Store에서 StepFun 앱 다운로드
커뮤니티 가입: 업데이트 및 지원을 위해 https://discord.gg/RcMJhNVAQc에서 Discord 커뮤니티 가입
Step 3.5 Flash 자주 묻는 질문
Step 3.5 Flash는 첨단 추론 및 에이전트 기능을 위해 설계된 오픈 소스 기반 모델입니다. 희소 MoE(Mixture of Experts) 아키텍처를 사용하며, 토큰당 1960억 개의 파라미터 중 110억 개만 활성화합니다. 100~300 토큰/초의 생성 속도로 심층 추론, 코딩 및 에이전트 작업에 탁월합니다.











