Step 3.5 Flash는 몇 개의 파라미터를 가지고 있으며 어떻게 관리합니까?

Step 3.5 Flash는 총 1960억 개의 파라미터를 가지고 있지만, 추론 중에 토큰당 110억 개의 파라미터만 선택적으로 활성화하는 희소 MoE(Mixture-of-Experts) 아키텍처를 사용하여 효율성을 높입니다.

Step 3.5 Flash의 컨텍스트 창 크기는 얼마입니까?

Step 3.5 Flash는 3:1 SWA(Sliding Window Attention) 비율의 하이브리드 방식을 사용하여 256K 컨텍스트 창을 지원합니다. 즉, 모든 전체 어텐션 레이어에 대해 3개의 SWA 레이어를 통합합니다.

개발자는 Step 3.5 Flash에 어떻게 액세스할 수 있습니까?

개발자는 OpenRouter, StepFun Platform(api.stepfun.ai), OpenClaw 플랫폼 또는 Mac Studio M4 Max 또는 NVIDIA DGX Spark와 같은 고급 소비자 하드웨어의 로컬 배포를 통해 Step 3.5 Flash에 액세스할 수 있습니다.

Step 3.5 Flash의 알려진 제한 사항은 무엇입니까?

주요 제한 사항은 다음과 같습니다. 1) 유사한 품질에 도달하기 위해 일부 경쟁사보다 더 긴 생성 궤적이 필요합니다. 2) 특수 도메인에서 분포 이동 중에 안정성이 저하될 수 있습니다. 3) 장기적인 다중 턴 대화에서 반복적인 추론 및 불일치를 나타낼 수 있습니다.

Step 3.5 Flash

WebsiteAppFree TrialLarge Language Models (LLMs)AI Tools Directory

3.5 Flash는 토큰당 196B 파라미터 중 11B만 선택적으로 활성화하는 희소 MoE(Mixture of Experts) 아키텍처를 기반으로 구축된 오픈 소스 기반 모델로, 뛰어난 효율성으로 최첨단 추론 및 에이전트 기능을 제공합니다.

웹사이트 방문

이 도구 광고하기

https://static.stepfun.com/blog/step-3.5-flash?ref=producthunt&utm_source=aipure

개요
대안

제품 정보

업데이트됨:May 30, 2026

Step 3.5 Flash이란?

3.5 Flash는 StepFun의 가장 강력한 오픈 소스 기반 모델로, 고급 추론 및 도구 사용 기능을 통해 정적 모델을 활성 에이전트로 변환하도록 설계되었습니다. 256K 컨텍스트 창을 지원하고 3-way Multi-Token Prediction(MTP-3)을 통해 100-300 토큰/초 생성 처리량을 달성합니다. 이 모델은 클라우드 API(OpenRouter 및 StepFun 플랫폼을 통해)와 Mac Studio M4 Max 및 NVIDIA DGX Spark와 같은 고급 소비자 하드웨어의 로컬 배포를 통해 액세스할 수 있도록 설계되었습니다.

Step 3.5 Flash의 주요 기능

Step 3.5 Flash는 StepFun에서 개발한 최첨단 오픈 소스 기반 모델로, 희소 MoE(Mixture of Experts) 아키텍처를 사용하여 토큰당 1960억 개의 파라미터 중 110억 개만 선택적으로 활성화합니다. 256K 컨텍스트 창을 특징으로 하며, 초당 100-350 토큰의 생성 속도를 달성하고, 에이전트 작업, 수학적 추론, 코딩 및 심층 연구에 탁월하며, 로컬 배포를 위한 높은 효율성과 접근성을 유지합니다.

효율적인 파라미터 사용: 토큰당 1960억 개의 파라미터 중 110억 개만 활성화하는 희소 MoE 아키텍처를 사용하여 계산 효율성을 유지하면서 높은 성능을 가능하게 합니다.

고급 추론 능력: 데이터 수집, 정리, 기능 구성 및 결과 해석을 포함한 다단계 프로세스 관리에 탁월한 능력을 보여주며, 수학 및 코딩 벤치마크에서 강력한 성능을 보입니다.

고속 처리: 3-way MTP(Multi-Token Prediction)에 의해 구동되는 256K 컨텍스트 창 지원으로 초당 100-350 토큰의 생성 처리량을 달성합니다.

로컬 배포 지원: Apple M4 Max, NVIDIA DGX Spark 또는 AMD AI Max+ 395와 같은 고급 개인 하드웨어에서 로컬 배포에 최적화되어 개인적이고 안전한 실행을 보장합니다.

Step 3.5 Flash의 사용 사례

전문 데이터 분석: 비즈니스 인텔리전스 애플리케이션을 위한 데이터 수집, 정리, 기능 구성 및 결과 해석을 포함한 엔드 투 엔드 데이터 분석 작업을 처리합니다.

심층 연구 지원: 계획, 검색, 반영 및 작성을 통해 포괄적인 연구를 수행하여 사실적 정확성을 유지하면서 연구 품질 벤치마크에서 높은 점수를 얻습니다.

코딩 및 개발: 코딩 벤치마크에서 높은 성능으로 소프트웨어 개발을 지원하며, 복잡한 프로그래밍 작업 및 리포지토리 아키텍처 분석을 처리할 수 있습니다.

주식 투자 분석: 시장 데이터, 기술 지표를 분석하고 여러 도구와의 통합을 통해 자동화된 알림을 관리하여 전문적인 거래 권장 사항을 생성합니다.

장점

선택적 파라미터 활성화를 통한 높은 효율성

여러 벤치마크에서 강력한 성능

향상된 개인 정보 보호를 위한 로컬 배포 지원

초당 100-350 토큰의 빠른 추론 속도

단점

일부 경쟁사에 비해 더 긴 생성 궤적 필요

분포 이동 중 감소된 안정성 경험 가능

고도로 전문화된 도메인에서 제한된 성능

장기적인 다중 턴 대화에서 불일치 발생 가능

Step 3.5 Flash 사용 방법

액세스 방법 선택: 다음과 같은 방법으로 3.5 Flash에 액세스할 수 있습니다. 1) OpenRouter 2) StepFun 플랫폼 API 3) GGUF 형식을 통한 로컬 배포

클라우드 API 설정(옵션 1 - OpenRouter): OpenRouter에 가입하여 API 키를 받으세요. 모델과 함께 기본 URL https://openrouter.ai/api/v1을 사용하세요: stepfun/step-3.5-flash

클라우드 API 설정(옵션 2 - StepFun 플랫폼): platform.stepfun.ai(국제) 또는 platform.stepfun.com(중국)에 가입하세요. 모델과 함께 기본 URL https://api.stepfun.ai/v1(국제) 또는 https://api.stepfun.com/v1(중국)을 사용하세요: step-3.5-flash

에이전트 기능을 위해 OpenClaw 설치: 실행: curl -fsSL https://openclaw.ai/install.sh | bash

OpenClaw 구성: 1) 'openclaw onboard' 실행 2) WebUI에서 구성 → 모델로 이동 3) 유형이 openai-completions이고 기본 URL이 https://api.stepfun.ai/v1인 공급자 추가

로컬 배포 설정: 1) Hugging Face에서 모델 다운로드: stepfun-ai/Step-3.5-Flash-FP8 또는 INT4 버전 2) 추론을 위해 vLLM 또는 llama.cpp 사용 3) NVIDIA DGX Spark 또는 Apple M4 Max와 같은 고급 하드웨어 필요

웹 인터페이스 액세스: stepfun.ai(국제) 또는 stepfun.com(중국)을 방문하여 웹 인터페이스 사용

모바일 앱 액세스: iOS App Store 또는 Google Play Store에서 StepFun 앱 다운로드

커뮤니티 가입: 업데이트 및 지원을 위해 https://discord.gg/RcMJhNVAQc에서 Discord 커뮤니티 가입

Step 3.5 Flash 자주 묻는 질문

Step 3.5 Flash는 첨단 추론 및 에이전트 기능을 위해 설계된 오픈 소스 기반 모델입니다. 희소 MoE(Mixture of Experts) 아키텍처를 사용하며, 토큰당 1960억 개의 파라미터 중 110억 개만 활성화합니다. 100~300 토큰/초의 생성 속도로 심층 추론, 코딩 및 에이전트 작업에 탁월합니다.