FuriosaAI
FuriosaAI是一家半导体公司,专门开发高性能、低功耗的AI加速器,特别适用于数据中心中的大语言模型和多模态部署。
https://furiosa.ai/?utm_source=aipure
产品信息
更新于:2024年12月16日
什么是 FuriosaAI
FuriosaAI是一家专门从事AI加速器芯片开发的技术公司,其旗舰产品是Furiosa RNGD Gen 2数据中心加速器。该公司专注于为企业和云环境创建强大且高效的AI推理解决方案。其技术基于先进的半导体制造工艺,使用台积电5nm技术,提供与行业领导者如NVIDIA相当的规格,同时保持显著更低的功耗。
FuriosaAI 的主要功能
FuriosaAI 是一家开发先进 AI 加速器芯片的半导体公司,其旗舰产品 Furiosa RNGD 是第二代数据中心加速器。他们的技术基于独特的张量收缩处理器 (TCP) 架构,能够高效处理深度学习中的张量操作,相比 NVIDIA 的 H100 和 L40S 等竞争对手,提供更高的性能功耗比。该公司提供了全面的 AI 部署软件解决方案,包括模型压缩、服务框架和运行时优化工具。
张量收缩处理器架构: 专为高效张量操作设计的专有架构,性能优于传统的矩阵乘法方法
节能设计: 150W TDP 设计,为 LLM 推理提供高性能功耗比,功耗显著低于竞争对手
全面的软件栈: 完整的工具包,包括编译器、性能分析器、调试器和 API,用于优化和部署大型语言模型
灵活的内存管理: 基于张量形状的高级内存资源优化,容量为 48GB,带宽为 1.5 TB/s
FuriosaAI 的使用场景
企业 AI 部署: 在企业数据中心高效部署大型语言模型,减少功耗和冷却需求
云计算服务: 为需要可扩展和节能解决方案的云服务提供商提供高性能 AI 推理
媒体和娱乐: 使用 RNGDS 变体进行创意工作负载和视频 AI 应用的专用处理
优点
相比竞争对手,能效更高
全面的软件生态系统,便于部署
由于功耗和冷却需求减少,总拥有成本较低
缺点
与 NVIDIA H100 相比,原始性能较低
市场上的新玩家,生态系统相对不成熟
如何使用 FuriosaAI
注册早期访问计划: 联系[email protected]注册早期访问计划(EAP)并同意最终用户许可协议(EULA)
设置身份验证: 注册后,登录FuriosaAI IAM并创建一个新的API密钥,该密钥将用于访问FuriosaAI服务
配置APT仓库: 在Ubuntu/Debian上设置FuriosaAI APT仓库,通过注册公钥和配置API密钥身份验证
安装所需软件包: 使用已配置的仓库通过APT包管理器安装内核驱动程序、固件和运行时库
安装SDK: 使用pip安装Furiosa SDK,其中包括编译器、分析器和其他开发工具
安装模型库: 安装furiosa-models包以访问针对FuriosaAI NPU优化的预训练和预量化模型
开发: 使用Python/C SDK、运行时库和命令行工具开发利用FuriosaAI NPU硬件的AI应用程序
模型部署: 使用furiosa-serving包部署模型,并利用提供的API在FuriosaAI硬件上进行推理
FuriosaAI 常见问题
FuriosaAI 是一家成立于 2017 年的 AI 芯片初创公司,致力于为 AI 部署创建下一代 NPU(神经处理单元)产品,其最新产品是 Furiosa RNGD 数据中心加速器。
FuriosaAI 网站分析
FuriosaAI 流量和排名
13.1K
每月访问量
#1570383
全球排名
#1446
类别排名
流量趋势:Sep 2024-Nov 2024
FuriosaAI 用户洞察
00:01:56
平均访问时长
3.33
每次访问页数
41.23%
用户跳出率
FuriosaAI 的热门地区
KR: 77.53%
US: 13.3%
IN: 3.95%
JP: 2.95%
TH: 2.27%
Others: NAN%