Imarena.AI
LMArena.ai(以前称为 Chatbot Arena)是一个开放的基准测试平台,通过匿名、众包的成对比较和社区投票来评估和比较大型语言模型。
https://lmarena.ai/?utm_source=aipure

产品信息
更新于:2025年08月22日
Imarena.AI 月度流量趋势
Imarena.AI 在7月份实现了780万访问量,增长率达67.1%。1亿美元种子轮融资和更名为LMArena可能提升了用户参与度,同时新增模型和功能如盲测PK和手动PK增强了平台的吸引力。
什么是 Imarena.AI
LMArena.ai 是由加州大学伯克利分校 SkyLab 的研究人员创建的开放平台,使每个人都可以访问、探索和与世界领先的 AI 模型进行交互。该平台通过促进并排比较和收集社区投票反馈,充当大型语言模型 (LLM) 的透明评估系统。最初被称为 Chatbot Arena,它已成为 AI 行业的重要平台,OpenAI、Anthropic 和 Google 等主要公司通过提供其模型进行评估参与其中。
Imarena.AI 的主要功能
Imarena.AI(也称为LMArena.ai或Chatbot Arena)是由加州大学伯克利分校SkyLab研究人员开发的一个开放基准测试平台,使用户能够通过匿名、众包的成对比较和投票来评估和比较大型语言模型。该平台包含主要人工智能公司的模型,如GPT-4、Gemini和Claude,提供了一个中立的环境,通过社区反馈来测试和排名人工智能模型。
匿名模型比较: 使用户能够并排比较两个AI模型,而无需在投票后才知道它们的身份,从而确保公正的评估
众包投票系统: 收集用户投票和反馈,以生成不同AI模型的综合性能指标和排名
综合排行榜: 根据超过350万的用户投票和多个评估标准,显示详细的性能指标和排名
多模式测试: 支持评估各种AI功能,包括文本、视觉和图像编辑功能
Imarena.AI 的使用场景
AI模型评估: 研究人员和公司可以测试他们的AI模型,并与市场上其他领先模型进行基准测试
产品开发: AI公司可以使用该平台进行预览发布,并在正式发布之前测试即将推出的模型
研究与分析: 学术研究人员可以通过标准化的比较方法研究和分析AI模型的性能
优点
开放和透明的评估系统
庞大的用户社区提供反馈
支持多种AI模式和功能
缺点
评估方法在学术分析中存在一些局限性
可能在处理复杂提示时出现性能问题
如何使用 Imarena.AI
访问平台: 在您的 Web 浏览器中转到 lmarena.ai(以前称为 Chatbot Arena)
选择评估模式: 在并排比较模式或其他可用模式(文本、图像、视觉)之间进行选择
输入提示: 输入您的提示,以随机战斗格式同时测试两个匿名 AI 模型
查看响应: 检查两个 AI 模型生成的响应,而不知道它们的身份
对性能进行投票: 为您认为对您的提示提供了更好响应的模型投赞成票
查看结果: 投票后,查看您刚刚比较的模型的身份
查看排行榜: 访问排行榜部分,以查看基于众包投票的不同 AI 模型的总体排名
为研究做出贡献: 继续参与,通过集体反馈帮助推进 AI 研究(注意:避免共享个人或敏感信息)
Imarena.AI 常见问题
Imarena.AI(也称为LMArena.ai、LM Arena AI或Chatbot Arena,前身为LMSYS)是一个开放平台,通过人类偏好和众包基准测试来评估AI,最初由加州大学伯克利分校SkyLab的研究人员创建。
官方帖子
加载中...相关文章
Imarena.AI 网站分析
Imarena.AI 流量和排名
7.8M
每月访问量
#6114
全球排名
#148
类别排名
流量趋势:Aug 2024-Jul 2025
Imarena.AI 用户洞察
00:08:22
平均访问时长
7.02
每次访问页数
26.44%
用户跳出率
Imarena.AI 的热门地区
RU: 12.69%
US: 11.38%
IN: 11.13%
CN: 9.66%
PL: 7.59%
Others: 47.55%