如何使用Confident AI
安装DeepEval: 运行'pip install -U deepeval'以安装DeepEval库
导入所需模块: 从deepeval导入assert_test、metrics和LLMTestCase
创建测试案例: 使用输入和实际输出创建一个LLMTestCase对象
定义评估指标: 创建一个指标对象,例如HallucinationMetric,带有期望的参数
运行断言: 使用assert_test()根据指标评估测试案例
执行测试: 运行'deepeval test run test_file.py'以执行测试
查看结果: 在控制台输出中检查测试结果
记录到Confident AI平台: 使用@deepeval.log_hyperparameters装饰器将结果记录到Confident AI
分析结果: 登录Confident AI平台查看详细的分析和洞察
Confident AI 常见问题解答
Confident AI 是一家提供大型语言模型(LLM)开源评估基础设施的公司。他们提供 DeepEval 工具,允许开发者在不到 10 行代码中对 LLM 进行单元测试。
查看更多