如何使用 Confident AI
安裝DeepEval: 運行'pip install -U deepeval'以安裝DeepEval庫
導入所需模塊: 從deepeval導入assert_test、metrics和LLMTestCase
創建測試案例: 使用input和actual_output創建一個LLMTestCase對象
定義評估指標: 創建一個指標對象,例如HallucinationMetric,帶有所需參數
運行斷言: 使用assert_test()來評估測試案例對於該指標
執行測試: 運行'deepeval test run test_file.py'來執行測試
查看結果: 在控制台輸出中檢查測試結果
記錄到Confident AI平台: 使用@deepeval.log_hyperparameters裝飾器將結果記錄到Confident AI
分析結果: 登錄Confident AI平台查看詳細的分析和見解
Confident AI 常見問題
Confident AI 是一家提供大型語言模型(LLMs)開源評估基礎設施的公司。他們提供 DeepEval 工具,允許開發人員在不到 10 行代碼的情況下對 LLMs 進行單元測試。
Confident AI 每月流量趨勢
Confident AI 的流量增長了 34.1%,達到 14萬 次訪問。這種 溫和增長 可能歸因於市場對 AI 評估的日益關注,以及該產品強大的功能組合,包括用於 LLM 實驗的 14項指標 和 人類反饋整合。此外,DeepSeek 的市場進入 以及美國和中國 AI 模型之間 性能差距的縮小 可能正在推動市場對全面評估工具的興趣。
查看歷史流量
查看更多