文件大小和页面限制是什么？

文件必须小于 100MB，且不能超过 400 页。

有哪些解析模式可用？

有两种解析模式：\'basic\' 适用于简单的纯文本文件，\'standard\' 适用于包含图像、复杂层次结构和/或没有原生文本数据的扫描文档的复杂文档。

解析作业结果保留多长时间？

解析作业结果在作业创建后最多保留 30 天。尝试获取超过 30 天的作业状态将返回 404 错误。

文档层次结构选项提供哪些功能？

当 enable_document_hierarchy 设置为 true 时，它会在输出中添加一个目录，显示整个已解析文档的结构，并提供更高质量的标题级别（H1、H2、H3）解析。此功能目前为 beta 版，仅在标准解析模式下可用。

解析器如何处理表格？

当启用 enable_split_tables 时，解析器可以通过行将大型表格拆分为多个表格，并传播标题。此功能有助于提高 LLM 对非常大的表格的理解，并且仅在标准解析模式下可用。

Document Parser by Contextual AI

WebsiteFree TrialAI PDF Research Tools

Contextual AI 的 Document Parser 是一个先进的文档解析平台，它结合了自定义视觉、OCR 和视觉语言模型，可以准确地从各种文档格式中提取和构建信息，同时保持 RAG 应用的上下文相关性。

访问网站

推广此工具

https://docs.contextual.ai/api-reference/parse/parse-file?ref=aipure&utm_source=aipure

概述
分析
视频
替代方案

产品信息

更新于：2025年07月15日

Document Parser by Contextual AI 月度流量趋势

Document Parser by Contextual AI 上个月收到了 3.9k 次访问，显示出 92.6% 的显著增长。根据我们的分析，这一趋势与人工智能工具领域的典型市场动态相符。

查看历史流量

什么是 Document Parser by Contextual AI

Contextual AI 的 Document Parser 是一种强大的文档理解解决方案，可将非结构化文档转换为结构良好、机器可读的格式。该平台可以处理多种文档类型，包括 PDF、DOC/DOCX、PPT/PPTX 文件，最大可达 100MB 和 400 页。它专门设计用于现代 AI 应用，特别是用于检索增强生成 (RAG) 用例，使其成为世界上第一个 genAI 原生文档解析平台。

Document Parser by Contextual AI 的主要功能

Contextual AI 的文档解析器是一个先进的文档解析平台，它结合了自定义视觉、OCR 和视觉语言模型，以提供高精度的文档处理。它支持多种文件格式，包括 PDF、DOC(X)、PPT(X) 和 HTML，具有提取结构化信息、维护文档层次结构、处理复杂表格以及处理带标题的图像的功能。该解析器专门设计用于通过提供上下文感知的分块和保持语义连贯性来增强 RAG（检索增强生成）应用程序。

布局感知解析: 在分块期间考虑文档布局，以提高语义连贯性并减少内容中的噪音，确保块中的所有文本都来自同一布局实体

智能表格处理: 提供可配置的表格拆分功能，并具有标题传播功能，以提高 LLM 对大型表格的理解

文档层次结构支持: 生成目录并使用适当的标题级别（H1、H2、H3）维护文档结构，以实现更好的内容组织

灵活的配置选项: 提供多种解析模式（基本和标准），并具有用于文档层次结构、表格拆分和图说处理的可自定义设置