上传文件并立即获取解析结果
output_formats
| 可选输出格式 | 默认值 | 说明 |
|---|---|---|
json / markdown / zip | ["markdown", "json"] | 可多选 ,不传时使用默认值;zip 将 Markdown 和所有图片文件打包为压缩包;在 output_formats 包含 zip 时,element_formats.image 只能是 file |
element_formats
| 配置项 | 可选输出格式 | 默认值 | 说明 |
|---|---|---|---|
image | url / base64 / file / none | url | 单选,image 设定为file时,output_formats需包含zip;none表示不返回图片 |
formula | latex / mathml / ascii | latex | 单选,指定公式的输出格式 |
table | markdown / html / image | html | 单选,markdown 模式下,合并单元格将自动拆分为独立单元格,并以相同内容填充 |
cs | image | image | 单选,化学结构式输出格式,即将支持smiles格式 |
feature_config
| 配置项 | 默认值 | 说明 |
|---|---|---|
enable_text_cross_page | false | 文字跨页拼接:跨页文字段合并为连续段落 |
enable_table_cross_page | false | 表格跨页拼接:跨页表格合并为完整表格 |
enable_title_level_recognition | false | 标题层级识别:识别文档标题层级结构(H1/H2/H3…) |
enable_inline_image | true | 文中图:返回文字段落中的图片 |
enable_table_image | true | 表中图:返回表格单元格内的图片 |
enable_image_understanding | true | 图片理解:对文档内图片进行语义理解和结构化描述 |
keep_header_footer | false | 保留页眉页脚:默认过滤了页眉页脚,如果使用页眉页脚可开启保留 |