- API文档
- 通用文字识别
- 通用表格识别
- 通用文档解析
- 通用文本向量
- 智能文档抽取
- 国内通用票据识别
- 图片切边增强
- 人脸伪造检测
- PDF转Word
- 发票验真
- 身份证识别
- 营业执照识别
- 银行卡识别
- 行驶证识别
- 驾驶证识别
- 票据分类
- 机动车购车发票识别
- 车辆合格证识别
- 名片识别
- 车牌号识别
- 社保卡识别
- 护照识别
- 车辆VIN码识别
- 电子承兑汇票识别
- 车辆登记证识别
- 图片转word
- 二手车购车发票识别
- 证件分类
- 印章检测识别
- 出租车发票识别
- 税务登记证识别
- 组织机构代码证识别
- 开户许可证识别
- 澳门身份证识别
- 港澳居民来往内地通行证
- 台湾居民来往大陆通行证识别
- 台湾身份证识别
- 马来西亚身份证识别
- 户口本识别
- 结婚证识别
- 房产证识别
- 军官证识别
- 飞机行程单识别
- 定额发票识别
- 商铺小票识别
- 海关进出口货物报关单识别
- 事业单位法人证识别
- 港澳台通行证识别
- 日本驾驶证识别
- 香港身份证识别
- 办公文档识别
- 出生证明识别
- 通用篡改检测
- 不动产权证书识别
- 银行回单识别
- 自动擦除手写文字
- 去屏幕纹
- 图像质量检测
- 港澳台居民居住证
- 二维码识别
- 汽车商业险保单识别
- 文档图像切边矫正
- PDF转Excel
- PDF转PPT
- PDF转图片
- Word转PDF
- Excel转PDF
- 图片转PDF
- Word转图片
- 完税证明
- 图像水印去除
- 手写签名识别
- 区块链发票验真
- 合同比对
- 外国人永久居留身份证识别
- 卡证篡改检测
- 毕业证识别
- 学位证识别
功能描述
pdf转markdown
上传图片/pdf,进行版面检测,文字识别,表格识别,版面分析等操作,并生成markdown文档
请求URL
https://api.textin.com/ai/service/v1/pdf_to_markdown
HTTP请求方法(Method)
HTTP POST
请求头说明(Request Headers)
请在HTTP请求中添加以下自定义标头(Header)。
header 名 | 值 |
---|---|
x-ti-app-id | 请登录后前往 “工作台-账号设置-开发者信息” 查看 x-ti-app-id |
x-ti-secret-code | 请登录后前往 “工作台-账号设置-开发者信息” 查看 x-ti-secret-code |
URL参数(Parameters)
URL参数指以{参数名}={参数值} 形式拼接到 URL 上的键值对。它以
?
开头,不同参数之间使用&
连接。形如?p1=v1&p2=v2
参数名 | 数据类型 | 是否必填 | 允许的值 | 描述 |
---|---|---|---|---|
pdf_pwd | string | 否 | 见描述 |
当pdf为加密文档时,需要提供密码。 备注:对前端封装该接口时,需要自行对密码进行安全防护。 |
dpi | integer | 否 | 见描述 |
pdf文档的坐标基准,默认144 dpi。 当parse_mode=auto时,默认动态,支持72,144,216; 当parse_mode=scan时,默认144,支持72,144,216; |
page_start | integer | 否 | 见描述 |
当上传的是pdf时,page_start 表示从第几页开始转 |
page_count | integer | 否 | 见描述 |
当上传的是pdf时,page_count 表示要进行转换的pdf页数。 总页数不得超过1000页,默认为1000页。 |
apply_document_tree | integer | 否 | 见描述 |
是否生成标题,默认为1,生成标题
|
markdown_details | integer | 否 | 见描述 |
是否生成markdown details,默认为1,生成markdown details
|
table_flavor | string | 否 | 见描述 |
markdown里的表格格式,默认为html,按html语法输出表格
|
get_image | string | 否 | 见描述 |
获取markdown里的图片,默认为none,不返回任何图像
|
parse_mode | string | 否 | 见描述 |
PDF解析模式,默认为scan模式,仅按文字识别方式处理。图片不用设置,均按文字识别方式处理。
|
请求体说明(Request Body)
Content-Type: application/octet-stream
支持的文件格式:png, jpg, jpeg, pdf, bmp, tiff
请注意,请求体的数据格式为文件的二进制流,非 FormData 或其他格式。文件大小不超过 500M,图像宽高须介于 20 和 10000(像素)之间。
响应体说明(Response)
Content-Type: application/json
JSON结构说明如下:
字段名 | 类型 | 描述 |
---|---|---|
code | integer | 错误码,详见“错误码说明” |
message | string |
错误信息 |
result | object | |
+ detail | array |
markdown详细信息 |
++ page_id | integer |
当前段落所在页码 |
++ paragraph_id | integer |
当前段落id |
++ outline_level | integer |
标题级别: (最多支持5级标题) -1.正文 0.一级标题 1.二级标题 ... |
++ text | string |
文本 |
++ type | string |
类型, paragraph(段落类型,包括正文、标题、公式等文字信息)、image(图片类型)、table(表格类型) |
++ image_url | string |
当get_image = objects 时,返回图片的公共连接 |
++ content | integer |
内容类型
|
++ position | array |
以长度为8的整型数组表示四边形,8个数两两一组为一个点的横纵坐标,分别是左上,右上,左下,右下。 当输入是PDF时, 此坐标是基于72dpi的;当输入是图片时,此坐标是原图里的坐标。 单位:像素 |
+ markdown | string |
markdown 正文字符串 |
version | string |
doc_restore 引擎版本号 |
duration | integer |
引擎耗时 (毫秒) |
metrics | array |
每一页的信息 |
+ durations | number |
当前页总耗时 |
+ status | string |
当前页状态 |
+ page_id | number |
当前页码 |
+ angle | integer |
图像角度, 定义0度为人类阅读文字的图像方向,称为正置图像, 本字段表示输入图像是正置图像进行顺时针若干角度的旋转所得。
|
+ image_id | string |
当前页图片id (下载方式:https://api.textin.com/ocr_image/download?image_id=xxx ,需要在headers里添加appid和key) |
JSON结构示例
{
"code": 200,
"message": "success",
"result": {
"markdown": "",
"detail": [
{
"image_url": "",
"position": [
72301248
],
"paragraph_id": 30099706,
"type": "paragraph",
"page_id": 31782075,
"content": 0,
"outline_level": -1,
"text": ""
}
]
},
"version": "",
"duration": 68665319,
"metrics": [
{
"status": "",
"page_id": -79807902.98581697,
"angle": 180,
"durations": 73496969.24969518,
"image_id": ""
}
]
}
错误码说明
错误码 | 描述 |
---|---|
40101 | x-ti-app-id 或 x-ti-secret-code 为空 |
40102 | x-ti-app-id 或 x-ti-secret-code 无效,验证失败 |
40103 | 客户端IP不在白名单 |
40003 | 余额不足,请充值后再使用 |
40004 | 参数错误,请查看技术文档,检查传参 |
40007 | 机器人不存在或未发布 |
40008 | 机器人未开通,请至市场开通后重试 |
40301 | 图片类型不支持 |
40302 | 上传文件大小不符,文件大小不超过 500M |
40303 | 文件类型不支持 |
40304 | 图片尺寸不符,图像宽高须介于 20 和 10000(像素)之间 |
40305 | 识别文件未上传 |
40422 | 文件损坏(The file is corrupted.) |
40423 | PDF密码错误(Password required or incorrect password.) |
40424 | 页数设置超出文件范围(Page number out of range.) |
40425 | 文件格式不支持(The input file format is not supported.) |
40427 | Input DPI is not in the allowed DPIs list(72,144,216). |
50207 | 部分页面解析失败(Partial failed) |
30203 | 基础服务故障,请稍后重试 |
500 | 服务器内部错误 |