聚美智数


通用文字识别_含位置版

<h3>接口描述</h3> <ul> <li>通用文字识别,可返回文字在图片中的位置信息,方便用户进行版式的二次处理。</li> </ul> <h3>请求地址</h3> <p><code>https://api.jumdata.com/ocr/common-word</code></p> <h3>请求方式</h3> <ul> <li>POST</li> </ul> <h3>请求格式</h3> <ul> <li>x-www-form-urlencoded</li> </ul> <h3>请求参数</h3> <table> <thead> <tr> <th>名称</th> <th>类型</th> <th>必须</th> <th>&lt;div style=&quot;width:420px&quot;&gt;说明&lt;/div&gt;</th> </tr> </thead> <tbody> <tr> <td>appId</td> <td>String</td> <td>是</td> <td>服务商分配的唯一标识</td> </tr> <tr> <td>timestamp</td> <td>Long</td> <td>是</td> <td>当前时间的毫秒数</td> </tr> <tr> <td>sign</td> <td>String</td> <td>是</td> <td>签名,见签名算法说明</td> </tr> <tr> <td>image</td> <td>String</td> <td>否</td> <td>图片base64</td> </tr> <tr> <td>pdf</td> <td>String</td> <td>否</td> <td>PDF文件的base64</td> </tr> <tr> <td>pdfNum</td> <td>String</td> <td>否</td> <td>需要识别的PDF文件的对应页码,不传默认识别第 1 页</td> </tr> <tr> <td>ofd</td> <td>String</td> <td>否</td> <td>OFD文件的base64</td> </tr> <tr> <td>ofdNum</td> <td>String</td> <td>否</td> <td>需要识别的OFD文件的对应页码,不传默认识别第 1 页</td> </tr> <tr> <td>file</td> <td>File</td> <td>否</td> <td>文件</td> </tr> <tr> <td>url</td> <td>String</td> <td>否</td> <td>文件地址</td> </tr> </tbody> </table> <ul> <li>image、pdf、ofd、file、url 必须提供一个,优先级:image &gt; pdf &gt; ofd &gt; file &gt; url</li> <li>文件不超过4M,最短边至少15px,最长边最大4096px</li> <li>图片格式为 jpg、png、bmp、jpeg</li> </ul> <h3>签名算法说明</h3> <pre><code>sign = sha256( appId + appSecret + timestamp)</code></pre> <p>用服务商分配的 appId、服务商分配的 appSecret,当前时间毫秒数 timestamp,按上述顺序拼接成字符串,再进行 sha256 哈希得到。如下:</p> <pre><code class="language-java">String appId = &amp;quot;xyzxy2121zxyz&amp;quot;; String timestamp = &amp;quot;1555378976238&amp;quot;; String appSecret = &amp;quot;efcefcef1121cefcefc1212121&amp;quot;; String str = appId + appSecret + timestamp; String sign = sha256(str);</code></pre> <h3>返回样例</h3> <pre><code class="language-json">{ &amp;quot;msg&amp;quot;: &amp;quot;成功&amp;quot;,// code 对应的描述 &amp;quot;code&amp;quot;: 200,// 详见code返回码说明 &amp;quot;taskNo&amp;quot;: &amp;quot;316942821199035820008485&amp;quot;,// 本次请求号 &amp;quot;charge&amp;quot;: true, // 计费标志 &amp;quot;data&amp;quot;: { &amp;quot;resultNum&amp;quot;: 2,//识别结果数 &amp;quot;result&amp;quot;: [//识别结果 { &amp;quot;words&amp;quot;: &amp;quot;测试第一行&amp;quot;,//识别结果字符串 &amp;quot;location&amp;quot;: {//位置数组(坐标0点为左上角) &amp;quot;top&amp;quot;: 72,//表示定位位置的长方形左上顶点的垂直坐标 &amp;quot;left&amp;quot;: 89,//表示定位位置的长方形左上顶点的水平坐标 &amp;quot;width&amp;quot;: 52,//表示定位位置的长方形的宽度 &amp;quot;height&amp;quot;: 12//表示定位位置的长方形的高度 }, &amp;quot;probability&amp;quot;: {//表示识别结果中每一行的置信度值 &amp;quot;average&amp;quot;: 0.9956096411,//行置信度平均值 &amp;quot;min&amp;quot;: 0.9842295051,//行置信度最小值 &amp;quot;variance&amp;quot;: 0.00003516419747//行置信度方差 }, &amp;quot;vertexesLocation&amp;quot;: [//识别结果中每一行的外包四边形点坐标 { &amp;quot;x&amp;quot;: 90,//水平坐标(坐标0点为左上角) &amp;quot;y&amp;quot;: 73//垂直坐标(坐标0点为左上角) }, { &amp;quot;x&amp;quot;: 142, &amp;quot;y&amp;quot;: 73 }, { &amp;quot;x&amp;quot;: 142, &amp;quot;y&amp;quot;: 85 }, { &amp;quot;x&amp;quot;: 90, &amp;quot;y&amp;quot;: 85 } ], &amp;quot;finegrainedVertexesLocation&amp;quot;: [//识别结果中每一行的多边形轮廓点坐标 { &amp;quot;x&amp;quot;: 89, &amp;quot;y&amp;quot;: 72 }, { &amp;quot;x&amp;quot;: 101, &amp;quot;y&amp;quot;: 72 }, { &amp;quot;x&amp;quot;: 113, &amp;quot;y&amp;quot;: 72 }, { &amp;quot;x&amp;quot;: 124, &amp;quot;y&amp;quot;: 72 }, { &amp;quot;x&amp;quot;: 136, &amp;quot;y&amp;quot;: 72 }, { &amp;quot;x&amp;quot;: 141, &amp;quot;y&amp;quot;: 72 }, { &amp;quot;x&amp;quot;: 141, &amp;quot;y&amp;quot;: 78 }, { &amp;quot;x&amp;quot;: 141, &amp;quot;y&amp;quot;: 84 }, { &amp;quot;x&amp;quot;: 130, &amp;quot;y&amp;quot;: 84 }, { &amp;quot;x&amp;quot;: 118, &amp;quot;y&amp;quot;: 84 }, { &amp;quot;x&amp;quot;: 106, &amp;quot;y&amp;quot;: 84 }, { &amp;quot;x&amp;quot;: 95, &amp;quot;y&amp;quot;: 84 }, { &amp;quot;x&amp;quot;: 89, &amp;quot;y&amp;quot;: 84 }, { &amp;quot;x&amp;quot;: 89, &amp;quot;y&amp;quot;: 78 } ] }, ], &amp;quot;paragraphsResult&amp;quot;: [//段落检测结果 { &amp;quot;wordsResultIdx&amp;quot;: [//一个段落包含的行序号 0, 1 ], &amp;quot;finegrainedVertexesLocation&amp;quot;: [//识别结果中每一行的多边形轮廓点坐标 { &amp;quot;x&amp;quot;: 89, &amp;quot;y&amp;quot;: 72 }, { &amp;quot;x&amp;quot;: 101, &amp;quot;y&amp;quot;: 72 }, { &amp;quot;x&amp;quot;: 113, &amp;quot;y&amp;quot;: 72 }, { &amp;quot;x&amp;quot;: 124, &amp;quot;y&amp;quot;: 72 }, { &amp;quot;x&amp;quot;: 136, &amp;quot;y&amp;quot;: 72 }, { &amp;quot;x&amp;quot;: 141, &amp;quot;y&amp;quot;: 72 }, { &amp;quot;x&amp;quot;: 141, &amp;quot;y&amp;quot;: 72 }, { &amp;quot;x&amp;quot;: 141, &amp;quot;y&amp;quot;: 84 }, { &amp;quot;x&amp;quot;: 141, &amp;quot;y&amp;quot;: 88 }, { &amp;quot;x&amp;quot;: 141, &amp;quot;y&amp;quot;: 100 }, { &amp;quot;x&amp;quot;: 141, &amp;quot;y&amp;quot;: 100 }, { &amp;quot;x&amp;quot;: 129, &amp;quot;y&amp;quot;: 100 }, { &amp;quot;x&amp;quot;: 117, &amp;quot;y&amp;quot;: 100 }, { &amp;quot;x&amp;quot;: 104, &amp;quot;y&amp;quot;: 99 }, { &amp;quot;x&amp;quot;: 92, &amp;quot;y&amp;quot;: 99 }, { &amp;quot;x&amp;quot;: 89, &amp;quot;y&amp;quot;: 99 }, { &amp;quot;x&amp;quot;: 89, &amp;quot;y&amp;quot;: 99 }, { &amp;quot;x&amp;quot;: 89, &amp;quot;y&amp;quot;: 87 }, { &amp;quot;x&amp;quot;: 89, &amp;quot;y&amp;quot;: 84 }, { &amp;quot;x&amp;quot;: 89, &amp;quot;y&amp;quot;: 72 } ] } ], &amp;quot;paragraphsResultNum&amp;quot;: 1,//识别结果数,表示 paragraphsResult 的元素个数 &amp;quot;pdfFileSize&amp;quot;: 1//传入PDF文件的总页数,当 pdfFile 参数有效时返回该字段 } } </code></pre> <h3>错误返回样例</h3> <pre><code class="language-json">{ &amp;quot;msg&amp;quot;: &amp;quot;图片格式不正确&amp;quot;, &amp;quot;code&amp;quot;: 400 }</code></pre> <h3>返回字段说明</h3> <table> <thead> <tr> <th>字段名</th> <th>&lt;div style=&quot;width:420px&quot;&gt;说明&lt;/div&gt;</th> </tr> </thead> <tbody> <tr> <td>code</td> <td>返回码,详见code返回码说明</td> </tr> <tr> <td>msg</td> <td>code对应的描述</td> </tr> <tr> <td>charge</td> <td>是否计费</td> </tr> <tr> <td>taskNo</td> <td>本次请求号</td> </tr> <tr> <td>data</td> <td>返回具体结果,object类型,详见成功返回体</td> </tr> </tbody> </table> <h4>code返回码说明</h4> <table> <thead> <tr> <th>code</th> <th>&lt;div style=&quot;width:420px&quot;&gt;说明&lt;/div&gt;</th> </tr> </thead> <tbody> <tr> <td>200</td> <td>成功 (计费)</td> </tr> <tr> <td>400</td> <td>参数错误</td> </tr> <tr> <td>404</td> <td>接口地址不正确</td> </tr> <tr> <td>500</td> <td>系统维护,请稍候再试</td> </tr> <tr> <td>601</td> <td>接口未开通</td> </tr> <tr> <td>602</td> <td>账号停用</td> </tr> <tr> <td>603</td> <td>余额不足请充值</td> </tr> <tr> <td>604</td> <td>接口停用</td> </tr> <tr> <td>606</td> <td>调用超限,请稍候再试</td> </tr> <tr> <td>607</td> <td>ip不在白名单</td> </tr> <tr> <td>609</td> <td>请求过于频繁,请稍候再试</td> </tr> <tr> <td>610</td> <td>请求超时</td> </tr> <tr> <td>999</td> <td>其他,以实际返回为准</td> </tr> </tbody> </table>

页面列表

ITEM_HTML