聚美智数


数字OCR识别

<p>[TOC]</p> <h3>接口描述</h3> <ul> <li>对图片中的数字进行提取和识别,自动过滤非数字内容,仅返回数字内容及其位置信息,识别准确率超过99%。</li> </ul> <h3>请求地址</h3> <p><code>https://api.jumdata.com/ocr/numbers</code></p> <h3>请求方式</h3> <ul> <li>POST</li> </ul> <h3>请求格式</h3> <ul> <li>x-www-form-urlencoded</li> </ul> <h3>请求参数</h3> <table> <thead> <tr> <th>名称</th> <th>类型</th> <th>必须</th> <th>&lt;div style=&quot;width:420px&quot;&gt;说明&lt;/div&gt;</th> </tr> </thead> <tbody> <tr> <td>appId</td> <td>String</td> <td>是</td> <td>服务商分配的唯一标识</td> </tr> <tr> <td>timestamp</td> <td>Long</td> <td>是</td> <td>当前时间的毫秒数</td> </tr> <tr> <td>sign</td> <td>String</td> <td>是</td> <td>签名,见签名算法说明</td> </tr> <tr> <td>image</td> <td>String</td> <td>否</td> <td>图像数据,base64编码后进行urlencode</td> </tr> <tr> <td>url</td> <td>String</td> <td>否</td> <td>图片完整url,url长度不超过1024字节</td> </tr> <tr> <td>pdfFile</td> <td>String</td> <td>否</td> <td>PDF文件,base64编码后进行urlencode</td> </tr> <tr> <td>pdfFileNum</td> <td>String</td> <td>否</td> <td>需要识别的PDF文件的对应页码,当pdfFile参数有效时,识别传入页码的对应页面内容,若不传入,则默认识别第 1 页</td> </tr> <tr> <td>ofdFile</td> <td>String</td> <td>否</td> <td>OFD文件,base64编码后进行urlencode</td> </tr> <tr> <td>ofdFileNum</td> <td>String</td> <td>否</td> <td>需要识别的OFD文件的对应页码,当ofdFile参数有效时,识别传入页码的对应页面内容,若不传入,则默认识别第 1 页</td> </tr> <tr> <td>recognizeGranularity</td> <td>String</td> <td>否</td> <td>是否定位单字符位置,big:不定位单字符位置,默认值;small:定位单字符位置</td> </tr> </tbody> </table> <ul> <li>image、url、pdfFile、ofdFile 必须提供一个,优先级:image &gt; url &gt; pdfFile &gt; ofdFile</li> <li>图片、pdf、ofdFile文件不超过8M,最短边至少15px,最长边最大4096px</li> <li>图片支持jpg/jpeg/png/bmp格式</li> </ul> <h3>签名算法说明</h3> <pre><code>sign = sha256( appId + appSecret + timestamp)</code></pre> <p>用服务商分配的 appId、服务商分配的 appSecret,当前时间毫秒数 timestamp,按上述顺序拼接成字符串,再进行 sha256 哈希得到。如下:</p> <pre><code class="language-java">String appId = &amp;quot;xyzxy2121zxyz&amp;quot;; String timestamp = &amp;quot;1555378976238&amp;quot;; String appSecret = &amp;quot;efcefcef1121cefcefc1212121&amp;quot;; String str = appId + appSecret + timestamp; String sign = sha256(str);</code></pre> <h3>正确返回样例</h3> <pre><code class="language-json">{ &amp;quot;code&amp;quot;: 200,//返回码,详见返回码说明 &amp;quot;charge&amp;quot;: true,//计费标志 &amp;quot;msg&amp;quot;: &amp;quot;成功&amp;quot;,//返回码对应描述 &amp;quot;taskNo&amp;quot;: &amp;quot;522845859198018574212640&amp;quot;,//本次请求号 &amp;quot;data&amp;quot;: { &amp;quot;wordsResultNum&amp;quot;: &amp;quot;4&amp;quot;,//识别结果数,表示wordsResult的元素个数 &amp;quot;wordsResult&amp;quot;: [ { &amp;quot;words&amp;quot;: &amp;quot;1988116&amp;quot;,//识别结果字符串 &amp;quot;location&amp;quot;: {//位置(坐标0点为左上角) &amp;quot;top&amp;quot;: 529,//表示定位位置的长方形左上顶点的垂直坐标 &amp;quot;left&amp;quot;: 225,//表示定位位置的长方形左上顶点的水平坐标 &amp;quot;width&amp;quot;: 656,//表示定位位置的长方形的宽度 &amp;quot;height&amp;quot;: 59 //表示定位位置的长方形的高度 }, &amp;quot;chars&amp;quot;: [ { &amp;quot;char&amp;quot;: &amp;quot;1&amp;quot;,//单字符识别结果 &amp;quot;location&amp;quot;: {//位置(坐标0点为左上角) &amp;quot;top&amp;quot;: 532, &amp;quot;left&amp;quot;: 409, &amp;quot;width&amp;quot;: 28, &amp;quot;height&amp;quot;: 56 } } ] } ] } } </code></pre> <h3>错误返回样例</h3> <pre><code class="language-json">{ &amp;quot;msg&amp;quot;: &amp;quot;图片、pdf、ofd文件不能同时为空&amp;quot;, &amp;quot;code&amp;quot;: 400 }</code></pre> <h3>返回字段说明</h3> <table> <thead> <tr> <th>字段名</th> <th>&lt;div style=&quot;width:420px&quot;&gt;说明&lt;/div&gt;</th> </tr> </thead> <tbody> <tr> <td>code</td> <td>返回码,详见code返回码说明</td> </tr> <tr> <td>msg</td> <td>code对应的描述</td> </tr> <tr> <td>charge</td> <td>是否计费</td> </tr> <tr> <td>taskNo</td> <td>本次请求号</td> </tr> <tr> <td>data</td> <td>返回具体结果,object类型,详见成功返回体</td> </tr> </tbody> </table> <h3>code返回码说明</h3> <table> <thead> <tr> <th>code</th> <th>&lt;div style=&quot;width:420px&quot;&gt;说明&lt;/div&gt;</th> </tr> </thead> <tbody> <tr> <td>200</td> <td>成功 (计费)</td> </tr> <tr> <td>400</td> <td>参数错误</td> </tr> <tr> <td>404</td> <td>接口地址不正确</td> </tr> <tr> <td>500</td> <td>系统维护,请稍候再试</td> </tr> <tr> <td>601</td> <td>接口未开通</td> </tr> <tr> <td>602</td> <td>账号停用</td> </tr> <tr> <td>603</td> <td>余额不足请充值</td> </tr> <tr> <td>604</td> <td>接口停用</td> </tr> <tr> <td>606</td> <td>调用超限,请稍候再试</td> </tr> <tr> <td>607</td> <td>ip不在白名单</td> </tr> <tr> <td>609</td> <td>请求过于频繁,请稍候再试</td> </tr> <tr> <td>610</td> <td>请求超时</td> </tr> <tr> <td>999</td> <td>其他,以实际返回为准</td> </tr> </tbody> </table>

页面列表

ITEM_HTML