聚美智数


英文OCR识别

<p>[TOC]</p> <h3>接口描述</h3> <ul> <li>本接口支持图像英文文字的检测和识别,返回文字框位置与文字内容。支持多场景、任意版面下的英文、字母、数字和常见字符的识别,同时覆盖英文印刷体和英文手写体识别。</li> </ul> <h3>请求地址</h3> <p><code>https://api.jumdata.com/ocr/english</code></p> <h3>请求方式</h3> <ul> <li>POST</li> </ul> <h3>请求格式</h3> <ul> <li>x-www-form-urlencoded</li> </ul> <h3>请求参数</h3> <table> <thead> <tr> <th>名称</th> <th>类型</th> <th>必须</th> <th>&lt;div style=&quot;width:420px&quot;&gt;说明&lt;/div&gt;</th> </tr> </thead> <tbody> <tr> <td>appId</td> <td>String</td> <td>是</td> <td>服务商分配的唯一标识</td> </tr> <tr> <td>timestamp</td> <td>Long</td> <td>是</td> <td>当前时间的毫秒数</td> </tr> <tr> <td>sign</td> <td>String</td> <td>是</td> <td>签名,见签名算法说明</td> </tr> <tr> <td>image</td> <td>String</td> <td>否</td> <td>图像base64,base64编码后进行urlencode</td> </tr> <tr> <td>url</td> <td>String</td> <td>否</td> <td>图片完整url,url长度不超过1024字节</td> </tr> <tr> <td>enableCoordPoint</td> <td>Boolean</td> <td>否</td> <td>单词四点坐标开关,开启可返回图片中单词的四点坐标。默认false</td> </tr> <tr> <td>enableCandWord</td> <td>Boolean</td> <td>否</td> <td>候选字开关,开启可返回识别时多个可能的候选字(每个候选字对应其置信度)。默认false</td> </tr> </tbody> </table> <ul> <li>image、url必须提供一个,优先级:image &gt; url</li> <li>图片经Base64编码后不超过7M,像素须介于20-10000px之间</li> <li>图片支持jpg/jpeg/png格式</li> </ul> <h3>签名算法说明</h3> <pre><code>sign = sha256( appId + appSecret + timestamp)</code></pre> <p>用服务商分配的 appId、服务商分配的 appSecret,当前时间毫秒数 timestamp,按上述顺序拼接成字符串,再进行 sha256 哈希得到。如下:</p> <pre><code class="language-java">String appId = &amp;quot;xyzxy2121zxyz&amp;quot;; String timestamp = &amp;quot;1555378976238&amp;quot;; String appSecret = &amp;quot;efcefcef1121cefcefc1212121&amp;quot;; String str = appId + appSecret + timestamp; String sign = sha256(str);</code></pre> <h3>正确返回样例</h3> <pre><code class="language-json">{ &amp;quot;code&amp;quot;: 200,//返回码,详见返回码说明 &amp;quot;msg&amp;quot;: &amp;quot;成功&amp;quot;,//返回码对应描述 &amp;quot;taskNo&amp;quot;: &amp;quot;802890489170330092093123&amp;quot;,//本次请求号 &amp;quot;charge&amp;quot;: true,//计费标志 &amp;quot;data&amp;quot;: { &amp;quot;list&amp;quot;: [ { &amp;quot;CandWord&amp;quot;: [//候选字符集(包含候选字Character以及置信度Confidence)。 { &amp;quot;CandWords&amp;quot;: [ { &amp;quot;Character&amp;quot;: &amp;quot;D&amp;quot;, &amp;quot;Confidence&amp;quot;: 79 }, { &amp;quot;Character&amp;quot;: &amp;quot;㊥&amp;quot;, &amp;quot;Confidence&amp;quot;: 0 } ] } ], &amp;quot;Confidence&amp;quot;: 96,//置信度 0 ~100 &amp;quot;DetectedText&amp;quot;: &amp;quot;Do you speak&amp;quot;,//识别出的文本行内容。 &amp;quot;Polygon&amp;quot;: [//文本行在原图中的四点坐标。注意:此字段可能返回 null,表示取不到有效值。 { &amp;quot;X&amp;quot;: 18, &amp;quot;Y&amp;quot;: 31 } ], &amp;quot;WordCoordPoint&amp;quot;: [//英文单词在原图中的四点坐标。 { &amp;quot;WordCoordinate&amp;quot;: [//英文OCR识别出的每个单词在原图中的四点坐标。 { &amp;quot;X&amp;quot;: 0, &amp;quot;Y&amp;quot;: 111 }, { &amp;quot;X&amp;quot;: 0, &amp;quot;Y&amp;quot;: 253 }, { &amp;quot;X&amp;quot;: 4, &amp;quot;Y&amp;quot;: 150 }, { &amp;quot;X&amp;quot;: 4, &amp;quot;Y&amp;quot;: 253 } ] } ], &amp;quot;Words&amp;quot;: [//识别出来的单词信息(包括单词Character和单词置信度confidence) { &amp;quot;Character&amp;quot;: &amp;quot;Do&amp;quot;, &amp;quot;Confidence&amp;quot;: 89 } ] } ] } } </code></pre> <h3>错误返回样例</h3> <pre><code class="language-json">{ &amp;quot;msg&amp;quot;: &amp;quot;图片不能为空&amp;quot;, &amp;quot;code&amp;quot;: 400 }</code></pre> <h3>返回字段说明</h3> <table> <thead> <tr> <th>字段名</th> <th>&lt;div style=&quot;width:420px&quot;&gt;说明&lt;/div&gt;</th> </tr> </thead> <tbody> <tr> <td>code</td> <td>返回码,详见code返回码说明</td> </tr> <tr> <td>msg</td> <td>code对应的描述</td> </tr> <tr> <td>charge</td> <td>是否计费</td> </tr> <tr> <td>taskNo</td> <td>本次请求号</td> </tr> <tr> <td>data</td> <td>返回具体结果,object类型,详见成功返回体</td> </tr> </tbody> </table> <h3>code返回码说明</h3> <table> <thead> <tr> <th>code</th> <th>&lt;div style=&quot;width:420px&quot;&gt;说明&lt;/div&gt;</th> </tr> </thead> <tbody> <tr> <td>200</td> <td>成功 (计费)</td> </tr> <tr> <td>201</td> <td>图片中未检测到文本</td> </tr> <tr> <td>202</td> <td>文件内容太大</td> </tr> <tr> <td>400</td> <td>参数错误</td> </tr> <tr> <td>404</td> <td>接口地址不正确</td> </tr> <tr> <td>500</td> <td>系统维护,请稍候再试</td> </tr> <tr> <td>601</td> <td>接口未开通</td> </tr> <tr> <td>602</td> <td>账号停用</td> </tr> <tr> <td>603</td> <td>余额不足请充值</td> </tr> <tr> <td>604</td> <td>接口停用</td> </tr> <tr> <td>606</td> <td>调用超限,请稍候再试</td> </tr> <tr> <td>607</td> <td>ip不在白名单</td> </tr> <tr> <td>609</td> <td>请求过于频繁,请稍候再试</td> </tr> <tr> <td>610</td> <td>请求超时</td> </tr> <tr> <td>999</td> <td>其他,以实际返回为准</td> </tr> </tbody> </table>

页面列表

ITEM_HTML