聚美智数


文本审核

<h3>接口描述</h3> <ul> <li>检查文本中是否包括:违禁词、色情、恶意推广、低俗辱骂、低质灌水、广告法审核</li> <li>适用于用户评论过滤、注册信息筛查、文章内容审核等场景</li> </ul> <h3>请求地址</h3> <p><code>https://api.jumdata.com/text/review</code></p> <h3>请求方式</h3> <ul> <li>POST</li> </ul> <h3>请求格式</h3> <ul> <li>x-www-form-urlencoded</li> </ul> <h3>请求参数</h3> <table> <thead> <tr> <th>名称</th> <th>类型</th> <th>必须</th> <th>&lt;div style=&quot;width:420px&quot;&gt;说明&lt;/div&gt;</th> </tr> </thead> <tbody> <tr> <td>appId</td> <td>String</td> <td>是</td> <td>服务商分配的唯一标识</td> </tr> <tr> <td>timestamp</td> <td>Long</td> <td>是</td> <td>当前时间的毫秒数</td> </tr> <tr> <td>sign</td> <td>String</td> <td>是</td> <td>签名,见签名算法说明</td> </tr> <tr> <td>text</td> <td>String</td> <td>是</td> <td>审核的文本,长度20000个字节(约6666个中文)内</td> </tr> </tbody> </table> <h3>签名算法说明</h3> <pre><code>sign = sha256( appId + appSecret + timestamp)</code></pre> <p>用服务商分配的 appId、服务商分配的 appSecret,当前时间毫秒数 timestamp,按上述顺序拼接成字符串,再进行 sha256 哈希得到。如下:</p> <pre><code class="language-java">String appId = &amp;quot;xyzxy2121zxyz&amp;quot;; String timestamp = &amp;quot;1555378976238&amp;quot;; String appSecret = &amp;quot;efcefcef1121cefcefc1212121&amp;quot;; String str = appId + appSecret + timestamp; String sign = sha256(str);</code></pre> <h3>正面返回样例</h3> <pre><code>{ &amp;quot;code&amp;quot;: 200, // 返回码,详见返回码说明 &amp;quot;msg&amp;quot;: &amp;quot;成功&amp;quot;, // 返回对应的描述 &amp;quot;taskNo&amp;quot;: &amp;quot;40525341889422111006&amp;quot;, // 本次请求号 &amp;quot;charge&amp;quot;: true, // 计费标志 &amp;quot;data&amp;quot;: { &amp;quot;result&amp;quot;: &amp;quot;2&amp;quot;, // 审核结果类型,可取值1、2、3、4,分别代表1:合规,2:不合规,3:疑似,4:审核失败 &amp;quot;resultMsg&amp;quot;: &amp;quot;不合规&amp;quot;, // result对应的描述 &amp;quot;resultItems&amp;quot;: [ // 不合规项,合规时不返回 { &amp;quot;nonComplianceType&amp;quot;: 2, // 详见不合规类型 &amp;quot;msg&amp;quot;: &amp;quot;存在文本色情不合规&amp;quot;, // 不合规描述 &amp;quot;hits&amp;quot;: [{ // 命中的词 &amp;quot;probability&amp;quot;: 0.972112, // 不合规项置信度,范围:0至1,数字越大,可能性越高 &amp;quot;words&amp;quot;: [ // 送检文本命中词库的关键词。 &amp;quot;&amp;quot; ], &amp;quot;wordHitPositions&amp;quot;: [ // 送检文本命中词库的详细信息,为Object的列表,keyword、positions、label三个字段。 { &amp;quot;positions&amp;quot;: [ [ 4, 6 ] ], &amp;quot;label&amp;quot;: &amp;quot;100400&amp;quot;, // 关键词命中的细分标签,详见label字段描述。 &amp;quot;keyword&amp;quot;: &amp;quot;&amp;quot; // 命中的词 } ], &amp;quot;modelHitPositions&amp;quot;: [ // 送检文本命中模型的详细信息,包含位置信息及置信度信息。 // 位置信息:命中模型的违规内容在送检原文中的位置(从0开始计算):“开始位置”、“结束位置”; // 置信度信息:命中模型对应的置信度分数 [ 0, 4, 0.9721 ] ] }] }, { &amp;quot;nonComplianceType&amp;quot;: 4, &amp;quot;msg&amp;quot;: &amp;quot;存在恶意推广不合规&amp;quot;, &amp;quot;hits&amp;quot;: [{ &amp;quot;probability&amp;quot;: 0.96125, &amp;quot;modelHitPositions&amp;quot;: [ [ 0, 4, 0.9616 ] ] }] }, ... ] } }</code></pre> <h3>错误返回样例</h3> <pre><code class="language-json">{ &amp;quot;code&amp;quot;:400, &amp;quot;msg&amp;quot;: &amp;quot;文本不能为空&amp;quot;, &amp;quot;charge&amp;quot;: false, }</code></pre> <h3>不合规类型说明</h3> <table> <thead> <tr> <th>nonComplianceType</th> <th>&lt;div style=&quot;width:420px&quot;&gt;说明&lt;/div&gt;</th> </tr> </thead> <tbody> <tr> <td>0</td> <td>低质灌水</td> </tr> <tr> <td>1</td> <td>违禁违规</td> </tr> <tr> <td>2</td> <td>文本色情</td> </tr> <tr> <td>3</td> <td>敏感信息</td> </tr> <tr> <td>4</td> <td>恶意推广</td> </tr> <tr> <td>5</td> <td>低俗辱骂</td> </tr> <tr> <td>6</td> <td>恶意推广-联系方式</td> </tr> <tr> <td>7</td> <td>恶意推广-软文推广</td> </tr> <tr> <td>8</td> <td>广告法审核</td> </tr> </tbody> </table> <h3>细分标签label字段描述</h3> <table> <thead> <tr> <th>label</th> <th>&lt;div style=&quot;width:420px&quot;&gt;说明&lt;/div&gt;</th> </tr> </thead> <tbody> <tr> <td>100100</td> <td>恐怖描述</td> </tr> <tr> <td>100200</td> <td>毒品违禁药</td> </tr> <tr> <td>100300</td> <td>武器描述</td> </tr> <tr> <td>100400</td> <td>赌博及高利贷</td> </tr> <tr> <td>100500</td> <td>儿童恐怖影视</td> </tr> <tr> <td>100600</td> <td>造假&amp;非法培训</td> </tr> <tr> <td>100700</td> <td>●●外挂服务</td> </tr> <tr> <td>100800</td> <td>代孕&amp;人口买卖</td> </tr> <tr> <td>100900</td> <td>个人信息贩卖</td> </tr> <tr> <td>101000</td> <td>诈骗</td> </tr> <tr> <td>101100</td> <td>保护动物</td> </tr> <tr> <td>109900</td> <td>其它违禁相关</td> </tr> <tr> <td>200100</td> <td>性行为描述</td> </tr> <tr> <td>200200</td> <td>未成年色情</td> </tr> <tr> <td>200300</td> <td>性器官描述</td> </tr> <tr> <td>200400</td> <td>畸恋描述</td> </tr> <tr> <td>200500</td> <td>色情资源</td> </tr> <tr> <td>200600</td> <td>性挑逗/暗示</td> </tr> <tr> <td>200700</td> <td>色情交友</td> </tr> <tr> <td>200800</td> <td>色情道具</td> </tr> <tr> <td>200900</td> <td>色情段子&amp;舆情</td> </tr> <tr> <td>209900</td> <td>其他色情相关</td> </tr> <tr> <td>400100</td> <td>联系方式</td> </tr> <tr> <td>400200</td> <td>关注引流</td> </tr> <tr> <td>400300</td> <td>兼职代理</td> </tr> <tr> <td>400400</td> <td>产品推广</td> </tr> <tr> <td>400500</td> <td>企业推广</td> </tr> <tr> <td>400600</td> <td>广告法</td> </tr> <tr> <td>400990</td> <td>其他恶意推广</td> </tr> <tr> <td>500100</td> <td>轻度辱骂</td> </tr> <tr> <td>500200</td> <td>重度辱骂</td> </tr> </tbody> </table> <h3>code返回码说明</h3> <table> <thead> <tr> <th>code</th> <th>&lt;div style=&quot;width:420px&quot;&gt;说明&lt;/div&gt;</th> </tr> </thead> <tbody> <tr> <td>200</td> <td>成功 (计费)</td> </tr> <tr> <td>400</td> <td>参数错误</td> </tr> <tr> <td>404</td> <td>接口地址不正确</td> </tr> <tr> <td>500</td> <td>系统维护,请稍候再试</td> </tr> <tr> <td>601</td> <td>接口未开通</td> </tr> <tr> <td>602</td> <td>账号停用</td> </tr> <tr> <td>603</td> <td>余额不足请充值</td> </tr> <tr> <td>604</td> <td>接口停用</td> </tr> <tr> <td>606</td> <td>调用超限,请稍候再试</td> </tr> <tr> <td>607</td> <td>ip不在白名单</td> </tr> <tr> <td>609</td> <td>请求过于频繁,请稍候再试</td> </tr> <tr> <td>610</td> <td>请求超时</td> </tr> <tr> <td>999</td> <td>其他,以实际返回为准</td> </tr> </tbody> </table>

页面列表

ITEM_HTML