脚本向导-帮助文档

读取PDF页

<h1>功能</h1> <p>获取PDF文件中的文字与图像。</p> <h1>输入</h1> <table> <thead> <tr> <th style="text-align: center;">名称</th> <th style="text-align: center;">说明</th> <th style="text-align: center;">示例</th> </tr> </thead> <tbody> <tr> <td style="text-align: center;">页</td> <td style="text-align: center;">【整型】PDF页码。PDF页码的索引从0开始。</td> <td style="text-align: center;">0</td> </tr> <tr> <td style="text-align: center;">阅读类型</td> <td style="text-align: center;">【枚举】0 = 读取文本和图像；1 = 读取文本；2 = 读取图像</td> <td style="text-align: center;">ALL</td> </tr> </tbody> </table> <h1>选项</h1> <table> <thead> <tr> <th style="text-align: center;">名称</th> <th style="text-align: center;">说明</th> <th style="text-align: center;">示例</th> </tr> </thead> <tbody> <tr> <td style="text-align: center;">文本提取选项</td> <td style="text-align: center;">【整型】根据返回不同的类型选择，默认为8。0 = 以人类可读格式提取文本；1 = 已弃用；2 = 返回CSV字符串，包括页面上每个文本的字体，颜色，大小和位置；3 = 以以下格式为页面上的每个文本返回CSV字符串：\r\n字体名称，文本颜色，文本大小，X1，Y1，X2，Y2，X3，Y3，X4，Y4，文本坐标是界定文本的四个点，坐标顺序是逆时针，左下角在前；4 = 与选项3相似，但返回单个单词，从而使搜索单词更容易；5 = 类似于选项3，但是在每个文本块之后输出字符宽度；6 = 与选项4相似，但是在每行文本之后输出字符宽度；7 = 与选项0相比，以人类可读格式提取文本，准确性更高；8 = 与选项0相似的输出格式，但使用更精确的算法，返回未格式化的行。</td> <td style="text-align: center;">8</td> </tr> <tr> <td style="text-align: center;">图片保存路径</td> <td style="text-align: center;">【字符串】保存图片的路径</td> <td style="text-align: center;">‘C:\桌面\图片’</td> </tr> <tr> <td style="text-align: center;">图片选项</td> <td style="text-align: center;">【枚举】0 = 无法枚举页面上的图像；非零 = ImageListID值</td> <td style="text-align: center;">0</td> </tr> </tbody> </table> <h1>输出</h1> <table> <thead> <tr> <th style="text-align: center;">名称</th> <th style="text-align: center;">说明</th> <th style="text-align: center;">示例</th> </tr> </thead> <tbody> <tr> <td style="text-align: center;">文本</td> <td style="text-align: center;">【字符串】输出文本内容</td> <td style="text-align: center;">Text（创建变量）</td> </tr> <tr> <td style="text-align: center;">图片文件</td> <td style="text-align: center;">【字符串】输出图片保存的全路径</td> <td style="text-align: center;">Img（创建变量）</td> </tr> </tbody> </table> <h1>注意/说明</h1> <p>1、输入属性示例说明：页：在PDF函数中，所有PDF页码的函数参数索引是从0开始的。 2、输出属性示例说明：文本：在函数读取出文本时，需要创建一个Text变量来存储读取出来的文本。具体做法：单击一下[读取PDF页]函数的输出属性中的文本选框，再单击一下鼠标右键，会显示出‘创建变量’、‘创建输入参数’、‘创建输出参数’、‘显示智能提示’四个选项，然后点击‘创建变量’选项，会弹出创建变量的弹框，在弹框中输入所要创建的变量即可。 <img src="https://www.showdoc.com.cn/server/api/attachment/visitfile/sign/2618434b8aa679304f5eea8e0ad032da" alt="" /> <img src="https://www.showdoc.com.cn/server/api/attachment/visitfile/sign/68b12155e99cf9922f970a595b5d0dbf" alt="" /> 图片文件：在函数读取出图片时，需要创建一个Img变量来存储图片的路径。创建变量的做法同上。 3、日志消息：可将变量里的内容在控制台显示出来。具体做法：单击一下[日志消息]函数的输入属性中的消息选框，再单击一下鼠标右键，会显示出‘创建变量’、‘创建输入参数’、‘创建输出参数’、‘显示智能提示’四个选项，然后点击‘显示智能提示’选项，就会显示出你所创建的所有变量、输入参数和输出参数，选择Text这个变量，在运行这个函数时，即可在控制台显示出PDF文件的所有文本内容。显示图片路径的日志消息做法同显示文本内容的日志消息其相似。</p> <p><img src="https://www.showdoc.com.cn/server/api/attachment/visitfile/sign/cdc60539d70c45b46f7c2a9bbc486be0" alt="" /> <img src="https://www.showdoc.com.cn/server/api/attachment/visitfile/sign/7d073fab9f9d121c5feb5b6296ac170d" alt="" /> <img src="https://www.showdoc.com.cn/server/api/attachment/visitfile/sign/fd3f7f4ad46c95d7f27c0d82ce5334e3" alt="" /> <img src="https://www.showdoc.com.cn/server/api/attachment/visitfile/sign/730a1fae72dd8033fdd157c24e7b0252" alt="" /></p> <h1>相关函数</h1> <p>无</p> <h1>示例/演示</h1> <p><img src="https://www.showdoc.com.cn/server/api/attachment/visitfile/sign/0775fa0f833bcf6660d5505a68f89085" alt="" /></p> <h1>示例附件</h1> <p><a href="https://www.showdoc.com.cn/server/api/attachment/visitfile/sign/d28fd23c3aadc93141cefc1595229606" title="[组件[读取PDF页函数示例]_20210325.db">组件[读取PDF页函数示例]_20210325.db</a></p>

页面列表