读取PDF页
<h1>功能</h1>
<p>获取PDF文件中的文字与图像。</p>
<h1>输入</h1>
<table>
<thead>
<tr>
<th style="text-align: center;">名称</th>
<th style="text-align: center;">说明</th>
<th style="text-align: center;">示例</th>
</tr>
</thead>
<tbody>
<tr>
<td style="text-align: center;">页</td>
<td style="text-align: center;">【整型】PDF页码。PDF页码的索引从0开始。</td>
<td style="text-align: center;">0</td>
</tr>
<tr>
<td style="text-align: center;">阅读类型</td>
<td style="text-align: center;">【枚举】0 = 读取文本和图像;1 = 读取文本;2 = 读取图像</td>
<td style="text-align: center;">ALL</td>
</tr>
</tbody>
</table>
<h1>选项</h1>
<table>
<thead>
<tr>
<th style="text-align: center;">名称</th>
<th style="text-align: center;">说明</th>
<th style="text-align: center;">示例</th>
</tr>
</thead>
<tbody>
<tr>
<td style="text-align: center;">文本提取选项</td>
<td style="text-align: center;">【整型】根据返回不同的类型选择,默认为8。0 = 以人类可读格式提取文本;1 = 已弃用;2 = 返回CSV字符串,包括页面上每个文本的字体,颜色,大小和位置;3 = 以以下格式为页面上的每个文本返回CSV字符串:\r\n字体名称,文本颜色,文本大小,X1,Y1,X2,Y2,X3,Y3,X4,Y4,文本坐标是界定文本的四个点,坐标顺序是逆时针,左下角在前;4 = 与选项3相似,但返回单个单词,从而使搜索单词更容易;5 = 类似于选项3,但是在每个文本块之后输出字符宽度;6 = 与选项4相似,但是在每行文本之后输出字符宽度;7 = 与选项0相比,以人类可读格式提取文本,准确性更高;8 = 与选项0相似的输出格式,但使用更精确的算法,返回未格式化的行。</td>
<td style="text-align: center;">8</td>
</tr>
<tr>
<td style="text-align: center;">图片保存路径</td>
<td style="text-align: center;">【字符串】保存图片的路径</td>
<td style="text-align: center;">‘C:\桌面\图片’</td>
</tr>
<tr>
<td style="text-align: center;">图片选项</td>
<td style="text-align: center;">【枚举】0 = 无法枚举页面上的图像;非零 = ImageListID值</td>
<td style="text-align: center;">0</td>
</tr>
</tbody>
</table>
<h1>输出</h1>
<table>
<thead>
<tr>
<th style="text-align: center;">名称</th>
<th style="text-align: center;">说明</th>
<th style="text-align: center;">示例</th>
</tr>
</thead>
<tbody>
<tr>
<td style="text-align: center;">文本</td>
<td style="text-align: center;">【字符串】输出文本内容</td>
<td style="text-align: center;">Text(创建变量)</td>
</tr>
<tr>
<td style="text-align: center;">图片文件</td>
<td style="text-align: center;">【字符串】输出图片保存的全路径</td>
<td style="text-align: center;">Img(创建变量)</td>
</tr>
</tbody>
</table>
<h1>注意/说明</h1>
<p>1、输入属性示例说明:
页:在PDF函数中,所有PDF页码的函数参数索引是从0开始的。
2、输出属性示例说明:
文本:在函数读取出文本时,需要创建一个Text变量来存储读取出来的文本。
具体做法:
单击一下[读取PDF页]函数的输出属性中的文本选框,再单击一下鼠标右键,会显示出‘创建变量’、‘创建输入参数’、‘创建输出参数’、‘显示智能提示’四个选项,然后点击‘创建变量’选项,会弹出创建变量的弹框,在弹框中输入所要创建的变量即可。
<img src="https://www.showdoc.com.cn/server/api/attachment/visitfile/sign/2618434b8aa679304f5eea8e0ad032da" alt="" />
<img src="https://www.showdoc.com.cn/server/api/attachment/visitfile/sign/68b12155e99cf9922f970a595b5d0dbf" alt="" />
图片文件:在函数读取出图片时,需要创建一个Img变量来存储图片的路径。创建变量的做法同上。
3、日志消息:可将变量里的内容在控制台显示出来。
具体做法:
单击一下[日志消息]函数的输入属性中的消息选框,再单击一下鼠标右键,会显示出‘创建变量’、‘创建输入参数’、‘创建输出参数’、‘显示智能提示’四个选项,然后点击‘显示智能提示’选项,就会显示出你所创建的所有变量、输入参数和输出参数,选择Text这个变量,在运行这个函数时,即可在控制台显示出PDF文件的所有文本内容。显示图片路径的日志消息做法同显示文本内容的日志消息其相似。</p>
<p><img src="https://www.showdoc.com.cn/server/api/attachment/visitfile/sign/cdc60539d70c45b46f7c2a9bbc486be0" alt="" />
<img src="https://www.showdoc.com.cn/server/api/attachment/visitfile/sign/7d073fab9f9d121c5feb5b6296ac170d" alt="" />
<img src="https://www.showdoc.com.cn/server/api/attachment/visitfile/sign/fd3f7f4ad46c95d7f27c0d82ce5334e3" alt="" />
<img src="https://www.showdoc.com.cn/server/api/attachment/visitfile/sign/730a1fae72dd8033fdd157c24e7b0252" alt="" /></p>
<h1>相关函数</h1>
<p>无</p>
<h1>示例/演示</h1>
<p><img src="https://www.showdoc.com.cn/server/api/attachment/visitfile/sign/0775fa0f833bcf6660d5505a68f89085" alt="" /></p>
<h1>示例附件</h1>
<p><a href="https://www.showdoc.com.cn/server/api/attachment/visitfile/sign/d28fd23c3aadc93141cefc1595229606" title="[组件[读取PDF页函数示例]_20210325.db">组件[读取PDF页函数示例]_20210325.db</a></p>