循环


访问 1234

一. 创建方法

在流程设计器中点右键,弹出右键菜单选择“逻辑控制”- “循环”。

. 功能介绍

在循环节点内的步骤将会按指定的条件重复执行,在循环上点右键创建步骤时,该步骤将会自动在循环内部创建,也可以把循环外面的步骤拖拽到循环上,或拖拽到循环内部的某个步骤的后面。

最大循环次数:当完成指定次数的循环后会自动结束循环

跳过前几次循环:执行循环是忽略前N此循环,即从N+1次开始循环,在某些步骤需要重复执行次数比较多时,比如长时间采集,循环时可以记录当前循环次数保存到一个文本文件,那么即使中途停止运行,下次启动时也可以跳过之前记录的循环次数,继续后面的循环(采集)。

1. 无限循环

blob.png

2. 遍历集合变量

blob.png

通过变量一个集合的成员创建处理的循环,执行时会读取该集合的所有成员,默认最大循环次数等于集合的成员数。

要遍历的集合变量:选择一个集合变量来创建循环

保存集合成员到变量:将循环时读取到的集合成员保存到指定的变量中,在循环内部需要使用当前读取到的集合成员值时,调用这个变量即可。

3. 遍历查询到的数据:通过执行sql查询语句,查询指定数据库中的数据,通过查询出来的记录集创建一个循环,该循环可以遍历该查询结果的每一条记录,循环时可以将遍历到的记录保存到指定变量中,以便循环内部的步骤调用。

blob.pngblob.png

如果没有创建过任何数据库连接的配置,按上图先创建一个

blob.png

保存每个字段值到同名的文本变量:先创建好与数据库字段同名的文本变量,选择此项,循环时即可将读取到的记录中相应的字段值保存到文本变量中

保存每行数据到行变量:将读取到的记录保存到行变量,只需指定一个行变量,行变量字段无需手动创建,运行时会根据读取到的记录中的字段创建相应的行变量字段。

4. 翻页循环(非浏览器内核脚本中不支持该选项):循环点击指定的网页链接,例如自动点击网页中分页栏里的“下一页”按钮。该循环比较特殊,即使执行内部步骤时当前浏览器打开了其他网页,循环时也会自动回到之前包含“下一页”按钮的那个页面,不会影响翻页点击。该功能比较适合采集分页数据时切换分页。详细用法可参看网页采集相关的视频教程

blob.png

Xpath:指定需要循环点击的“下一页”按钮的xpath,可通过内置浏览器上的标记元素按钮生成该xpath

5. 列表循环(非浏览器内核脚本中不支持该选项):遍历指定的网页元素列表。

blob.png

Xpath:可点击内置浏览器标记元素按钮,根据弹出的向导完成创建

点击标题链接:这里特别注意,循环网页列表时,如果需要打开列表上的链接地址采集内页文章信息是,必须勾选此项,否则不会打开文章页去采集,反之,如果只需要采集列表上的数据,不需要采集里面的文章,则不需要勾选。

倒序循环:采集的数据顺序与列表上的顺序相反