📅  最后修改于: 2020-10-29 04:13:53             🧑  作者: Mango
在本章中,让我们详细了解Uipath中的数据抓取和屏幕抓取。
数据抓取是一项技术,可以从网络或任何应用程序中提取结构化数据并将其保存到数据库或电子表格或.CSV文件中。 UiPath studio还借助抓取向导提供了数据抓取功能。我们可以在“设计”选项卡下找到抓取向导。
以下是相同的屏幕截图-
要使用UiPath数据抓取向导,您可以按照以下步骤操作-
步骤1-首先,打开要从中提取数据的网页或应用程序。以我们从Google联系人中提取数据为例。
步骤2-然后单击“设计”选项卡下的“数据收集”按钮。您将获得以下消息框-
步骤3-单击“下一步”按钮,它将为您提供选择要提取数据的网页中的第一个和最后一个字段的选项。在此示例中,您将能够从Google通讯录页面中进行选择。
步骤4-完成选择第一个元素后,它将提示一个对话框,用于选择第二个元素,如下所示-
步骤5-现在,一旦单击下一步并选择第二个元素,它将提示另一个对话框,我们可以自定义列标题并选择是否提取URL。
您可以根据需要重命名“文本”列的名称。我们已将column1重命名为“名称”。
步骤6-接下来,UiPath studio将为我们提供“提取向导”以预览数据。我们将选择提取相关数据或在此处完成提取。如果您提取相关数据,那么它将再次将您带到您要从中提取数据的网页。
步骤7-完成提取后,将询问“数据跨越多页吗?”如果要从多个页面提取数据,请单击“是”,否则单击“否”。我们单击“否”,因为此处的数据提取仅从单个页面进行。
步骤8-最后,它将在设计器选项卡中创建活动序列,如下所示-
UiPath studio为我们提供了从指定的UI元素或文档中提取数据的方法。这些方法称为屏幕抓取或输出方法。我们可以在“设计”选项卡下找到屏幕抓取向导。
UiPath Studio屏幕抓取向导具有三种从指定的UI元素抓取数据的方法。该方法将由UiPath studio自动选择,并显示在“屏幕抓取”窗口的顶部。
现在出现的问题是,如果自动选择了方法,是否可以根据需要进行更改?是的,可以从编写了“抓取方法”的“选项”面板中更改它,然后按“刷新”按钮。
单击“刷新”按钮后,UiPath studio会将信息保存在“设计器”面板中。另一方面,如果要将信息复制到剪贴板,则可以单击“完成”按钮。
如在桌面录制中所见,屏幕抓取会生成一个容器,其中包含活动和每个激活的部分选择器。您可以参考以下屏幕截图-
这三种方法都具有不同的功能,以下是所有三种屏幕抓取方法及其功能的说明-
本机-如果您选择本机屏幕抓取方法,则将获得以下功能。
无格式-顾名思义,此选项不会从文本中提取格式信息。
获取单词信息-此选项将提取每个单词的屏幕坐标。
自定义分隔符-通过此选项/字段,我们可以指定用作分隔符的字符。如果将此字段留空,则将使用所有已知的文本分隔符。
全文-如果您选择全文屏幕抓取方法,那么您将获得以下功能-
忽略隐藏-顾名思义,如果选择此选项,则不会复制所选UI元素中的隐藏文本。
Google OCR-如果您选择Google OCR屏幕抓取方法,那么您将获得以下功能-
OCR引擎-默认情况下,您将获得Google OCR选项。
语言:默认情况下,您会获得英语选项。
字符-此选项使我们能够选择要提取的字符类型:可以选择任何字符,仅数字,字母,大写,小写,电话号码,货币,日期和自定义。
反转-借助此选项,在背景比文本颜色更暗的情况下,可以在刮屏之前反转UI元素的颜色。
缩放-顾名思义,此选项将缩放选定的UI元素或图像。建议使用较小的图像,因为比例因子越大,可以放大的图像越多。
获取单词信息-此选项使我们能够获取每个抓取的单词在屏幕上的位置。
为了使用UiPath屏幕抓取向导,您可以按照以下步骤操作-
步骤1-首先,打开要从中提取数据的Ui元素(可能是PDF文件或Word文件或任何其他文件)。在这里,我们将其实现为PDF文件。
步骤2-现在,单击“设计”选项卡下的“屏幕抓取”选项。
步骤3-接下来,单击要从中提取信息的Ui元素,在我们的示例中,我们单击PDF文档。
步骤4-现在,您将获得以下屏幕-
默认情况下,UiPath studio将提供屏幕抓取方法,但是您可以根据需要进行更改。我们也已经在前面讨论过。
步骤5-然后,最后,您可以单击刷新按钮或完成按钮。我们单击完成按钮,它将被保存在设计器面板中。
如前所述,屏幕抓取会生成一个容器,其中包含活动和每个激活的部分选择器。
我们可以在以下屏幕截图中看到输出-