baidu-aip UiPath调取百度AI平台仅需三个控件

编程之家2026-06-11826次浏览

UiPath调取百度AI平台仅需三个控件

在UiPath中，通过三个主要控件即可实现调用百度AI平台的API接口，完成智能识别等任务。这三个控件分别是：HTTP Request、Load Image（用于加载图片，虽非直接调用AI的控件，但在此流程中必不可少）、以及用于存储和处理数据的变量（虽为控件的一种，但在此特指用于存储API返回结果和中间数据的变量）。以下是详细步骤：

一、百度AI开放平台设置

注册与实名认证：

登录百度AI开放平台注册一个账号，并完成实名认证。

选择AI服务功能：

登录后，进入个人控制台，选择所需的AI服务功能，如文字识别。

领取API功能：

在所选AI服务页面，免费领取开放的API功能，并尽量多领取。

创建应用并获取密匙：

点击“创建应用”按钮，创建应用并获取API密匙（包括client_id和client_secret），这是后续在UiPath中使用的重要参数。

二、UiPath中调用相关接口

获取百度AI平台的Access Token：

在UiPath中拖入HTTP Request活动，用于发送HTTP请求。

如果找不到HTTP Request活动，需要安装webAPI项目依赖。

设置HTTP Request的属性，包括请求的URL、请求方法（通常为POST）、请求头和请求体。请求的URL需要拼接上自己的API密匙，如：。

点击Preview查看调用的json结果，获取Access Token参数值。

在HTTP Request活动的Output属性中，新建一个字符串变量存放json字符串结果，并提取json结果里面的Access Token。

调用相对应的API AI接口：

以通用文字识别为例，拖入一个Load Image活动，加载需要识别的图片，并在Output属性中新建一个变量imgSample，类型为image。

再次拖入一个HTTP Request活动，用于发送OCR请求。请求的URL需要包含第一步获得的access_token，如：。

添加请求Header，设置Content-Type为application/x-www-form-urlencoded。

添加一个image的参数，设置其值为加载的图片的base64编码。

新建一个字符串变量，用于存储API返回的json字符串结果。

处理API返回的结果：

使用变量存储API返回的json字符串结果，并进行解析，提取所需的信息。

三、总结

通过上述步骤，我们使用了三个主要控件（HTTP Request、Load Image、变量）在UiPath中成功调用了百度AI平台的API接口，完成了智能识别任务。整个流程逻辑清晰，步骤明确，易于理解和操作。

以下是流程中涉及的图片展示：

这些图片展示了在百度AI开放平台上的操作过程、UiPath中的活动设置以及最终的OCR结果和Json解析结果。

百度ai特效制作

百度AI特效制作有多种工具可供选择，以下为你详细介绍：

百度AI动画生成软件适合个人娱乐或教育培训场景。可进行角色和场景选择，设置走路、跳跃等动作，添加灯光、雨雪等特效，还能导出为GIF/MP4格式。使用时，先搜索下载软件并安装，注册百度账号登录；接着选择角色、场景，添加动作和特效；最后预览后导出至本地。

百度搜索「智能视频创作」平台支持输入提示词或上传参考图生成短视频，具备AI润色提示词、分步骤精调（脚本/角色/分镜）功能，有“快速直出”和“精细化调整”两种模式。文旅机构常用其制作“赛博文物变身”短片，如敦煌飞天动效、机甲风格佛造像。

文心App「魔法漫画」功能针对漫画爱好者。输入一句话剧情和参考图，5分钟可生成多页连载漫画，支持吉卜力、赛博朋克等9种风格，还能自动或手动续写剧情。操作步骤为打开文心App，选择“魔法漫画”，可上传角色照片，输入剧情和风格后生成漫画。

百度AI图像处理API适合开发者。提供风格迁移、滤镜应用等特效，需通过API接入。步骤为注册百度AI平台账号，申请API密钥，安装SDK（pip install baidu-aip），调用接口实现特效。

其他工具百度App AI发布器面向UGC创作者，提供“灵感卡片”“AI特效”“一键成片”，结合热点话题生成创意内容；“百毒”AI特效软件是影视级特效工具，支持画面识别、分割与修复，提升特效制作效率。普通用户推荐使用动画生成软件或「智能视频创作」平台，开发者可尝试API接口。

Uipath 百度OCR发票识别

Uipath百度OCR发票识别流程

在Uipath中利用百度OCR进行发票识别，主要包括了解百度OCR、配置Uipath进行第三方API请求、实现发票识别以及将识别内容写入Excel等步骤。以下是详细流程：

一、了解百度OCR

百度OCR是百度AI人工智能服务平台的一部分，提供文字识别等场景化能力。要使用百度OCR的相关接口，需要在百度云上注册账号并完成实名认证。注册完成后，登录百度AI控制台，点击“文字识别”领取免费资源，并创建应用以获取APPKey和Secret Key，这两个值将在Uipath中使用。

二、获取Access Token

百度AIP开放平台使用OAuth2.0授权调用开放API，调用API时必须在URL中带上access_token参数。因此，在使用API前，需要先调用GetToken接口获取Token。

API地址：请求方式：POST输入参数：包括grant_type（固定值client_credentials）、client_id（APPKey）、client_secret（SecretKey）。返回参数：成功获取Token后，将返回access_token、expires_in等参数，其中access_token是后续调用API时需要的。三、增值税发票识别API

百度OCR提供增值税发票识别API，支持对增值税普票、专票、全电发票、卷票、区块链发票的所有字段进行结构化识别。

API地址：请求方式：POST输入参数：包括access_token、image（发票图片的Base64编码）。返回参数：识别成功后，将返回发票的详细信息，如发票代码、发票号码、开票日期、购销方信息等。四、Uipath发票识别开发

下载依赖包：Uipath请求第三方API需要使用Http request活动，因此需要下载Uipath.WebApi.Activities依赖包。

创建Token流程文件：负责与百度AI服务消息通信的公共模块。在该流程中，使用Http request活动调用GetToken接口获取access_token，并将其存储在变量中供后续使用。

创建Invoice发票识别流程文件：进行封装，接受PDF文件地址作为输入，返回Invoice发票信息。在该流程中，首先读取PDF文件并将其转换为图片格式（如PNG或JPG），然后对图片进行Base64编码。接着，使用Http request活动调用增值税发票识别API，将编码后的图片和access_token作为输入参数。最后，解析API返回的JSON数据，提取发票信息。

创建InvoicePDF文件处理流程：调用发票识别公共模块，读取字典配置的PDF文件夹，通过For Each遍历对每个PDF文件进行解析提取。在该流程中，首先读取PDF文件夹路径，然后遍历文件夹中的每个PDF文件。对于每个文件，调用Invoice发票识别流程文件获取发票信息，并将信息存储在变量或数据结构中。

将发票信息写入Excel：读取发票模板，创建NewRow对象row，对row赋值后，通过添加数据行的活动写入数据表，再使用Append Scope方式写入Excel。在该流程中，首先创建Excel应用程序对象和工作簿对象。然后，根据发票模板创建工作表对象，并设置列名。接着，遍历存储发票信息的变量或数据结构，为每个发票信息创建一行数据（NewRow对象），并将数据赋值给行的各个单元格。最后，将行添加到数据表中，并使用Append Scope活动将数据表写入Excel文件。

五、执行结果

按照上述流程配置并执行Uipath项目后，将能够成功识别PDF文件中的发票信息，并将识别结果写入Excel文件中。执行结果可以通过查看Excel文件来验证。

以下是部分流程图的示例（由于markdown格式限制，无法直接展示完整的流程图，但可以通过以下描述和图片链接理解流程）：

Token获取流程图：

发票识别流程图：

发票信息写入Excel流程图：

通过上述流程，Uipath能够高效地利用百度OCR进行发票识别，并将识别结果写入Excel文件中，为企业的财务管理和数据分析提供有力支持。

关于baidu-aip的内容到此结束，希望对大家有所帮助。

ai问答助手百度的ai智能回答在哪里用ai画画 ai怎么绘画