baidu-aip UiPath调取百度AI平台仅需三个控件
UiPath调取百度AI平台仅需三个控件
UiPath调取百度AI平台仅需三个控件
在UiPath中,通过三个主要控件即可实现调用百度AI平台的API接口,完成智能识别等任务。这三个控件分别是:HTTP Request、Load Image(用于加载图片,虽非直接调用AI的控件,但在此流程中必不可少)、以及用于存储和处理数据的变量(虽为控件的一种,但在此特指用于存储API返回结果和中间数据的变量)。以下是详细步骤:
一、百度AI开放平台设置
注册与实名认证:
登录百度AI开放平台注册一个账号,并完成实名认证。
选择AI服务功能:
登录后,进入个人控制台,选择所需的AI服务功能,如文字识别。
领取API功能:
在所选AI服务页面,免费领取开放的API功能,并尽量多领取。
创建应用并获取密匙:
点击“创建应用”按钮,创建应用并获取API密匙(包括client_id和client_secret),这是后续在UiPath中使用的重要参数。
二、UiPath中调用相关接口
获取百度AI平台的Access Token:
在UiPath中拖入HTTP Request活动,用于发送HTTP请求。
如果找不到HTTP Request活动,需要安装webAPI项目依赖。
设置HTTP Request的属性,包括请求的URL、请求方法(通常为POST)、请求头和请求体。请求的URL需要拼接上自己的API密匙,如:。
点击Preview查看调用的json结果,获取Access Token参数值。
在HTTP Request活动的Output属性中,新建一个字符串变量存放json字符串结果,并提取json结果里面的Access Token。
调用相对应的API AI接口:
以通用文字识别为例,拖入一个Load Image活动,加载需要识别的图片,并在Output属性中新建一个变量imgSample,类型为image。
再次拖入一个HTTP Request活动,用于发送OCR请求。请求的URL需要包含第一步获得的access_token,如:。
添加请求Header,设置Content-Type为application/x-www-form-urlencoded。
添加一个image的参数,设置其值为加载的图片的base64编码。
新建一个字符串变量,用于存储API返回的json字符串结果。
处理API返回的结果:
使用变量存储API返回的json字符串结果,并进行解析,提取所需的信息。
三、总结
通过上述步骤,我们使用了三个主要控件(HTTP Request、Load Image、变量)在UiPath中成功调用了百度AI平台的API接口,完成了智能识别任务。整个流程逻辑清晰,步骤明确,易于理解和操作。
以下是流程中涉及的图片展示:
这些图片展示了在百度AI开放平台上的操作过程、UiPath中的活动设置以及最终的OCR结果和Json解析结果。
百度ai特效制作
百度AI特效制作有多种工具可供选择,以下为你详细介绍:
百度AI动画生成软件适合个人娱乐或教育培训场景。可进行角色和场景选择,设置走路、跳跃等动作,添加灯光、雨雪等特效,还能导出为GIF/MP4格式。使用时,先搜索下载软件并安装,注册百度账号登录;接着选择角色、场景,添加动作和特效;最后预览后导出至本地。
百度搜索「智能视频创作」平台支持输入提示词或上传参考图生成短视频,具备AI润色提示词、分步骤精调(脚本/角色/分镜)功能,有“快速直出”和“精细化调整”两种模式。文旅机构常用其制作“赛博文物变身”短片,如敦煌飞天动效、机甲风格佛造像。
文心App「魔法漫画」功能针对漫画爱好者。输入一句话剧情和参考图,5分钟可生成多页连载漫画,支持吉卜力、赛博朋克等9种风格,还能自动或手动续写剧情。操作步骤为打开文心App,选择“魔法漫画”,可上传角色照片,输入剧情和风格后生成漫画。
百度AI图像处理API适合开发者。提供风格迁移、滤镜应用等特效,需通过API接入。步骤为注册百度AI平台账号,申请API密钥,安装SDK(pip install baidu-aip),调用接口实现特效。
其他工具百度App AI发布器面向UGC创作者,提供“灵感卡片”“AI特效”“一键成片”,结合热点话题生成创意内容;“百毒”AI特效软件是影视级特效工具,支持画面识别、分割与修复,提升特效制作效率。普通用户推荐使用动画生成软件或「智能视频创作」平台,开发者可尝试API接口。
Uipath 百度OCR发票识别
Uipath百度OCR发票识别流程
在Uipath中利用百度OCR进行发票识别,主要包括了解百度OCR、配置Uipath进行第三方API请求、实现发票识别以及将识别内容写入Excel等步骤。以下是详细流程:
一、了解百度OCR
百度OCR是百度AI人工智能服务平台的一部分,提供文字识别等场景化能力。要使用百度OCR的相关接口,需要在百度云上注册账号并完成实名认证。注册完成后,登录百度AI控制台,点击“文字识别”领取免费资源,并创建应用以获取APPKey和Secret Key,这两个值将在Uipath中使用。
二、获取Access Token
百度AIP开放平台使用OAuth2.0授权调用开放API,调用API时必须在URL中带上access_token参数。因此,在使用API前,需要先调用GetToken接口获取Token。
API地址:请求方式:POST输入参数:包括grant_type(固定值client_credentials)、client_id(APPKey)、client_secret(SecretKey)。返回参数:成功获取Token后,将返回access_token、expires_in等参数,其中access_token是后续调用API时需要的。三、增值税发票识别API
百度OCR提供增值税发票识别API,支持对增值税普票、专票、全电发票、卷票、区块链发票的所有字段进行结构化识别。
API地址:请求方式:POST输入参数:包括access_token、image(发票图片的Base64编码)。返回参数:识别成功后,将返回发票的详细信息,如发票代码、发票号码、开票日期、购销方信息等。四、Uipath发票识别开发
下载依赖包:Uipath请求第三方API需要使用Http request活动,因此需要下载Uipath.WebApi.Activities依赖包。
创建Token流程文件:负责与百度AI服务消息通信的公共模块。在该流程中,使用Http request活动调用GetToken接口获取access_token,并将其存储在变量中供后续使用。
创建Invoice发票识别流程文件:进行封装,接受PDF文件地址作为输入,返回Invoice发票信息。在该流程中,首先读取PDF文件并将其转换为图片格式(如PNG或JPG),然后对图片进行Base64编码。接着,使用Http request活动调用增值税发票识别API,将编码后的图片和access_token作为输入参数。最后,解析API返回的JSON数据,提取发票信息。
创建InvoicePDF文件处理流程:调用发票识别公共模块,读取字典配置的PDF文件夹,通过For Each遍历对每个PDF文件进行解析提取。在该流程中,首先读取PDF文件夹路径,然后遍历文件夹中的每个PDF文件。对于每个文件,调用Invoice发票识别流程文件获取发票信息,并将信息存储在变量或数据结构中。
将发票信息写入Excel:读取发票模板,创建NewRow对象row,对row赋值后,通过添加数据行的活动写入数据表,再使用Append Scope方式写入Excel。在该流程中,首先创建Excel应用程序对象和工作簿对象。然后,根据发票模板创建工作表对象,并设置列名。接着,遍历存储发票信息的变量或数据结构,为每个发票信息创建一行数据(NewRow对象),并将数据赋值给行的各个单元格。最后,将行添加到数据表中,并使用Append Scope活动将数据表写入Excel文件。
五、执行结果
按照上述流程配置并执行Uipath项目后,将能够成功识别PDF文件中的发票信息,并将识别结果写入Excel文件中。执行结果可以通过查看Excel文件来验证。
以下是部分流程图的示例(由于markdown格式限制,无法直接展示完整的流程图,但可以通过以下描述和图片链接理解流程):
Token获取流程图:
发票识别流程图:
发票信息写入Excel流程图:
通过上述流程,Uipath能够高效地利用百度OCR进行发票识别,并将识别结果写入Excel文件中,为企业的财务管理和数据分析提供有力支持。
关于baidu-aip的内容到此结束,希望对大家有所帮助。