Web Browser

tensorflowsmolagents_dochf-notebookszh
[ ]

使用Agent实现网页浏览器自动化 🤖🌐

在本notebook中,我们将创建一个基于Agent的网页浏览器自动化系统!该系统可以自动导航网站、与网页元素交互并提取信息。

该Agent将能够:

  • 导航到网页
  • 点击元素
  • 在页面内搜索
  • 处理弹出窗口和模态框
  • 提取信息

让我们一步步搭建这个系统!

首先运行以下命令安装所需依赖:

pip install smolagents selenium helium pillow -q

让我们导入所需的库并设置环境变量:

[ ]

现在我们来创建核心的浏览器交互工具,使我们的Agent能够导航并与网页交互:

[ ]

让我们配置使用Chrome浏览器并设置截图功能:

[ ]

现在我们来创建网页自动化Agent:

[ ]

Agent需要获得关于如何使用Helium进行网页自动化的指导。以下是我们将提供的操作说明:

[ ]

现在我们可以运行Agent执行任务了!让我们尝试在维基百科上查找信息:

[ ]

您可以通过修改请求参数执行不同任务。例如,以下请求可帮助我判断是否需要更加努力工作:

[ ]

该系统在以下任务中尤为有效:

  • 从网站提取数据
  • 网页研究自动化
  • 用户界面测试与验证
  • 内容监控