Web自动化功能
TestGPT 基于 Playwright 和 Browser Use 提供强大的 Web 自动化功能。
🎯 核心特性
智能元素识别
- 自然语言描述: 使用自然语言描述页面元素
- 多种定位方式: 支持文本、标签、位置等多种定位方式
- 智能匹配: 自动匹配最合适的元素
浏览器支持
- Chromium: 默认浏览器,功能最完整
- Firefox: 支持 Firefox 浏览器
- WebKit: 支持 Safari 内核
操作类型
- 点击操作: 点击按钮、链接、输入框等
- 输入操作: 输入文本、选择选项
- 验证操作: 验证元素存在、文本内容
- 等待操作: 等待元素出现、页面加载
📝 操作语法
基本操作
# 页面导航
打开 https://example.com
访问 https://example.com
# 点击操作
点击 "登录" 按钮
点击标签为 "提交" 的按钮
# 输入操作
输入 "用户名" 到用户名输入框
输入 "密码" 到密码输入框
# 验证操作
验证页面包含 "登录成功"
验证 "用户信息" 元素可见
高级操作
# 等待操作
等待 5 秒
等待 "加载完成" 元素出现
# 滚动操作
滚动到页面底部
滚动到 "查看更多" 按钮
# 键盘操作
按回车键
按 Tab 键
🔧 配置选项
浏览器配置
浏览器类型: Chromium
无头模式: false
视窗大小: 1920x1080
用户代理: 自定义用户代理
执行配置
超时时间: 30秒
等待时间: 2秒
重试次数: 3
截图设置: 每个步骤
📚 最佳实践
元素描述
- 使用描述性文本: 使用清晰的描述
- 避免模糊描述: 避免使用模糊的描述
- 考虑页面变化: 考虑页面可能的变化
等待策略
- 合理设置等待时间: 根据页面加载时间设置
- 使用智能等待: 等待元素出现而不是固定时间
- 处理动态内容: 处理动态加载的内容