浏览器自动化在 Web 抓取、自动化测试和 Web 应用程序交互等领域发挥着重要作用。到目前为止,例如,Puppeteer已用于此目的。随着人工智能的出现,新的机会正在出现,使浏览器自动化更加直观,维护成本更低——为Stagehand扫清了舞台。
为了弄清楚它是如何工作的,我们想要通过相应的 Web 界面关闭/打开我的(蹩脚的)Vodafone 有线电视盒第二个路由器的前 LED 灯(除了其他重要功能外,它不提供直接的 API)。首先我们在命令行中安装这两个工具(假设节点\(\geq\) 23):
53e4085b029089ec48bd0f5b954a6b50
最后,我们将 Vodafone 密码和 OpenAI API 密钥存储在 .env 文件中:
53e4085b029089ec48bd0f5b954a6b50
以Puppeteer为例,你想要的可以实现如下:
53e4085b029089ec48bd0f5b954a6b50
另一方面,舞台工作人员接受以自然语言编写的命令:
53e4085b029089ec48bd0f5b954a6b50
无论您是想抓取网站、自动填写表单还是为您的网络应用程序运行测试 - 远程浏览器控制都会有所帮助。将人工智能集成到浏览器远程控制中,可以通过简单的指令执行复杂的任务,从而加快开发速度并使维护变得更加容易。特别是当 DOM 结构发生变化时,舞台脚本可以更加健壮并且维护成本更低。