Автоматизация браузера играет большую роль в таких областях, как парсинг веб-страниц, автоматическое тестирование и взаимодействие с веб-приложениями. До сих пор, например , для этой цели использовался Puppeteer . С появлением искусственного интеллекта открываются новые возможности, позволяющие сделать автоматизацию браузера более интуитивно понятной и менее трудоемкой в обслуживании — расчистив почву для Stagehand .
Чтобы прояснить, как это работает, мы хотим выключить/включить передние светодиодные индикаторы моего (паршивого) второго маршрутизатора кабельной приставки Vodafone, который, помимо других важных функций, не предлагает прямого API, через соответствующий веб-интерфейс. Сначала мы устанавливаем оба инструмента в командной строке (предполагается Node \(\geq\) 23):
53e4085b029089ec48bd0f5b954a6b50
Наконец, мы сохраняем наш пароль Vodafone и наш ключ API OpenAI в файле .env.:
53e4085b029089ec48bd0f5b954a6b50
Например, с помощью Puppeteer то, что вы хотите, может быть достигнуто следующим образом::
53e4085b029089ec48bd0f5b954a6b50
Рабочий сцены, напротив, принимает команды, написанные на естественном языке.:
53e4085b029089ec48bd0f5b954a6b50
Хотите ли вы парсить веб-сайты, автоматически заполнять формы или запускать тесты для своего веб-приложения — вам поможет удаленное управление браузером. Интеграция искусственного интеллекта в удаленное управление через браузер позволяет выполнять сложные задачи с помощью простых инструкций, ускоряя разработку и упрощая обслуживание. В частности, при изменении структуры DOM сценарии рабочих сцены могут стать более надежными и менее требовательными к обслуживанию.