Управляйте браузерами с помощью ИИ

Автоматизация браузера играет большую роль в таких областях, как парсинг веб-страниц, автоматическое тестирование и взаимодействие с веб-приложениями. До сих пор, например , для этой цели использовался Puppeteer . С появлением искусственного интеллекта открываются новые возможности, позволяющие сделать автоматизацию браузера более интуитивно понятной и менее трудоемкой в обслуживании — расчистив почву для Stagehand .


Чтобы прояснить, как это работает, мы хотим выключить/включить передние светодиодные индикаторы моего (паршивого) второго маршрутизатора кабельной приставки Vodafone, который, помимо других важных функций, не предлагает прямого API, через соответствующий веб-интерфейс. Сначала мы устанавливаем оба инструмента в командной строке (предполагается Node \(\geq\) 23):

53e4085b029089ec48bd0f5b954a6b50

Наконец, мы сохраняем наш пароль Vodafone и наш ключ API OpenAI в файле .env.:

53e4085b029089ec48bd0f5b954a6b50

Например, с помощью Puppeteer то, что вы хотите, может быть достигнуто следующим образом::

53e4085b029089ec48bd0f5b954a6b50

Рабочий сцены, напротив, принимает команды, написанные на естественном языке.:

53e4085b029089ec48bd0f5b954a6b50

Хотите ли вы парсить веб-сайты, автоматически заполнять формы или запускать тесты для своего веб-приложения — вам поможет удаленное управление браузером. Интеграция искусственного интеллекта в удаленное управление через браузер позволяет выполнять сложные задачи с помощью простых инструкций, ускоряя разработку и упрощая обслуживание. В частности, при изменении структуры DOM сценарии рабочих сцены могут стать более надежными и менее требовательными к обслуживанию.

Назад