Die Automatisierung von Browsern spielt eine große Rolle in Bereichen wie Web-Scraping, automatisiertem Testen und der Interaktion mit Webanwendungen. Bisher wurde hierfür beispielsweise Puppeteer eingesetzt. Mit dem Aufkommen von KI eröffnen sich nun neue Möglichkeiten, die Browserautomatisierung intuitiver und weniger wartungsintensiv zu gestalten – Bühne frei für Stagehand.
Um die Funktionsweise zu verdeutlichen, wollen wir im Folgenden beispielsweise die Front-LED-Lichter meines (schrottigen) Vodafone-Kabelbox-Zweitrouters – der neben anderen wichtigen Funktionen insbesondere keine direkte API bietet – über das entsprechende Webinterface ab-/anschalten. Zunächst installieren wir dazu beide Tools in der Kommandozeile (Node \(\geq\)23 vorausgesetzt):
53e4085b029089ec48bd0f5b954a6b50
Schließlich hinterlegen wir in einer .env-Datei unser Vodafone-Passwort sowie unseren OpenAI API-Key:
53e4085b029089ec48bd0f5b954a6b50
Mit Puppeteer lässt sich das Gewünschte beispielsweise wie folgt realisieren:
53e4085b029089ec48bd0f5b954a6b50
Stagehand hingegen nimmt in natürlicher Sprache geschriebene Befehle entgegen:
53e4085b029089ec48bd0f5b954a6b50
Egal ob du Webseiten scrapen, automatisch Formulare ausfüllen oder Tests für deine Web-App durchführen willst – Browser-Fernsteuerung hilft. Die Integration von KI in die Browser-Fernsteuerung ermöglicht es, komplexe Aufgaben mit einfachen Anweisungen durchzuführen, was die Entwicklung beschleunigt, und die Wartung erleichtert. Insbesondere wenn sich die DOM-Struktur ändert, können Stagehand-Scripte robuster und weniger wartungsintensiv sein.