Was ist der NovaAct?
Der NovaAct ist ein Web-Crawler, der von dem Unternehmen Nova AI betrieben wird. Seine primäre Aufgabe besteht darin, öffentlich zugängliche Inhalte von Webseiten zu durchsuchen und zu sammeln. Die so gewonnenen Daten werden anschließend genutzt, um die KI-Modelle von Nova AI zu trainieren und weiterzuentwickeln. Laut dem Betreiber werden diese Daten auch für Forschungszwecke eingesetzt, um das Verständnis und die Fähigkeiten von künstlicher Intelligenz zu erweitern.
Arbeitsweise
Wie andere gängige Crawler navigiert der NovaAct-Bot durch das Internet, indem er Hyperlinks von einer Seite zur nächsten folgt. Er lädt dabei die Inhalte der besuchten Seiten herunter, um sie für die spätere Analyse und das KI-Training zu speichern. Der Bot identifiziert sich in den Server-Logs eindeutig über seinen User-Agent, der die Zeichenkette „NovaAct“ enthält. Das Unternehmen gibt an, dass der Bot die Standard-Regeln der robots.txt-Datei respektiert, sodass Webseitenbetreiber die Möglichkeit haben, den Zugriff des Crawlers zu steuern oder komplett zu unterbinden.
