Beschreibung
Das World Wide Web ist eine enorme Zusammenstellung von Daten mit mehreren Varianten. Für ein besseres Wissensmanagement ist es wichtig, genaue und vollständige Daten abzurufen. Das versteckte Web, auch als unsichtbares Web oder Deep Web bekannt, hat zu einer neuen Ausgabe der Web-Mining-Forschung geführt. Die meisten Dokumente im versteckten Web, einschließlich Seiten, die hinter Suchformularen, speziellen Datenbanken und dynamisch generierten Webseiten versteckt sind, sind für allgemeine Web Mining-Anwendungen nicht zugänglich. In diesem Artikel wird ein System entwickelt, das mithilfe von Web Structure Mining-Techniken für ein besseres Wissensmanagement robust auf diese verborgenen Webseiten zugreifen kann. Da die dynamische Generierung von Inhalten in modernen Webseiten verwendet wird und Benutzerformulare verwendet werden, um Informationen von einem bestimmten Benutzer abzurufen und in einer Datenbank zu speichern. Auf die in diesen Formen liegende Verbindungsstruktur kann während herkömmlicher Miningverfahren nicht zugegriffen werden. Das Genauigkeitsverhältnis von hierarchischen Webseitenstrukturen kann verbessert werden, indem diese versteckten Webseiten in den Prozess des Webstruktur-Mining einbezogen werden. Das entworfene System ist ausreichend stark, um die dynamischen Webseiten zusammen mit den statischen zu verarbeiten.
Autorenporträt
M. Asif Naeem hat an der University of Auckland, Neuseeland, promoviert. 2006 machte er seinen MS an der Universität für Informationstechnologie und Managementwissenschaften in Belutschistan, Pakistan. Seine Forschungsinteressen umfassen Online-Stream-Verarbeitung, Datenmanagement und -integration, Business Intelligence und Web Mining.
Herstellerkennzeichnung:
BoD - Books on Demand
In de Tarpen 42
22848 Norderstedt
DE
E-Mail: info@bod.de




































































































