Population der Daten im Schema der extrahierten Webtabelle

Lieferzeit: Lieferbar innerhalb 14 Tagen

35,90 

ISBN: 6207667549
ISBN 13: 9786207667543
Autor: Shaukat, Kamran/Masood, Nayyer/Fatima Haider, Sundas Mehreen
Verlag: Verlag Unser Wissen
Umfang: 56 S.
Erscheinungsdatum: 16.06.2024
Auflage: 1/2024
Format: 0.4 x 22 x 15
Gewicht: 102 g
Produktform: Kartoniert
Einband: Kartoniert
Artikelnummer: 3889887 Kategorie:

Beschreibung

Tabellarische Daten sind eine bestehende Informationsquelle im Internet. Wir haben mit der Sammlung von HTML-Tabellen aus dem Internet begonnen. Zunächst werden Tabellen guter Qualität identifiziert, dann wird ein Schema-Matching durchgeführt. Beim Schema-Matching wird die Anzahl der Übereinstimmungen ermittelt, die die ähnlichen Elemente aus zwei verschiedenen Schemata bestimmen. Die Spalten und Datenwerte werden nacheinander verglichen, um das Schema abzugleichen. Bei der Suche nach tabellarischen Daten im Web kann die Suchmaschine eine URL anstelle von tabellarischen Daten zurückgeben, was das Hauptproblem ist. Wir arbeiten also an diesem Problem, indem wir Daten von tabellarischen Webseiten extrahieren und ihr Schema extrahieren und dann einen Schemaabgleich durchführen, indem wir die Korrespondenz ähnlicher Elemente durch korpusbasierte Technik identifizieren. Nach dem Schemaabgleich füllten wir die Daten der HTML-Seiten auf, indem wir verwandte Tabellen in einer HTML-Tabelle zusammenfügten, die für die Benutzer besser geeignet und hilfreich ist.

Herstellerkennzeichnung:


BoD - Books on Demand
In de Tarpen 42
22848 Norderstedt
DE

E-Mail: info@bod.de

Das könnte Ihnen auch gefallen …