Beschreibung
Die Vorbereitung eines Datensatzes für die Analyse ist in der Regel die zeitaufwändigste Aufgabe in einem Data-Mining-Projekt. Sie erfordert viele komplexe SQL-Abfragen, das Verbinden von Tabellen und das Aggregieren von Spalten. Im Allgemeinen ist ein erheblicher manueller Aufwand erforderlich, um Datensätze zu erstellen, für die ein horizontales Layout erforderlich ist. Hier werden einfache, aber leistungsfähige Methoden zur Generierung von SQL-Code vorgestellt, der aggregierte Spalten in einem horizontalen Tabellenlayout zurückgibt, wobei eine Reihe von Zahlen anstelle einer Zahl pro Zeile zurückgegeben wird. Diese neue Klasse von Funktionen wird als horizontale Aggregationen bezeichnet. Eine Aggregationsfunktion mit einer Gruppierungstechnik gibt Abfrageoptimierern die Möglichkeit, verschiedene Abfrageauswertungspläne zu erstellen. Bei Abfragen mit einer nicht-distributiven Aggregationsfunktion kann die Auswertung erst durchgeführt werden, wenn die gesamte Eingabe konstruiert ist. Dadurch verzögert sich die gesamte Berechnung. Aggregationsfunktionen dieser Art werden als holistische Aggregationsfunktionen bezeichnet. Um die Auswertungsleistung einer holistischen Aggregationsfunktion zu verbessern, kann ein Ansatz namens partielle Aggregation verwendet werden. Die partielle Aggregation führt Berechnungen inkrementell durch und erhöht die Geschwindigkeit der Berechnung.
Autorenporträt
Rexie J A M hat einen B.E.- und M.E.-Abschluss in CSE und promoviert in CSE. Sie arbeitet als Assistenzprofessorin in der Abteilung für CSE am Karunya Institute of Technology and Sciences, Coimbatore. Ihre Interessengebiete sind Datenwissenschaft, Analyse von Algorithmen, Datenstrukturen und Rechentheorie.
Herstellerkennzeichnung:
BoD - Books on Demand
In de Tarpen 42
22848 Norderstedt
DE
E-Mail: info@bod.de




































































































