Statistische Eigenschaften türkischer Wörter

Lieferzeit: Lieferbar innerhalb 14 Tagen

59,00 

Zeitgenössische gedruckte türkische Wortmerkmale und Glättungstechniken

ISBN: 6203335215
ISBN 13: 9786203335217
Autor: DALKILIÇ, GÖKHAN
Verlag: Verlag Unser Wissen
Umfang: 140 S.
Erscheinungsdatum: 04.10.2022
Auflage: 1/2022
Format: 0.9 x 22 x 15
Gewicht: 227 g
Produktform: Kartoniert
Einband: Kartoniert
Artikelnummer: 7181607 Kategorie:

Beschreibung

Für die Spracherkennung, OCR usw. ist die Bestimmung der strukturellen Eigenschaften einer natürlichen Sprache wesentlich. Diese Eigenschaften können in zwei verschiedenen Kategorien analysiert werden. morphologische und statistische Analyse. Für die statistische Analyse wird ein Korpus benötigt, der eine repräsentative Stichprobe der natürlichen Sprache darstellt. Wort-n-Gramm-Frequenzen dieses Korpus können unter Verwendung geeigneter Algorithmen bestimmt werden, und fehlende n-Gramm können unter Verwendung von Glättungstechniken geschätzt werden. In dieser Studie wurde ein Korpus namens TurCo erstellt, um Glättungstechniken auf Türkisch zu vergleichen und anzuwenden. Um das Wort n-Gramm zu berechnen, wurden verschiedene Algorithmen getestet. Nachdem n-Gramm-Wortlisten gefunden worden waren, wurden ihre Eigenschaften analysiert. Zur Verallgemeinerung wurde das Zipf-Gesetz angewendet, und um die Genauigkeit des Zipf-Gesetzes zu erhöhen, wurde das Mandelbrot-Gesetz angewendet, indem die geeigneten Konstanten von Mandelbrot gefunden wurden. Da der Korpus nicht groß genug sein konnte, um die gesamte Sprache darzustellen, wurden Glättungstechniken verwendet, um das unsichtbare Wort n-Gramm zu schätzen. Diese Studie kann Fachleuten helfen, die an Spracherkennung, Kryptoanalyse und Autorenerkennung auf Türkisch arbeiten.

Autorenporträt

Feristah Örücü: Ze had de B.S. en M.S. graden in Comp Eng van DEU, Turkije. Ze heeft een Ph.D. student en een Res Asst of Dept of Comp Eng van DEU. Gökhan Dalkiliç: Hij had M.S. graden in Comp Sci van USC, en van Ege Univ CI, Ph.D. graad in Comp Eng van DEU. Hij was een assistent-professor van de afdeling Comp Eng van DEU.

Herstellerkennzeichnung:


OmniScriptum SRL
Str. Armeneasca 28/1, office 1
2012 Chisinau
MD

E-Mail: info@omniscriptum.com

Das könnte Ihnen auch gefallen …