QORAQALPOQ VA O‘ZBEK TILLARINING SINTAKTIK MODELLARINI TEGLASH MASALASI
Ключевые слова:
Teglash, sintaktik birlik, so‘z birikmalari,Universal Dependencies (UD)Аннотация
В данной статье рассматривается система Universal Dependencies (UD) и её применение в узбекском и каракалпакском языках. Анализируется процесс аннотирования (теггирования) и его значение в области обработки естественного языка (NLP), особенно в таких этапах, как токенизация, лемматизация и стемминг. Описано, как система UD используется для определения частей речи, морфологических и синтаксических характеристик, в том числе при аннотировании словосочетаний в узбекском языке.
Библиографические ссылки
1. Ch, Taguchi. Consistent Grammatical Annotation of Turkic Languages for more Universal Dependencies.
2. Abduraxmonova N. Mashina tarjimasining lingvistik asoslari. – T., 2012.
3. Mengliev, D., Barakhnin, V., & Abdurakhmonova, N. (2021). Development of intellectual web system for morph analyzing of uzbek words. Applied Sciences, 11(19), 9117.
4. Abdurakhmonova, N. (2019). Dependency parsing based on Uzbek Corpus. In of the International Conference on Language Technologies for All (LT4All).
5. Alkım.E, Çebi. Y. Machine Translation Infrastructure for Turkic Languages (MT-Turk).–Turkiya-2019.
6. Benita Pungwe Mpala. THE USE OF ADVANCED TECHNOLOGY TO FIND SOLUTIONS FOR HUMANITARIAN ISSUES.–San Fransisko, 2020. P–20.
7. Brown,P.F., Cocke, J., Della Pietra, S.A., Mercer, R. L. The Mathematics of Statistical Machine Translation:Parameter Estimation. Computational linguistics, 19(2),–P.263-311.