JAHON TILSHUNOSLIGIDA OMONIMLARNING KORPUSGA ASOSLANGAN LUG‘AT BAZASINI YARATISH MASALASI
Ключевые слова:
корпусная лингвистика, омоним, семантическое различие, лексическая база, искусственный интеллект, дисамбигуация значений, коллокации, WordNet, COCA, BNC, DeReKoАннотация
В статье рассматривается проблема создания автоматизированных лексикографических баз данных омонимов на основе корпусной лингвистики в мировой лингвистике. Освещаются методы выявления омонимов, их контекстного различения и семантической классификации с использованием современных подходов компьютерной лингвистики, искусственного интеллекта и машинного обучения. На основе опыта Великобритании, США, Германии, России и Китая анализируется реальное употребление, частотность и грамматические особенности омонимов с использованием корпусных моделей. Результаты исследования имеют важное практическое значение для лексикографии, перевода, НЛП, преподавания языков и автоматического семантического анализа.
Библиографические ссылки
1. Abduraxmonova N. O‘zbek tili elektron korpusining kompyuter modellari (monografiya)./ Toshkent: Muharrir, 2021
2. Mirsaid, A., Bibigul, R., Altinbay, S., & Nilufar, A. (2018). Ontology of grammar rules as example of Noun the Uzbek language and Kazakh languages VI international scientific conference" Modern problems of the applied mathematics and information technology. Al Khorezmiy-2018.
3. Mengliev, D., Barakhnin, V., & Abdurakhmonova, N. (2021). Development of intellectual web system for morph analyzing of uzbek words. Applied Sciences, 11(19), 9117.
4. Abdurakhmonova, N., Tuliyev, U., Ismailov, A., & Abduvahobo, G. (2022). UZBEK ELECTRONIC CORPUS AS A TOOL FOR LINGUISTIC ANALYSIS. In Компьютерная обработка тюркских языков. TURKLANG 2022 (pp. 231-240).
5. Biber, D., Conrad, S., & Reppen, R. (1998). Corpus Linguistics: Investigating Language Structure and Use. Cambridge University Press.
6. Fellbaum, C. (1998). WordNet: An Electronic Lexical Database. MIT Press.
7. Kilgarriff, A., & Grefenstette, G. (2003). Introduction to the Special Issue on the Web as Corpus. Computational Linguistics, 29(3), 333–347.
8. Navigli, R. (2009). Word Sense Disambiguation: A Survey. ACM Computing Surveys, 41(2), 1–69.
9. N. Z. Abduraxmonova. “Kompyuter lingvistikasi” Darslik. Toshkent – 2021
10. Sharoff, S. (2006). Creating general-purpose corpora using automated search engine queries. In Proceedings of the 5th International Conference on Language Resources and Evaluation (LREC).