PARATRANSLATOR – PARALLEL KORPUSGA ASOSLANGAN ELEKTRON KONTEKSTOLOGIK TARJIMA LUG‘AT PLATFORMASINI YARATISHNING AYRIM MASALALARI XUSUSIDA
Ключевые слова:
параллельный корпус, альтернативы перевода, процесс сегментации, память переводаАннотация
В данной тезис анализируются лингвистические вопросы создания электронной переводческой словарной платформы на основе параллельного корпуса, реализованной в рамках прикладного проекта. Согласно этому, создание параллельного корпуса является сложным технологическим этапом, который включает в себя длительный процесс. В частности, при создании многоязычного параллельного корпуса подчеркивается специфичность естественного языка к литературным типам и стилям, внутренние возможности языка, а также необходимость большой базы данных для автоматической обработки различий между языком и его языковыми и речевыми явлениями.
Библиографические ссылки
1. J. Tiedemann. Parallel Data, Tools and Interfaces in OPUS. Proceedings of the Eighth International Conference on Language Resources and Evaluation (LREC 2012). European Language Resources Association (ELRA).
2. P.Koehn. Europarl: A Parallel Corpus for Statistical Machine Translation. Proceedings of the 10th Machine Translation Summit, 2005. –P.79-86.
3. P.Koehn. Statistical Machine Translation. Cambridge University Press. 2010. – p.487
4. B.Zoph, K.Knighk. Multi-Source Neural Machine Translation. Proceedings of the NAACL-HLT 2016, –P.122-132.
5. Abduraxmonova N. Korpus lingvistikasi (darslik). – Germaniya: Globeedit 2023. –B.357.
6. Agostini, A., Usmanov, T., Khamdamov, U., Abdurakhmonova, N., & Mamasaidov, M. (2021, January). Uzwordnet: A lexical-semantic database for the uzbek language. In Proceedings of the 11th Global Wordnet conference (pp. 8-19).
7. Agostini, A., Usmanov, T., Khamdamov, U., Abdurakhmonova, N., & Mamasaidov, M. (2021, January). Uzwordnet: A lexical-semantic database for the uzbek language. In Proceedings of the 11th Global Wordnet conference (pp. 8-19).