QARAQALPAQ HÁM TÚRK TILLERINIŃ PARALLEL KORPUSÍN JARATÍW MÁSELESI
Ключевые слова:
Лингвистический корпус, корпус, параллельный корпус, согласование текстов, токенизация, стемматизация, Lingtrain Alignment studio, Humaling, Abbyy Aligner, Trados, Winaling, Wordfast tools, Giza++, AntConc.Аннотация
В данной статье речь пойдет о задачах, которые необходимо выполнить при создании параллельного корпуса Каракалпакского и тypeцкого языков. В статье даны сведения о подготовке текстов, формировании из комплекса готовых текстов, этапах согласования в них абзаца, предложения, слова и словосочетания, методах, программах.
Библиографические ссылки
1. Abduraxmonova N. O`zbek tili elektron korpusining kompyuter modellari (monografiya) /Toshkent: Muharrir, 2021, B – 202.
2. Abjalova M. Korpus lingvistikasi (uslubiy qollanma)/ Toshkent: Bookmany Print, 2022, B –103.
3. Захаров В., Богданова С. Корпусная лингвистика: учебник. 3-е изд., перераб. – СПб.: Изд-во С.-Петерб. ун-та, 2020, С – 61.
4. Зубов А. В., Зубова И. И. Информационные технологии в лингвистике: учеб. пос. М.: Издательский центр «Академия», 2004, С – 208.