QARAQALPAQ HÁM TÚRK TILLERINIŃ PARALLEL KORPUSÍN JARATÍW MÁSELESI

Авторы

  • Ótemisov Aziz Zarlıqbaevich Автор
  • Sharbaev Jaras Bayrambay ulı Автор

Ключевые слова:

Лингвистический корпус, корпус, параллельный корпус, согласование текстов, токенизация, стемматизация, Lingtrain Alignment studio, Humaling, Abbyy Aligner, Trados, Winaling, Wordfast tools, Giza++, AntConc.

Аннотация

В данной статье речь пойдет о задачах, которые необходимо выполнить при создании параллельного корпуса Каракалпакского и тypeцкого языков. В статье даны сведения о подготовке текстов, формировании из комплекса готовых текстов, этапах согласования в них абзаца, предложения, слова и словосочетания, методах, программах.

Библиографические ссылки

1. Abduraxmonova N. O`zbek tili elektron korpusining kompyuter modellari (monografiya) /Toshkent: Muharrir, 2021, B – 202.

2. Abjalova M. Korpus lingvistikasi (uslubiy qollanma)/ Toshkent: Bookmany Print, 2022, B –103.

3. Захаров В., Богданова С. Корпусная лингвистика: учебник. 3-е изд., перераб. – СПб.: Изд-во С.-Петерб. ун-та, 2020, С – 61.

4. Зубов А. В., Зубова И. И. Информационные технологии в лингвистике: учеб. пос. М.: Издательский центр «Академия», 2004, С – 208.

5. https://habr.com/ru/articles/575898/

Опубликован

2025-08-04

Похожие статьи

1-10 из 103

Вы также можете начать расширеннвй поиск похожих статей для этой статьи.