Правила формирования Национального корпуса казахского языка разработали в РК

Фото: pixabay
Министерство науки и высшего образования разработало Правила формирования и ведения Национального корпуса казахского языка, сообщает Zakon.kz.

Национальный корпус казахского языка – информационно-справочная система, содержащая тексты во всех стилях и жанрах казахского языка, оснащенная системой поиска и другими средствами работы с текстом.

Правила устанавливают общие требования и процедуры для создания, пополнения, обработки, хранения и использования Национального корпуса казахского языка, который служит основой для научных, образовательных и практических исследований в области казахского языка и лингвистики.

Администратор Корпуса – Министерство науки и высшего образования РК. Работу по координации Корпуса ведет Институт языкознания имени А. Байтурсынова.

Формирование Корпуса начинается с тщательного сбора и отбора текстов, представляющих все аспекты его функционирования, – от письменных источников до устных материалов, которые отражают особенности языка, используемый в различных сферах и временных срезах.

Все материалы Корпуса должны соответствовать научным стандартам качества, имеют метаданные и источниковедческую информацию, проходят проверку на грамматические и орфографические ошибки, а также редактируются и упорядочиваются в соответствии с единой системой кодирования и классификации.

Корпус отражает разнообразие языковых практик, включая различные жанры, типы текстов, диалекты и стили, а также учитывает региональные и исторические особенности.

Все собранные тексты систематизируются и аннотируются по жанру, стилю, времени, источнику, по лексическим и грамматическим уровням.

Функции Корпуса:

  1. Метаразметка предоставляет информацию, которая подробно описывает текст и его характеристики, включая автора, название, жанр, источник, дату создания, целевую аудиторию, стиль, размер, формат, структурные особенности.
  2. Цифровая структура Корпуса обеспечивает систематизацию текстов в цифровом формате, что позволяет использовать современные инструменты автоматизированного анализа.
  3. Многофункциональность Корпуса позволяет использовать его в различных областях, включая лингвистические исследования, лексикографию, обучение языкам, компьютерную лингвистику и нейролингвистическое программирование.
  4. Прикладные задачи Корпуса позволяют автоматизировать обработку текстов, улучшать качество языковых моделей, разрабатывать эффективные инструменты для анализа текста, создания приложений для обучения языкам, машинного перевода и разработки искусственного интеллекта.

Структура Корпуса:

Как пояснили в МНВО, корпус будет непрерывно обновляться за счет добавления новых материалов, отражающих изменения в языке и актуальные достижения в различных областях, также расширяется с учётом изменений в языке, новых тенденций, а также появления новых жанров, стилей и направлений, что гарантирует его актуальность и соответствие языковым инновациям.

Ожидается, что Корпус будет общедоступным и будет служить основой для разработки лексикографических и грамматических проектов, научных и образовательных материалов, а также для создания программных продуктов.

Документ размещен на сайте "Открытые НПА" для публичного обсуждения до 28 марта.

Ранее мы рассказали, что в Казахстане разработают профессиональный стандарт в области языковой политики.

Открытые НПА
Министерство науки и высшего образования РК
Казахстан
Казахский язык
2025 год

Читайте также

Следите за новостями zakon.kz в:

Популярные новости

Нацбанк Казахстана выступил с важным заявлением по курсу тенге

Символ Огненной Лошади: что ждать от 2026 года и кому повезет

Жителям Алматы обещают долгожданный снег

"Кроме первого и последнего": какой этаж лучше выбрать при покупке квартиры – советы риелтора

Инженеры показали, каким будет самый глубокий в мире автомобильный тоннель