Суббота, 11 января 2025 года
Выбор редакции

Иркутские филологи создают вместе с IT-специалистами электронное собрание текстов звучащей речи

Филологи Иркутского государственного университета проводят единственное в своём роде исследование. Они пытаются оцифровать разговорную речь для создания новой русской грамматики.

Иркутские языковеды пытаются перенести звуки на бумагу

Проект иркутских лингвистов носит название «Устный корпус как инструмент лингвистических и междисциплинарных исследований». Под «корпусом» подразумевается коллекция устных текстов, сохранённая в электронном виде.

Современные филологи видят проблему в том, что классическая грамматика составлена на литературном письменном языке, в то время как устная речь открывает более широкие горизонты для изучения языка.

ЧИТАЙТЕ ТАКЖЕ: Российские ученые решили, как усовершенствовать литий-ионную батарею

Зачем нужна была оцифровка устной речи

На сегодняшний день при помощи инновационных технологий и утилит для анализа акустических звуков учёные имеют возможность практически разложить устную речь «на атомы» и представить её перед взором человека.

Филологам доводится видеть все прерывания, тоны, отмечать паузы и оценивать все существенные особенности речи.

ЧИТАЙТЕ ТАКЖЕ: Ученые рассказали, какую опасность представляет чай для здоровья человека

Что преследует данное исследование

Описание специфических характеристик устной речи способствует коренному развязыванию проблемы современной лингвистической науки.

В данном случае предполагается создание новой самобытной грамматики русского языка.

Филологи ставят перед собой ещё одну фундаментальную задачу. Изученный материал позволит языковедам дать оценку возможности выживания диалектов как разновидностей национального языка.

Материалом для электронного создания текстов устной речи служат две группы аудиотекстов:

  • к первой относятся аудиозаписи глубинных интервью 2011 года;
  • вторая группа включает в себя тексты устной речи жителей Баргузинского района в Бурятии от 2012 года.

Готовы ли современные технологии к созданию «устного корпуса»

Для изучения всего материала нужно два обязательных условия: придать тексту письменный вид, приспособить текст для работы с искусственным интеллектом. Если с первым условием трудностей не возникает, то над вторым нужно проделать объемную работу.

Так, для работы с текстом необходима специальная транскрипция — система записи устной речи, которая наиболее точно передаст все особенности речи.

К сожалению, подобных технологий в 2021 году ещё нет. Поэтому на первом этапе лингвистам предстоит создать предельно приспособляемую и понятную систему записи текстов. Это даст возможность произвести разметку текста (аннотирование). Аннотирование заключается в отображении в текстах специальных внешних и лингвистических меток.

ЧИТАЙТЕ ТАКЖЕ: Ученые выяснили, как меняется размер сердца космонавта после длительного пребывания в космосе

Основная задача лингвистов состоит в том, чтобы запрограммировать компьютер на распознавание особенностей устной речи (паузы, заикание, смех) в виде специальных меток.


Новости партнеров