Национальный корпус русского языка как источниковая база социо-гуманитарных исследований
Корниенко А.В.
Национальный корпус русского языка как источниковая база социо-гуманитарных исследований // Петербургская социология сегодня. 2023. № 21. С. 58-71.
ISSN 2308-3166
DOI: 10.25990/socinstras.pss-21.8sqp-bb68
EDN: DGOEFK
РИНЦ: https://elibrary.ru/item.asp?id=55823513
Размещена на сайте: 07.01.23
Текст статьи на сайте журнала URL: https://pitersociology.ru/ru/node/905 (дата обращения 07.01.2024)
Ссылка при цитировании:
Kornienko A.V. The national corpus of the Russian language as a source base for social and humanitarian research. St. Petersburg Sociology Today. 2023. No. 21. P. 58-71. DOI: 10.25990/socinstras.pss-21.8sqp-bb68 DOI: 10.25990/socinstras.pss-21.8sqp-bb68.
Аннотация
Название статьи непосредственно отражает ее целевую установку: представить действующий и размещенный в интернете Национальный корпус русского языка (НКРЯ, Корпус) как информационную базу для исследований социогуманитарного профиля. В настоящее время Корпус имеет объем свыше двух миллиардов словоупотреблений и являет собой информационно-справочную систему, основанную на собрании русскоязычных текстов, созданных с начала XVIII в. по 2010 г., репрезентирующих русский язык в указанных временных границах. НКРЯ отражает все многообразие жанров, стилей, социальных и территориальных вариантов нашего языка, охватывая художественную и научную литературу, эссеистику, публицистику, публичные выступления и пр. Наиболее полно и разнообразно в Корпусе представлены тексты второй половины ХХ — начала ХХI в. В статье выделены два основных направления современных научных изысканий, использующих НКРЯ и как источник эмпирической информации, и одновременно как инструмент исследования. Первое имеет отчетливую лингвистическую ориентацию и связано с обращением к Корпусу при обучении русскому и иностранным языкам, в анализе диалектов и социолектов, при погружении в область теории и практики языкового перевода. Корпус также дает возможность отслеживать на протяжении определенного периода времени изменения языковой нормы и другие языковые параметры. Второе направление образуют исследования четко социального профиля, сопряженные с диагностикой общественного сознания и его трансформациями. С помощью НКРЯ, его огромных, в тысячах и десятках тысяч единиц анализа, массивов данных, снабженных необходимой статистикой, надежно верифицируются выводы, полученные в социологических опросах, дискурсных изысканиях, ассоциативных экспериментах, выполненных на достаточно ограниченных выборках. Неоспоримую ценность имеют и автономные обращения к Корпусу, дающие важнейшую информацию об отношении носителей русской лингвокультуры к различным социальным институтам, процессам, явлениям и субъектам. В статье приводятся примеры подобных исследований, сопряженных с целым рядом ключевых политических концептов, таких как чиновники, правоохранительные органы, коррупция, политики, элита и соотечественники.