Корпус русскоязычной популярной музыки создала А. Панасюк под руководством Д. А. Скоринкина в 2019-2020-м учебном году.
В корпусе два подкорпуса:
— основной (main), по которому Настя делала исследование. Полная тема её работы звучит так: «Создание диахронического корпуса русскоязычной популярной музыки: анализ бытовой лексики». Чтобы выводы исследования были статистически значимыми, Настя выбрала 20 важных для декады исполнителей (1990-1999, 2000-2009, 2010-2019), каждому из которых приписала условную категорию “поп” или “альтернатива”: 10 для одной категории, 10 для другой.
Когда создавался корпус, ещё не вышли книги «Не надо стесняться. История постсоветской поп-музыки в 169 песнях / 1991–2021 /» (Институт музыкальных иницатив), «Песни ни о чем?» (Дарья Журкова. Новое литературное обозрение), на которые могла бы ориентироваться Настя, поэтому исполнителей она выбирала самостоятельяно, изучая музыкальные рейтинги, список которых приведен далее.
В редких случаях песен от исполнителя было меньше 20. Так Настя взяла «Чёрный альбом» группы Кино 1990 года вместе с «Детским альбомом» Поп-механики (1996) за одного исполнителя, пополнив корпус 16 текстами.
Разделение на «поп» и «альтернативу» довольно условное, приводим комментарий с сайта ИМИ к «Не надо стесняться».
Как вы определяли, что является поп-музыкой, а что нет? Почему, например, здесь нет Земфиры и «Мумий Тролля»?
Чтобы подробно ответить на вопрос о том, что такое поп-музыка и чем она отличается от других жанров, потребовалась бы отдельная книга (собственно, такие существуют). Если коротко, это делалось интуитивно.
Противостояние между «роком» и «попсой» было одним из ключевых российских культурных конфликтов вплоть до конца 2000‑х — и два этих музыкальных поля существовали как бы в разных мирах. У «ДДТ» или «Короля и Шута» были хиты не меньшего масштаба, чем у Филиппа Киркорова или «Иванушек», но ставить их всех в один ряд значило бы игнорировать контекст. Это, безусловно, возможный жест — но нам было интереснее не ломать стереотипы, а скорее описать «эстраду» как единую реальность (культурные, иерархические и генетические связи между разными героями книги — один из самых любопытных подспудных сюжетов «Не надо стесняться»). Земфира и «Мумий Тролль» в этом смысле — самые сложные случаи, поскольку это музыканты, которым удалось преодолеть разрывы контекстов и попасть всюду сразу. Но мы все‑таки решили оставить их за скобками — в мире «рока».
Еще сложнее делать этот выбор было в случае песен последних лет, когда интернет разрушил былые культурные границы, а хип-хоп, как казалось в какой‑то момент, полностью подменил собой всю популярную музыку. Здесь есть Баста и T-Fest, но нет Оксимирона и ЛСП; есть Монеточка, но нет «Пошлой Молли»; есть «Мальбэк», но нет IC3PEAK. Тут тоже следует винить личный волюнтаризм редактора; конечно, эта выборка могла выглядеть иначе — и была бы не менее легитимной. Еще и потому, что хиты последней пятилетки пока не прошли проверку временем — фактически в этой книге мы делаем ставку на то, какие из них останутся в массовом сознании.
— второй подкорпус — подкорпус альтернативной музыки (altcorp). В нём 37 исполнителей (Bad Balance, FACE, Noize MC, Oxxxymiron, RSAC, Tequilajazzz, THOMAS MRAZ, Uma2rmaH, Агата Кристи, АИГЕЛ, Аквариум, АукцЫон, Баста, БИ-2, Браво, Бумбокс, Гражданская оборона, Дайте танк (!), Дельфин, Децл, Земфира, Каста, Константин Никольский, Ленинград, Линда, ЛСП, Михей, монеточка, Мумий Тролль, Несчастный Случай, Ногу свело!, Ночные снайперы, Пасош, Самое большое простое число, Скриптонит, Сплин, Тимати, Хаски) и количество песен не ограничено (всего 1454, тогда как в главном “нормированном” корпусе 1129).
Чтобы выбрать один из корпусов, нужно перейти во вкладку “Выбор подкорпуса” и в строке “Выборка” ввести либо main, либо altcorp. Корпуса пересекаются незначительно, поэтому влияние на результаты небольшое.
Корпуса размечены консольным лемматизатором mystem, список тегов.
Прочитать о корпусе более подробно можно по ссылке / скачать текст.
Спасибо Д. А. Скоринкину и Школе лингвистики за возможность заниматься такими исследованиями и важные уроки. Спасибо Е. Глазунову, А. Рондареву, И. Дмитриевой, Е. Заковоротной, Е. Вивич, А. Вебер и М. Кулдашбаевой за обсуждения этой работы.
Этого ресурса бы не было без Б. В. Орехова и Т. А. Архангельского.
Работа над корпусом начиналась из желания узнать, какие бытовые реалии встречаются в популярной музыке и этим служат маркерами времени; какие детали быта имеют символическое значение.
Для бытовой предметной лексики лингвист Б. Л. Иомдин дает такое определение:
“ Бытовая предметная лексика – слова, называющие артефакты, регулярно используемые большинством городских жителей независимо от их профессиональной и социальной принадлежности.”
Частично автоматизировать извлечние бытовых реалий из текста можно при помощи инструментов для автоматической семантической разметки. Это исследование использует разметку USAS (The UCREL semantic analysis system университета Ланкастера).
Перед тем как анализировать бытовые реалии, необходимо понять, какие особенности есть у корпуса. Количество вхождений в корпусе меньше миллиона, поэтому сравнение частотностей с Частотным словарем национального корпуса русского языка Ляшевской и Шарова (где указана частота лексемы на миллион словоупотреблений) может быть достаточно грубым.
Самые частотные существительные НКРЯ:
год, человек, время, дело, жизнь, рука, работа, слово, Россия, место, лицо, друг, глаз, вопрос, дом, сторона, страна, мир, случай, голова, ребенок, сила, конец, Москва, вид, система, часть, город, отношение, женщина
Частотные существительные в корпусе русскоязычной популярной музыки:
13 слов повторяются в обоих списках (год, человек, время, дело, жизнь, рука, слово, место, лицо, друг, глаз, мир, голова). Для песенного корпуса более характерными являются существительные, связанные с описанием или выражением чувств – любовь, день, ночь, небо, сердце, свет, душа, сон, ветер, звезда, мама, окно, дождь, утро, огонь, песня, слеза.
Самые длинные тексты у рэперов – первые 16 исполнителей. Во главе рейтинга Оксимирон и Каста.
На следующем участке появляются исполнители в жанре поп – Монеточка, Monatik, Время и Стекло.
С 23 места начинается кластер исполнителей русского рока (ДДТ, Колибри, Аквариум).
В следующих пунктах поп- и рок-музыканты перемежаются, не образуя заметных кластеров. Рейтинг завершает русский рок – Линда, Shortparis, Мумий Тролль.
Имена собственные отсылают к объектам, существующим в реальном мире. Метод отбора был таков. Из всех токенов Настя выбрала слова, которые начинаются с большой буквы и при этом не находятся в начале предложения. Иногда в текстах песен выделяют заглавной буквой слова, которые кажутся загрузчикам текстов важными (e.g. ‘Это была Ты’), но такие случае редки, поэтому они не влияют на выборку. Как дополнительное средство фильтрации, если слово входило в первую тысячу Частотного словаря, оно не включалось в подсчеты (за исключением имен собственных вроде Москва, Александр).
Наибольшее количество отсылок к объектам реального мира содержат тексты Oxxxymiron, Bad Balance и Тимати.
В текстах рэперов много бытовых реалий. Приводим как пример все строки из текста Oxxxymiron - ‘Город под подошвой’ (2015), в которых хотя бы одно слово попало под условия поиска.
Дон ли, Волга ли течёт — котомку на плечо
Я не то, что Гулливер, но всё же город под подошвой
Где привидение Есенина, крест, молебен, елей
Был чужой, но Охра, Порчи, Илья — больше, чем семья
Избавь меня от ваших панацей, домашний Парацельс
Подустал? Нам насрать! Тони Старк как стандарт
Пара стран, автострад: Краснодар, Татарстан, Москвабад
Хоть по МКАД'у на старт, хоть на Мадагаскар
У Руслана в деке саундтреки к путешествию
Мост в Асгард — после, пусть просто везёт с транспортом
Моё ученье — всем, как Магомета с Бафометом
18 отсылок нашлось только в одном тексте Оксимирона.
Также приводим список частотных собственных имен. Из него видно, что исполнители часто упоминают:
самих себя (Настя, Потап, Каста, Фейс, Каменский (фамилия Насти Каменских), Тимати);
географические объекты, с которыми они связаны (Москва, Россия, Питер, Ростов);
географические объекты, которые имеют символическое значение (Париж, Нью-Йорк, Африка, Лондон, Голливуд, рублёвка).
Чаще всего еда и напитки встречаются в текстах Касты и Ленинграда, много их и в текстах рэперов (в которых в принципе частота бытовых реалий выше, поэтому это не очень много говорит о них как об исполнителях). Любопытно, что большое количество упоминаний лексики, связанной с едой и напитками в текстах Монеточки, Tequilajazzz и ДДТ. Получается, что среди представителей русского рока бытовая культура (в узком понимании) представлена достаточно хорошо именно у них. Монеточка (инди-поп исполнительница, у которой даже псевдоним – предметная лексика) еще не раз встретится в рейтингах в компании рэперов
На первом месте птица, на втором вино. Именно эти продукты (или, в случае птицы, омонимы) имеют наибольшие коннотации и чаще всего употребляются метафорически. Разумеется, появление слова птица здесь — это в первую очередь результат многозначности слова: в большинстве случаев оно употреблено не в значении пищевого продукта, поэтому учитывать его при анализе бытовой лексики не следует. Птица как животное имеет важное символическое значение в текстах, однако мы на нем останавливаться не будем, т.к. это выходит за рамки нашего исследования. Вино же часто упоминается в контексте христианства.
Также символическое значение можно выделить у водки, хлеба и кофе.
Распределение лексики, связанной только с едой, в значительной степени повторяет описанное распределение, поэтому в тексте работы мы его приводить не будем; графики находятся в приложении. Первые места у рэперов, за ними следует Монеточка.
Первые в рейтинге Tequilajazzz (что и ожидается от группы, у которой в названии текила) и Скриптонит, за ними следуют Ленинград (в чьих песнях часто встречаются алкогольные напитки, e.g. «В Питере – пить» и Монеточка, которая упоминаниями вина, кока-колы, водки и пр. сначала рисует мир современного русскоязычного подростка, а потом и всей молодежи).
Предметы вещного мира вновь наиболее частотны для рэперов (на первый план выходят Bad Balance, Хаски, Noize MC и Тимати) и Монеточка, занимающая второе место. Очевидно, в ее не самых длинных по сравнению с рэперами текстах (медианная длина 167,5 против 289,5 у Bad Balance) предметный мир представлен очень хорошо.
В описаниях деловых отношений и денежных вопросов лидируют рэперы. На первых местах Bad Balance и Каста, часто изображающие бытовую уличную жизнь, взаимоотношения между разными институциями (институт власти, бизнеса), отношения и проблемы обычных людей. Среди них, но на значительном удалении, Монеточка и ДДТ.
В этот топ впервые поднимаются представители русского рока. Аквариум, до этого не занимавший значительных мест в рейтингах, оказывается вторым в списке. Достаточно высоко и ДДТ. За ними следует Гражданская оборона, которая до этого не встречалась в списках. В топе появляются и поп-исполнители – Борис Моисеев (выступавший в амплуа падшего ангела) и Валерий Меладзе. Следом Дельфин и Сплин, которые также не встречались в рейтингах.
Получается, что русский рэп в значительно меньшей мере говорит о вере и религиозных переживаниях, оставаясь в рамках реального мира. Оксимирон все еще возглавляет рейтинг, тем не менее, исполнители, отмеченные выше, интересуют нас намного больше, поскольку медианная длина их текстов более чем в два раза меньше, чем длина текстов Оксимирона (375,5 против 157 у Дельфина, 142,2 у ДДТ, 130,5 у Аквариума, 116 у Бориса Моисеева, 92,5 у Валерия Меладзе и 85,5 у Гражданской обороны).
Чтобы получить сведения о распределении топонимов, мы обратились к разметке mystem и тегу geo, которым этот анализатор помечает географические наименования. К этим словам мы добавили Питер (так как анализатором он определяется как мужское имя). Все альтернативные названия Санкт-Петербурга (СПб, Ленинград, Питер) мы учитывали как Санкт-Петербург.
Топонимы, которые чаще всего используют музыканты – это названия главных городов России и название самой страны. Также упоминаются родные города исполнителей. Символами являются Париж, Нью-Йорк, Амстердам и Лондон, наиболее часто встречающиеся в рейтинге. Являются символами и стороны света и названия континентов – Африка, Восток, Запад, Америка, Европа. Так же символически упоминаются города США, Италии, Японии, горы Фудзи и Эверест. В текстах отсылают к туристическим направлениям – среди них Сочи, Крым, Ялта, Стамбул, Ницца, Мадрид. Встречаются и мифические географические объекты – Олимп, Русь. Самой часто упоминаемой улицей оказывается Арбат.
Большинство упомянутых географических объектов находится в Европе, но частотны и упоминания городов США и Японии.
Самое частотное слово в корпусе – местоимение я (0.04366807). Самые частотные существительные в корпусе – для описания чувств и состояний. Любовь занимает 0,32% от всех вхождений в корпусе.
Исполнителем, творчество которого наиболее полно представляет быт русскоязычного пространства, является рэпер Oxxxymiron. Во всех рейтингах он не опускался ниже 7 места, которое занял в более узких выборках – напитков и предметов одежды. По упоминанию денежной и деловой лексики Oxxxymiron занимает 3 позицию, по упоминанию имен собственных и сверхъестественных сущностей — первое место. Совокупно именно в текстах русского рэпа больше всего бытовых реалий. Помимо творчества Оксимирона, много бытовой лексики обнаружено в текстах Касты, Bad Balance, Скриптонита. За ними следуют тексты инди-поп исполнительницы Елизаветы Гырдымовой (Монеточка), чье творчество по наполнению наиболее близко к рэперам. На следующем месте Ленинград и ДДТ, в чьих текстах бытовой мир также представлен достаточно полно.
Когда речь идет о мистике и религиозных чувствах, на первый план выходят представители русского рока (Аквариум, ДДТ, Гражданская оборона). О мистическом и сокровенном говорит и поп-музыка (Борис Моисеев, Валерий Меладзе).
Путешествия и дальние страны (представляющие собой отрыв от повседневной реальности) – это тоже вопрос, которым занимается поп-музыка (Кар-Мэн, Колибри, Ёлка, Винтаж).
Все началось с этого репозитория.