исследование рэп что это

Слова-приметы русского рэпа

Аналитики Яндекса подготовили большое исследование про русский рэп. Они взяли тексты, доступные на Яндекс.Музыке, и нашли самые характерные слова — для русского рэпа в целом, для отдельных исполнителей и для разных периодов, с начала девяностых по наши дни. Здесь мы собрали пять фактов из исследования, а его полную версию можно посмотреть по этой ссылке. Кстати, это первое исследование Яндекса с пометкой «18+» — потому что из песни слов не выкинешь.

Наиболее характерные слова для рэпа — собственно рэп и хип-хоп.

Рэперы вообще много говорят о своей музыке и процессе её производства. В текстах они постоянно упоминают микрофоны, треки, альбомы, рифмы и бит — эти слова так же характерны для жанра, как обсценная лексика.

Самые типичные персонажи рэп-текстов — рэпер и братик.

За ними в порядке убывания популярности следуют MC, бро и хейтер. А ещё в русском рэпе гораздо чаще, чем в других жанрах, упоминаются названия брендов: айфоны, найки и гуччи, мерины и бумеры.

Самые характерные (слева) и самые нехарактерные (справа) персонажи русского рэпа

Пик употребления мата в русском рэпе пришёлся на вторую половину 2000-х.

В девяностые доля мата в рэп-текстах была не сильно больше, чем в остальных произведениях. Затем она заметно выросла и достигла пика в 2006–2010 гг. — в этот период мат звучал в рэпе в 17 раз чаще, чем в музыке других жанров.

Заимствования — примета последних лет.

Доля слов, позаимствованных из английского языка, начала расти примерно в начале десятых годов. Особенно много их в списке характерных слов за два последних года: это хайп, блант, кэш, коп, трип, хейтер и прочее.

Басту можно узнать не только по Ростову, но и по пуэру

Гуф чаще других рэперов употребляет слова кузня, планчик, по-моему, абсолютно и нормально. Тимати — бизнесмен, статус, график, чикса и потанцевать. Скриптонит — вкуривать, поц, шпек и хапка.

На странице исследования есть карта русского рэпа. Она показывает лексические связи между рэперами: чем больше у двух исполнителей общих характерных слов, тем ближе друг к другу они находятся. Бонусом — рэп, сочинённый Автопоэтом.

Источник

Русский рэп как набор слов

6 ноября 2018. По данным Яндекс.Музыки

Наши коллеги из The Pudding как-то нарисовали карту англоязычного хип-хопа. Мы решили, что про русский рэп тоже надо сделать такое исследование, — и сделали немного больше. Мы взяли тексты, доступные на Яндекс.Музыке, и нашли самые характерные и самые нехарактерные слова — для жанра вообще и для конкретных рэперов. Посмотрели, какие слова были в моде в разные годы. Сделали тест, в котором надо угадать, кому подражала нейросеть, когда писала строчки вроде «Я горожанин Мордора. На пиру — не сняв ошейника». Карту русского рэпа тоже нарисовали.

В этом исследовании мы изучали тексты, которые были доступны на Яндекс.Музыке в июле 2018 года. Рэпом считали то, что помечено в каталоге сервиса как рэп.

Слова, характерные для жанра в целом

Для каждого слова посчитали, как часто оно встречается в текстах рэперов и всех остальных исполнителей. Чтобы не завышать частотность слов, которые много повторяются в одной песне (например, в припеве), слово учитывали только один раз для каждого трека. Первую частотность делили на вторую — чем больше полученный показатель, тем более характерным для рэпа считали слово. Учитывали только глаголы, существительные и прилагательные, которые встречаются в обоих корпусах.

Чтобы найти самые рэповые строки, мы брали все слова из каждой строчки, складывали их показатели характерности для рэпа и делили на число слов. Чем выше средняя характерность, тем более рэповой считали строчку. Самые нерэповые строчки искали аналогичным образом.

Читайте также:  стоковые фотосессии что такое

Эпохи

Чтобы составить топы характерных слов для эпох, мы разделили все треки на пять групп по времени выпуска, а затем для каждой группы нашли слова, которые встречаются в текстах соответствующего периода гораздо чаще, чем в среднем за всё время.

Исполнители

Характерные слова искали для рэперов, входящих в топ-250 популярных на Яндекс.Музыке, для которых на сервисе было доступно не менее десяти треков с текстом. Для этого использовали метрику TF-IDF. В качестве документа брали весь репертуар исполнителя, в качестве корпуса — все доступные на сервисе тексты рэперов из топа-250. Чтобы не завышать частотность слов из припевов и других рефренов, мы снова засчитывали слову только одно вхождение для каждого трека, в котором оно звучит.

Для поиска характерной песни применили ту же метрику для каждого трека исполнителя, только теперь считали все упоминания слов в треке, предварительно удалив повторяющиеся строки. Самым характерным треком считали тот, вектор характерности слов которого оказался ближайшим к вектору исполнителя по косинусному расстоянию.

Карта русского рэпа

Полученные векторы исполнителей использовали для составления карты русского рэпа: чем меньше косинусное расстояние между векторами, тем ближе два исполнителя на карте.

Популярные слова

ПО ДАННЫМ ЯНДЕКС.МУЗЫКИ

Самые характерные и нехарактерные слова

Потом мы решили определить самые-самые характерные и нехарактерные слова — без оглядки на то, как часто их используют. Чтобы найти их, мы снова сравнивали частотность использования того или иного слова в рэпе и в других жанрах, но теперь уже не ограничивались рэперским топом-500.

ПО ДАННЫМ ЯНДЕКС.МУЗЫКИ

ПО ДАННЫМ ЯНДЕКС.МУЗЫКИ

Рассчитав показатели характерности отдельных слов, мы смогли отобрать строчки, максимально насыщенные рэпом. Потом мы отдали эти строчки автопоэту, чтобы получить сверхрэповые четверостишия. В основном получается не очень: строчки разных авторов плохо уживаются вместе. Но бывают и удачи. Интересно, что самые нерэповые строчки соединяются заметно лучше, как будто это детали из одного набора.

Эпохи

Примеры характерных слов для разных периодов

Примеры набраны из топа-15 существительных, прилагательных и глаголов, характерных для каждого периода.

ПО ДАННЫМ ЯНДЕКС.МУЗЫКИ

В девяностые доля матерных слов в текстах рэперов была не сильно выше, чем в песнях представителей других жанров. В начале двухтысячных она заметно выросла и достигла пика во второй половине нулевых, одновременно с началом широкого употребления сленга. Тогда в рэпе мат звучал в семнадцать раз чаще, чем в музыке других жанров, в последние годы — примерно в десять раз. Выше всего доля мата в треках Фейса, THRILL PILL, Сявы, «Кровостока» и Big Russian Boss.

Исполнители

Кто бы мог это написать?

Определив характерные слова для всех исполнителей, мы нашли для каждого трек с самым высоким содержанием таких слов. Например, для «Триагрутрики» это песня «Биг сити лайф», а для ATL — «Планета Железяка».

Источник

Яндекс. Музыка показала самые популярные слова в лексиконе русских рэперов

Сервис Яндекс.Музыка нарисовал карту самых популярных слов в русском рэпе. Посмотреть ее и почитать исследование сервиса можно здесь.

Как это делалось? «Для каждого слова посчитали, как часто оно встречается в текстах рэперов и всех остальных исполнителей (брались только тексты, доступные на Яндекс.Музыке — прим. The Flow). Чтобы не завышать частотность слов, которые много повторяются в одной песне (например, в припеве), слово учитывали только один раз для каждого трека. Первую частотность делили на вторую — чем больше полученный показатель, тем более характерным для рэпа считали слово. Учитывали только глаголы, существительные и прилагательные, которые встречаются в обоих корпусах».

Читайте также:  с чем пьют чачу закуска

Какие самые популярные слова у рэперов? «Наиболее характерными словами для рэпа и хип-хопа оказались, собственно, рэп и хип-хоп. Рэперы вообще много говорят о своей музыке и о процессе её производства. Слова трек, микрофон, бит, рифма или, например, альбом так же характерны для жанра, как обсценная лексика или жаргон — тачка, хата и прочее. Наименее характерны для рэпа слова луна, весна, птица, дождь, река, крыло, тишина, сердце и так далее».

Кроме этого сервис может показать самые популярные слова в творчестве отдельного исполнителя — для этого надо подставить в соответствующую графу его имя.

Источник

Бессмысленный и беспощадный. Аналитики «Яндекса» составили карту русского рэпа

Лента новостей

Все новости »

Компания выпустила исследование о наиболее характерных и нехарактерных словах в текстах рэперов, а также разделила лексикон по годам: от 1991 до 2018 года

«Яндекс» разделил историю русского рэпа на пять периодов и для каждого нашел слова, которые в этот период употребляли намного чаще, чем в другие. Девяностые оказались очень похожи по духу на начало двухтысячных: рэперы много говорили про уличную жизнь, драки и битвы, гордились слогом, ждали наград, искали истину.

Вторая половина нулевых отличается распространением сленга вроде «рэпчика», тогда же стали «мутить» и «убиваться». С начала десятых в топах стало больше заимствований из английского, особенно много их в списке характерных слов последнего периода: «хайп», «блант», «кэш», «коп», «трип», «хейтер» и прочее.

Менялась и доля матерных слов в текстах рэперов. В девяностых она была не сильно выше, чем в песнях представителей других жанров. В начале двухтысячных заметно выросла и достигла пика во второй половине нулевых, одновременно с началом широкого употребления сленга. Тогда в рэпе мат звучал в 17 раз чаще, чем в музыке других жанров, в последние годы — примерно в десять раз. Выше всего доля мата в треках Фейса, THRILL PILL, Сявы, «Кровостока» и Big Russian Boss.

Самые типичные персонажи для современных российских рэп-текстов — «рэпер» и «братик», среди нетипичных — «старушка» и «цыганка». Место действия — «студия» или «блок», но никак не «луг» и не «тайга». Рэп-животные — это «зая» и «псина» (антиподы — «соловей» и «журавль»). Еще в рэпе гораздо чаще, чем в других жанрах, упоминаются названия брендов, в первую очередь «найки» и «гуччи», «мерины» и «бумеры», а также «айфоны». Другим жанрам просто нечем ответить.

Характерные слова можно найти и для отдельных представителей русского рэпа. Например, тексты Басты можно узнать по частому упоминанию «Ростова» и «пуэра». Характерные слова для Гуфа — «кузня», «нормально», «планчик», «Москва-река» и «абсолютно»; для Тимати — «бизнесмен», «статус», «график», «чикса» и «танцевать»; для Славы КПСС — «бытие», «хайп» и «Россия».

По итогам исследования автопоэт «Яндекса» научился составлять «сверхрэп» (строчки, максимально насыщенные русским рэпом). Из печатного: «Я нагнул вас всех, если бабки есть, трать. Уверен, это будет успех, рэп прочитать — жизнь прочитать».

Источник

Рэпометр: пересечение аудиторий российских рэперов в YouTube от Yoloco

Год назад мы в Yoloco провели небольшое исследование — выявили пересечения аудиторий российских рэп-исполнителей в Instagram. Сегодня покажем вам пересечения аудитории рэперов в YouTube.

Тогда это исследование вызвало большой интерес, причём не только в индустрии диджитал-маркетинга, но и за ее пределами. Наш пост в Facebook репостнули известные издания в сфере маркетинга, например DNative, а некоторые рэперы пообсуждали наше исследование в Twitter — тут.

Читайте также:  снилась драка к чему это

Интерес был вызван в первую очередь тем, что пересечение аудиторий у лидеров мнений даёт представление о реальных охватах. В дальнейшем мы первыми на рынке реализовали инструмент быстрого пересечения аудиторий на нашей платформе. Сегодня наши клиенты могут за 5-10 минут пересечь аудиторию выбранных блогеров, узнать, сколько у них одинаковых подписчиков и принять решение, стоит ли работать с этими блогерами или нет.

Самое сложное в пересечениях аудиторий — собрать данные. За год мы прокачали нашу технологию и теперь умеем собирать не только данные по миллионам подписчиков в Instagram, но и комментарии в YouTube.

Yoloco сфокусировался на сборе комментариев, потому что вся ценная информация об активности аудитории и её реакциях содержится именно там. За год мы разработали собственную модель автоматического определения тональности текста и теперь можем проверить комментарии на негатив и позитив за несколько секунд.

Ценность для брендов заключается в первую очередь в возможности двигаться дальше в оценке реального объема активной аудитории, с которой они планируют взаимодействие. Это повышает точность медиапланирования и выбора нужного инфлюенсера.

В итоге решили провести похожее исследование пересечений аудиторий, но уже в YouTube. В этот раз мы будем пересекать комментаторов, а не подписчиков. Итак, поехали!

Мы отобрали 20 популярных рэп-исполнителей из РФ и стран СНГ. Для отбора финального списка рэперов проделали следующие шаги:

У оставшихся 20 исполнителей мы проанализировали 7,8 млн комментариев под 2000 видеороликов. У каждого исполнителя взяли все видеоролики и собрали все комментарии (без ответов на комментарии, только верхний уровень) под ними. Также нашли для каждого рэп-исполнителя такой показатель, как процент реплаев, то есть ответов на комментарий. Эта метрика говорит нам о том, как часто подписчики создают новые ветки обсуждения, отвечают другу другу. Косвенно, процент реплаев указывает нам на качество и глубину обсуждения под роликами.

Лидер по проценту реплаев — рэпер FACE. Его подписчики часто отвечают друг друг — более 38% комментариев. Меньше всего общаются друг с другом подписчики канала лейбла «Газгольдер». Лишь 16% поклонников Басты и его артистов отвечают друг другу, создавая новые ветки в комментариях.

Если один и тот же пользователь YouTube оставил комментарий под каналом А и каналом Б, мы засчитывали это как пересечение. В итоге получилось 5,2 млн связей «комментатор — канал». Всего мы проанализировали 3,9 млн уникальных комментаторов, то есть около 4 млн людей хотя бы один раз комментировали ролики выбранных рэп-исполнителей.

Самый старый комментарий, который попал в выборку был сделан 18 октября 2008 года под клипом группы Каста. Самый последний комментарий, который попал в выборку, был сделан 27 ноября 2020 года. Его оставили под роликом Моргенштерна «Хова ответил… / Читаю под биты (Versus BPM)». Ролик был сделан давно, но его до сих пор комментируют.

Мы проанализировали изменение эмоционального окраса комментариев во времени. Чтобы это сделать, определили для каждого комментария 4 параметра: дату создания, видеоролик, к которому относится комментарий, YouTube-канал, где выложен этот видеоролик, и тональность комментария — позитивную или негативную. Для определения тональности использовали собственную модель тональности Yolority.

Также мы собрали облако комментариев для каждого исполнителя и покажем в этой статье облако всех комментариев под видеороликами исполнителей.

Источник

Расскажем обо всем