Методологическая база по построению Big Data Indicators была представлена:
Big Data Indicators опираются на данные новостей в крупнейших экономических СМИ России и комментариев к ним пользователей сети Интернет.
В выборку СМИ в настоящий момент включены 4 источника: Эксперт, РБК, Ведомости, Коммерсант. По результатам рейтингов Медиалогии и проведенных нами опросов экспертов, выбранные источники представляют собой крупнейшие экономические СМИ России и, как мы предполагаем, охватывают значительную долю российского населения, читающего и обсуждающего экономические новости.
Мы учитываем комментарии пользователей сети Интернет к экономическим статьям в СМИ как на официальных веб-страницах СМИ (в случае открытого доступа), так и в социальных сетях Facebook и ВКонтакте.
Алгоритм расчета индикаторов для различных областей экономических ожиданий населения состоит из следующих шагов:
Важно! В марте 2018 г. в связи со значительным увеличением доли сообщений бот-аккаунтов в январе-марте 2018 г. - для всего периода расчета индикаторов была произведена корректировка значений с удалением сообщений с явными признаками ботов. Скорректированные значения индикаторов принципиально не меняют выводы предшествующих отчетов (малое присутствие ботов), однако позволяют сделать более точными текущие и будущие оценки индикаторов.
Раздел включает два индикатора, отражающие динамику инфляционных ожиданий населения. Первый индикатор сконструирован на основе частотного анализа содержания комментариев и отражает интенсивность ожиданий роста цен, второй – получен на базе анализа эмоциональной окраски комментариев и отражает степень неопределенности инфляционных ожиданий.
Основные параметры:
Индикатор показывает интенсивность ожиданий роста цен в краткосрочном периоде со стороны российского населения.
Индикатор представляет собой число комментариев пользователей сети Интернет к статьям в экономических СМИ по теме инфляции с упоминанием ожиданий роста цен, скорректированное на ожидания СМИ, число статей по теме инфляции в экономических СМИ с упоминанием ожиданий роста цен, в каждый период времени. С учетом крупного и непрерывного информационного потока в сети Интернет, относящегося к экономическим новостям, со стороны крупных российских СМИ мы предполагаем, что обсуждение статей, релевантных теме «инфляция», в большей степени отражает краткосрочные ожидания населения – динамику цен в пределах одного года.
Полученный нами индикатор является устойчивым к выбору как методологии отбора статей на тему «инфляция», так и комментариев, в которых упоминаются ожидания роста цен. Результаты развернутого теста на робастность итогового индикатора к выбору методологии представлены в Голощапова, Андреев (2017).
С целью проверки адекватности полученного индикатора с точки зрения существующих способов измерения инфляционных ожиданий в России, мы сопоставили его с официальным индикатором ожиданий роста цен, рассчитываемым ООО «инФОМ» для Банка России на основе результатов опросов населения в различных регионах. В качестве индикатора, наиболее соответствующего построенному, был выбран медианный индикатор численных ожиданий инфляции в следующие 12 месяцев.
В период 2014-2016 гг. индикатор, построенный на основе текстового анализа, показывает высокую корреляцию (около 70%) с официальной мерой инфляционных ожиданий населения. При этом в окрестности пиковых значений наблюдается опережение нашим индикатором значений остальных индикаторов примерно на 1 месяц.
Индикатор релевантен динамике ключевых макроэкономических трендов как на помесячном, так и На подневном уровне.
Индикатор стремится аппроксимировать неопределённость инфляционных ожиданий, связанную с отношением населения к достижимости цели по инфляции, в т.ч. в рамках реализуемой Банком России денежно-кредитной политики.
В рамках расчетов все комментарии, относящиеся к статьям по теме «инфляция», по эмоциональной окраске (или тональности) были классифицированы на негативные, нейтральные и положительные. Для моделирования исользовались классические методы текстовой обработки и алгоритмы классификации (логистическая регрессия, Support Vector Machines). Затем, на основе полученных результатов был построен индикатор неопределенности инфляционных ожиданий.
Итоговый индикатор представляет собой долю эмоционально окрашенных (ярко позитивных или ярко негативных) комментариев в общем числе комментариев к статьям по теме «инфляция» в каждый период времени.
На всем рассматриваемом периоде индикатор высоко (> 70%) скоррелирован с долей респондентов, неопределившихся с ответом на вопрос относительно достижимости цели по инфляции к концу 2017 г. (по опросам ООО “инФОМ”).
Построение индикаторов на подневной основе одновременно с частотным анализом содержания комментариев позволяет определить ключевые триггеры изменения инфляционных ожиданий и проанализировать их структуру в динамике – начиная с 2014 г.
в качестве основных факторов резких изменений инфляционных ожиданий рассматриваются: динамика цен на нефть, курс доллара к рублю, решения Банка России об уровне ключевой ставки денежно-кредитной политики, внутренняя политика, мировая конъюнктура, кризисные процессы и общая неопределенность экономической ситуации. Указанные факторы охватили 83% комментариев, отнесенных к категории ожиданий роста цен (в ближайшие 12 мес.)
На базе текстового анализа мы изучили динамику вклада выделенных факторов в 2014-2016 гг. в построенный нами индикатор интенсивности инфляционных ожиданий российского населения на подневном уровне. Показатели вкладов были получены с помощью частотного анализа содержания комментариев, отнесенных к категории ожиданий роста цен, в каждый момент времени. То есть, значение показателя вклада для какого-либо фактора за период t равно числу комментариев с упоминанием указанного фактора, отнесенному к общему числу комментариев с упоминанием всех рассматриваемых факторов в комментариях категории ожиданий роста цен за период t.
Логика формирования факторов изменения инфляционных ожиданий
Фактор | Описание |
---|---|
Курс национальной валюты | Курс валюты (доллар, рубль, евро), девальвация, спекулятивные атаки |
Цены на сырье | Цены на энергоресурсы (нефть, газ, уголь) и их производные (бензин, топливо, и др.), объемы предложения энергоресурсов и их производных на рынке |
Денежно-кредитная политика | Банк России (все варианты названий), ключевая процентная ставка, процентные ставки, денежно-кредитная политика |
Неопределенность экономической ситуации | Неопределенность, противоречивость, нестабильность и др. синонимы |
Доходы | Доходы, заработная плата, пенсии, индексация доходов |
Экономический кризис | Кризис, падение выпуска (рецессия, спад, и др.), стагнация, падение продаж, рост расходов, увеличение кредитной нагрузки |
Внутренняя политика | Президент, Правительство, Министерства, законодательство, тарифы на услуги ЖКХ, коррупция и воровство, импортозамещение, налогообложение, анти-монопольное регулирование |
Мировая конъюнктура | Запад, США, Евросоюз, Великобритания, Китай, Украина (включая упоминание лидеров стран и органов денежно-кредитной политики), Крым |
Примечание: описание факторов представляет собой детализацию блоков регулярных выражений, используемых для поиска упоминаний каждого фактора в комментариях читателей крупных экономических СМИ в сети Интернет, отнесенных к категории ожиданий роста цен (в ближайшие 12 мес.)
Раздел включает один индикатор, отражающий интенсивность упоминаний кризисных процессов в экономике со стороны российского населения. Индикатор сконструирован на основе частотного анализа содержания комментариев и представляет собой число комментариев пользователей сети Интернет с упоминанием экономического кризиса (кризис, рецессия, спад
), скорректированное на аналогичную обеспокоенность кризисом со стороны СМИ – среди всех статей в экономических СМИ по теме экономики и экономического роста в каждый период времени.
Основные параметры:
кризис, рецессия, спад
.Число комментариев пользователей сети Интернет с упоминанием экономического кризиса (кризис, рецессия, спад
), скорректированное на аналогичную обеспокоенность кризисом со стороны СМИ – среди всех статей в экономических СМИ по теме экономики и экономического роста в каждый период времени.
Построение индикаторов на подневной основе одновременно с частотным анализом содержания комментариев позволяет определить ключевые триггеры изменения кризисных настроений и проанализировать их структуру в динамике – начиная с 2014 г.
в качестве основных факторов резких изменений кризисных настроений рассматриваются: динамика цен на нефть, курс доллара к рублю, денежно-кредитная политика, внутренняя политика, мировая конъюнктура, инфляция и общая неопределенность экономической ситуации. Указанные факторы охватили 70% комментариев, отнесенных к категории кризисных настроений.
На базе текстового анализа мы рассчитываем показатели вкладов каждого фактора в динамику кризисных настроений. Значение показателя вклада для какого-либо фактора за период t равно числу комментариев с упоминанием указанного фактора, отнесенному к общему числу комментариев с упоминанием всех рассматриваемых факторов в комментариях категории кризисных настроений за период t.
Логика формирования факторов изменения интенсивности кризисных настроений
Фактор | Описание |
---|---|
Курс национальной валюты | Курс валюты (доллар, рубль, евро), девальвация, спекулятивные атаки |
Цены на сырье | Цены на энергоресурсы (нефть, газ, уголь) и их производные (бензин, топливо, и др.), объемы предложения энергоресурсов и их производных на рынке |
Денежно-кредитная политика | Банк России (все варианты названий), ключевая процентная ставка, процентные ставки, денежно-кредитная политика |
Неопределенность экономической ситуации | Неопределенность, противоречивость, нестабильность и др. синонимы |
Доходы | Доходы, заработная плата, пенсии, индексация доходов |
Инфляция Инфляция, ди | намика (рост/снижение) цен, индекс потребительских цен |
Внутренняя политика | Президент, Правительство, Министерства, законодательство, тарифы на услуги ЖКХ, коррупция и воровство, импортозамещение, налогообложение, анти-монопольное регулирование |
Мировая конъюнктура | Запад, США, Евросоюз, Великобритания, Китай, Украина (включая упоминание лидеров стран и органов денежно-кредитной политики), Крым |
Примечание: описание факторов представляет собой детализацию блоков регулярных выражений, используемых для поиска упоминаний каждого фактора в комментариях читателей крупных экономических СМИ в сети Интернет, отнесенных к категории ожиданий роста цен (в ближайшие 12 мес.)