Системы мониторинга и анализа сми. Что такое мониторинг и анализ СМИ? Как выбрать подходящий тип мониторинга СМИ? Критерии сравнения информационно-аналитических систем

В современную эпоху крупным государственным и коммерческим структурам становится все труднее следить за динамично меняющимся вокруг них информационным полем, которое содержит массу новостных и обзорных материалов. Регулярное ознакомление с публикациями СМИ для любой серьезной деятельности необходимо, но не всегда достаточно. Большие массивы информации должны подвергаться качественному анализу. На основе фактов и предположений, почерпнутых из открытых источников, можно не только анализировать состояние дел в своей отрасли, но и строить прогнозы развития ситуации, что жизненно важно для принятия верных решений.

Какая информация нам нужна?

Немаловажную роль в современном бизнесе играет конкурентная разведка, в основе которой, по крайней мере на Западе, лежит маркетинговая информация, получаемая из прессы. По утверждению специалистов, около 80% информации, требуемой для поддержки процесса стратегического управления может добываться из открытых источников, таких, как Интернет, традиционные СМИ, информационно-рекламные материалы компаний и т. д.

Пример 1 . Американская инвестиционная компания на рубеже 80-х и 90-х годов прошлого века разрабатывала план своего стратегического развития. Работая с материалами СМИ последних лет, она выявляла наиболее перспективные направления современного бизнеса и науки с тем, чтобы доходно вложить деньги. Пресс-аналитиков интересовала динамика публикаций по заранее определенным темам. Выяснилось, что по крайней мере две тенденции заслуживают внимания. Во-первых, тогда значительно возрос интерес прессы к новому виду компьютерных сетей - Интернету. Во-вторых, на гребне пика своей популярности из научной прессы вдруг практически исчезли публикации, касающиеся высокотемпературной сверхпроводимости. Первая свидетельствовала о том, что Интернет скоро станет массовым явлением и в его развитие выгодно вкладывать деньги. Вторая наводила на мысль о том, что исследования ученых по высокотемпературной сверхпроводимости засекретили, а это также свидетельствует о ее исключительной перспективности. И в том и другом случае аналитики оказались правы.

Задача, описанная в примере 1, решалась не быстро, не одним человеком и практически без привлечения компьютерных технологий. Проблема обработки информации такого рода состоит в отсутствии у нее какой-либо приемлемой структуры и в ее огромных объемах. Тем не менее, имея удобные инструменты, ее вполне можно решить. Задача из примера 2 решалась быстро, одним человеком при помощи простых программ мониторинга СМИ.

Пример 2 . Некая российская фирма запланировала поглотить одно из интересных для ее бизнеса предприятий. Решили выйти на акционеров этого предприятия и договориться с каждым о продаже их акций. Но списка акционеров у фирмы не было. Тогда аналитик совершенно законным путем из открытой региональной и общероссийской прессы собрал информацию об основных акционерах и тем самым помог своему руководству оперативно и результативно решить задачу поглощения. (Пример приводится Сергеем Чистопрудом в журнале “Профи”.)

По оценкам зарубежной прессы, 9 из 10 крупных американских компаний тратят ежегодно в среднем 1 млн. долл. на мониторинг деятельности конкурентов. Вложенные средства окупаются за счет правильных решений, принятых на основе отобранной и проанализированной информации.

Инструменты мониторинга СМИ

# Статьи Опарина #

Под “удобными инструментами для работы с информацией” понимаются компьютерные программы, помогающие собирать и сортировать материалы СМИ. Таких программ на рынке около сотни, но все они занимаются, как правило, организацией хранения средних или больших объемов информации, обладают простыми поисковыми возможностями и/или тематическим рубрикатором, не предлагая какого-либо механизма качественного анализа. И это не случайно, ибо качественный анализ текста предполагает оценку таких нюансов, как эмоции, угрозы, характер отношений между объектами... В этих сферах человеческий мозг, способный накапливать опыт и обладающий интуицией, предпочтительнее. Хотя скорость оценки при этом и невелика, мы выигрываем в качестве.
При решении интеллектуальных задач компьютерная программа призвана максимально облегчить труд человека: во-первых, обеспечить его ограниченной выборкой документов, отсеяв по предустановленным фильтрам лишнее, во-вторых, предоставить удобное автоматизированное рабочее место (АРМ) для проведения оценок. Некоторые из программ умеют производить “интеллектуальный” поиск по массиву данных, отбирая документы по набору ключевых слов, частоте их употребления и относительному расположению, и делают это с учетом морфологии. Эти программы уже способны на простой контент-анализ, т. е. на семантическую статистическую обработку.
Класс таких аналитических (по терминологии их авторов, хотя не все они в полной мере соответствуют этому названию) программ российских разработчиков имеет хорошие шансы именно в нашей стране. Там, где приходится иметь дело с русскими текстами и документами, у отечественных компьютерных фирм нет достойных конкурентов. В их числе производители правовых баз данных и систем распознавания текстов, поисковых “движков” и автоматических классификаторов, словарей и переводчиков на иностранные языки.
А что же может предложить отечественная компьютерная мысль в области мониторинга и анализа СМИ? Сбором информации занимаются многие, анализом - единицы. Мониторинговые компании лишь перечислим, а вот о тех, кто предлагает продукты для обнаружения новых знаний в хранилищах данных -(knowledge discovery in databases, KDD), расскажем подробнее.
Не меньше десятка баз данных, ориентированных на сбор и хранение материалов СМИ, можно обнаружить в Рунете. Наиболее известные их них: “Артефакт” компании “Интегрум-Техно” ; система “Парк”, созданная “Парк.Ру” ; электронный киоск Russian Story ; Национальная электронная библиотека от НСН ; ; УИС РОССИя ; каталог СМИ от “СМИ.Ру” . Работа со всеми перечисленными источниками, кроме “СМИ.РУ”, платная, и все их владельцы предлагают не только возможность ознакомиться с материалами СМИ, но и некоторые мониторинговые услуги. А вот компания WPS свой электронный архив газет, журналов, транскриптов теле- и радиопередач в Интернете не держит, используя Сеть как рекламную площадку и инструмент для продвижения собственных мониторинговых продуктов.

Аналитические программы для работы с текстами

Аналитические системы различаются прежде всего по виду обрабатываемых данных - полнотекстовых или фактографических. Методы обработки фактографических данных известны достаточно давно. Среди них в последнее время особой популярностью пользуются OLAP-анализ и Data Mining (выявление последовательностей, ассоциаций, деревья решений и т. д.). Эти методы в той или иной мере сейчас поддерживаются всеми современными системами. Частично они реализованы в MS OLAP Services и в продуктах компании Business Objects. Наиболее полно - в системе PolyAnalyst компании Megaputer.
Методы анализа текстов распространены гораздо меньше. Это в основном тематическое рубрицирование входящего потока документов и подсчет статистики встречаемых слов и словосочетаний. Для автоматизации процедуры рубрицирования применяют так называемые авторубрикаторы. Наиболее известными производителями этих систем и отдельных компонентов являются канадская фирма Hummingbird (продукт Hummingbird Knowledge Management), а также российские компании Media Lingva (“Классификатор”), Megaputer (TextAnalyst) и “Гарант-Парк-Интернет” (ее продукт реализован на основе технологий американской фирмы InterMedia). Как правило, в их решениях обеспечивается и подсчет статистики встречаемых слов.
Зачастую для более быстрого и качественного анализа сбор статистики проводят с использованием OLAP-кубов. С их помощью аналитик в результате стандартных операций может быстро получить ответы на свои вопросы. Вот пример простейшего запроса: “Кто из политиков чаще других упоминался в ведущих изданиях указанного региона за выбранный отрезок времени?”. Разумеется, реальные запросы бывают более сложными.
Для успешного применения такого рода методов входящий поток всегда подвергается предварительной обработке, включающей просмотр оператором, автоматический контроль орфографии, использование фильтра стоп-слов, нормализацию регистра и др. Для последующего контекстного поиска проводится полнотекстовое индексирование содержимого документов.

Краткий обзор программных продуктов, представленных на российском рынке

(www.cognitive.ru/products/astarta.htm)
Компания Cognitive Technologies предлагает инструмент автоматизации аналитических исследований “Астарта”. Он представляет собой экспертный рубрикатор, предназначенный для сбора, хранения и семантического анализа текстовых материалов. Под анализом здесь понимается автоматическое рубрицирование и группировка, а также интеллектуальная выборка информации по заданной теме. Технологической основой для “Астарты” является ее “старший брат”, комплекс средств для создания электронных архивов “Евфрат”. Программа уже имеет практические внедрения, в частности на “Норильском никеле”, где с ее помощью анализируется база патентной информации, содержащая более 100 тыс. документов. В “Астарте” есть подсистема, умеющая обрабатывать материалы из СМИ в потоковом режиме. С ее помощью аналитики “Норильского никеля” делают, например, выводы об изменениях интересов ведущих фирм в выбранных для наблюдения областях. В конце 2002 г. в прессе сообщалось о начале внедрения “Астарты” в ФАПСИ.


(zoom.galaktika.ru)
Программный комплекс “Галактика-Zoom”, предназначенный для аналитической обработки текстовых неструктурированных документов, предлагает корпорация “Галактика”. Программа может собирать информацию на Интернет-сайтах или брать документы из подключаемых баз данных. Авторы обещают пользователю информационную поддержку принимаемых управленческих решений благодаря быстрому поиску и контент-анализу отобранной информации. При опробовании системы у меня создалось полное ощущение работы с тематическим рубрикатором, способным проводить уточнение “на лету”. Например, в результате поиска по слову “водка” мне был выдан список документов с этим словом и список тем для уточнения запроса (спирт, фальсифицировать, пиво, Петр...). Похоже, что список тем формируется не случайным образом, а с учетом частоты употребления в текстах с “водкой”. Если это так, то мы имеем дело с рубрикатором, создающим структуру, в которой “водка” - главная рубрика, а “спирт”, “фальсифицировать”, “пиво” - подрубрики. Такой подход позволяет решать некоторые типичные маркетинговые задачи или составлять информационный портрет объекта, представляющего интерес.


(www.medialogia.ru)
Информационно-аналитическая система “Медиалогия” одноименной компании разработана группой российских ученых, аналитиков, а также специалистов в области информационных технологий. Прототипом “Медиалогии” является система IBS-Media, более известная как модуль ситуационных центров, создаваемых и продвигаемых отделением систем имитационного моделирования компании IBS. Разработчики исповедуют смешанный подход к оценке статей и других объектов. Это значит, что часть наименее интеллектуальной черновой работы выполняет программа. Более тонкие оценки, отражающие характер упоминания объектов в статье и то, в каких отношениях они между собой находятся, берет на себя человек.
На текущий момент система осуществляет мониторинг более чем 24 000 объектов, фиксируя статистическую и аналитическую информацию из тысячи источников (центральная и региональная бумажная пресса, информационные агентства, транскрипты и оригиналы теле-, радиопередач, Интернет-источники). На обработке сообщений задействовано несколько сотен квалифицированных операторов, безостановочно просматривающих до десяти тысяч сообщений в сутки. Система позволяет классифицировать публикации по значимости, определять отношение СМИ к объектам, анализировать характеристики PR-кампаний, устанавливать отраженные в СМИ связи между объектами и т. д.


(www.hbsltd.biz/products_km.asp)
В системе, которая создавалась по заказу российской компании HBS для анализа региональных СМИ, была реализована технология обработки электронных текстов с использованием поискового сервера Hummingbird SearchServer (ранее Fulcrum SearchServer) компании Hummingbird. Поступающая информация автоматически рубрицируется, а затем подвергается OLAP-анализу. В пакетах Hummingbird SearchServer и Hummingbird KnowledgeServer есть средства, с помощью которых пользователи могут сами создавать новые или настраивать имеющиеся деревья рубрик.
Для повышения качества авторубрицирования в системе реализованы развитые возможности предобработки поступающих документов. В частности, проводится контроль орфографии, используется фильтр стоп-слов, осуществляется нормализация регистра и др. При выполнении поисковых запросов можно подключать тезаурус (словарь синонимов). Выборка документов производится с помощью как контекстного поиска, так и OLAP-анализа.


(www.analyst.ru)
Программа TextAnalyst от НПИЦ “МикроСистемы” является инструментом для анализа содержания текстов, смыслового поиска информации, формирования электронных архивов. Она также способна строить семантические деревья, но не по объектам, а по отдельным статьям, в результате чего создается смысловой портрет каждого текста на основе количества упоминаний и близости встречаемости различных значащих, по мнению программы, слов. В TextAnalyst есть также модуль, генерирующий реферат текстового документа. Программа не предназначена для потоковой обработки материалов СМИ, но может брать с диска файлы в формате txt и rtf и после анализа текста сохранять результаты в отдельном файле.


(www.neurok.ru/products)
Semantic Explorer - это клиент-серверный программный комплекс компании “НейрОК”. Клиентский интерфейс Semantic Explorer ориентирован на работу с семантикой документов и поиск по смысловым и тематическим ассоциациям. В отличие от TextAnalyst семантическая карта строится не по отдельным документам, а по их базе. На такой карте (карте Кохонена) каждый документ имеет свое уникальное положение. Причем близкие по смыслу документы располагаются рядом.
Большое внимание компания уделяет технологиям Интернет-агентов, которые призваны производить в Интернете “осмысленный” поиск. Если связать таких агентов в единую сеть, то можно создать распределенное индексное поле обработанной ими совместно информации, существенно облегчающее поиск.


(research.metric.ru)
Компания “Гарант-Парк-Интернет” уже не первый год ведет исследования в области интеллектуального поиска и тематического анализа текстовых документов. Исследователи предлагают линейку продуктов, одним из которых является TopSOM, базирующийся на технологии нейронной сети Кохонена.
Все множество документов разбивается на небольшое количество классов схожих по содержанию документов. Эти классы отображаются на плоскость таким образом, что близкие классы соответствуют близким областям плоскости. Задача нелинейного отображения многомерного семантического пространства в пространство малой размерности решается нейросетевым алгоритмом.
Такое отображение позволяет наглядно представить тематический состав большой (десятки тысяч текстов) коллекции документов в целом и помочь пользователю сориентироваться в океане информации.


(www.convera.com/press/webinar/comm.html)
Информационно-поисковая система Convera RetrievalWare - продукт американской компании Convera Technologies, но мы все же включили ее в обзор отечественного рынка, так как российская компания “Весть-МетаТехнология” не только локализовала интерфейс и документацию, но и адаптировала поисковый механизм системы к работе с русскоязычными документами. Для этого была составлена семантическая сеть словаря русского языка, которая содержит около 100 тыс. слов и идиоматических выражений и более 350 тыс. связей между ними, подключена библиотека морфологического анализа, внесены изменения в ядро оригинальной системы. А компания “Одеон”, авторизированная для работы на рынках СНГ, в 2002 г. завершила существенную переработку механизма поиска и семантико-морфологического разбора. В частности, новый механизм позволяет при поиске и анализе текста создавать семантическую сеть не только из синонимов, но и антонимов, морфем, вариантов произношения, сленга, а также выделять сущности и передавать результаты в СУБД. Новый словарь содержит более 1,2 млн. взаимосвязанных словоформ.
RetrievalWare представляет собой промышленное средство полнотекстового и атрибутивного поиска не только в текстовых архивах, но и в массивах графической и видеоинформации. Кроме того, новый модуль преобразования речи в текст позволяет в реальном времени индексировать входной аудиопоток для дальнейшего анализа и поиска.


IntellSoft Vision (www.intellsoft.ru/vision)
Компания IntellSoft предлагает руководителям верхнего уровня программу IntellSoft Vision, помогающую им в выборе объектов, представляющих интерес, и в реализации бизнес-стратегий. Программа обеспечивает:
- ситуационно-аналитический мониторинг конъюнктуры;
- интеллектуальный анализ данных;
- интерактивный поиск решений на базе моделирования;
- маневрирование ресурсами;
- оценку тенденций материалов СМИ;
- интеграцию с внешними информационными ресурсами.
Решение, созданное для Министерства культуры РФ с помощью инструментария IntellSoft Vision, является надстройкой над индустриальными OLAP-хранилищами, консолидирующими информацию, поступающую от ведомственных структур и из многочисленных независимых внешних источников.

Проект ВААЛ (www.vaal.ru)
В рамках проекта ВААЛ созданы две системы контент-анализа: ВААЛ-2000 для психолингвистического исследования русскоязычных текстов и Vaal Toolbox для аналогичных исследований англоязычных источников информации. ВААЛ-2000 позволяет воспользоваться предустановленными аналитическими моделями или создать собственные. В его распоряжении, например, методика психоанализа, критерии которого оценивают наличие в тексте слов, относимых к сексуальной символике (по З. Фрейду), архетипам (по К. Юнгу) и выражению агрессивности. А эмоционально-лексический анализ позволяет выявить эмоциональную насыщенность прямой речи по 15 наиболее значимым для российской культуры критериям.
Эта программа применялась в исследовании, призванном ответить на вопрос: “В чем причина того, что СССР исчез с политической карты мира?”. Анализу были подвергнуты 1000 стихотворений 200 российских поэтов XX века. Выявленные динамические зависимости аффиляции (потребности в социальной поддержке) и фрустрации (состояния подавленности и тревоги, возникающего у человека в результате крушения надежд) показывают, что минимум аффиляции и пик фрустрации приходятся как раз на начало 90-х годов прошлого века.

Выводы и перспективы

Многие из перечисленных продуктов снабжены собственными или встроенными авторубрикаторами и аннотаторами, а это означает, что указанные инструменты постепенно становятся стандартными для информационно-аналитических систем. Настоятельной необходимостью для такого класса программ является умение работать с тезаурусом (словарем синонимов) и учитывать морфологию языка: без этих функций при поиске легко пропустить нужные документы. Поскольку результаты исследований чаще всего передаются высокому руководству, не склонному сидеть за компьютером, не следует забывать и об удобных средствах генерации бумажной отчетности.
Желая оставаться в русле основных тенденций развития ИT-индустрии, многие разработчики переводят свои клиент-серверные приложения на Интернет-платформы. Все перечисленные в обзоре продукты, кроме “Астарты” и TextAnalyst, имеют Web-оболочку и используют для передачи данных TCP/IP. Очень желательным для заказчика свойством сложных систем является их модульность, позволяющая легко строить необходимые (нередко более дешевые) конфигурации.
И последнее пожелание разработчикам аналитических систем. Доверяя в рамках проведения контент-анализа компьютеру количественные оценки, не стоит забывать предоставлять человеку возможность ручной качественной оценки исследуемых текстов, помогающей фиксировать и структурировать новый слой знаний для последующего его анализа.
Но настоящий прорыв в обработке материалов СМИ будет достигнут тогда, когда сами авторы станут сопровождать текст некоторой информационной структурой, описывающей смысл статьи и “знания”, в ней изложенные, другими словами, когда возобладает подход, основанный на разделении данных, характеризующих содержание, представление и смысловое значение. Адептом этого подхода является один из основателей современного Интернета Тим Бернерс-Ли. Он предлагает объединить документы подобного рода в единую сеть знаний, которая будет называться Semantic Web. Разрабатываются и языки представления знаний - XML, RDF, OIL, DAMP и др. Но обсуждение этой темы выходит за рамки данной статьи.

Ежедневно средства массовой информации и социальные медиа (блоги, форумы, социальные сети) публикуют гигабайты текстовой информации и медиа-файлов. Ориентироваться в этом информационном пространстве сложно, но крайне необходимо, так как много информации касается непосредственно Вашей деятельности. Цель мониторинга СМИ и социальных медиа - помочь Вам собрать только интересующую Вас информацию – в полном объеме (!) и без информационного шума (!). Принцип мониторинга прост:

  • Собирается по возможности вся информация, из самых различных источников;
  • Из нее отбирается только нужная информация, по заданным темам;

Это похоже на персональную газету: Вы открываете утром газету, а там только те новости, которые Вам интересны, и ничего лишнего. Вся информация структурирована и разложена по полочкам.

Где используется мониторинг и анализ СМИ?

Мониторинг СМИ – инструмент актуальный и востребованный в наши дни, но далеко не новый. Известно, что залогом успешной политики Уинстона Черчилля во время Второй мировой войны стала его информационно-аналитическая деятельность. Он получал экземпляры всех европейских газет еще до их выхода в печать, и каждое утро начинал с изучения газет. Если он не успевал ознакомиться с новостями самостоятельно, подчиненные составляли для него дайджест с самой важной политической информацией, которую он анализировал и учитывал в стратегическом планировании. Современный мониторинг СМИ выполняет ту же функцию – он позволяет оперативно реагировать на события, освещаемые СМИ, и принимать решения, основанные на полной информированности.

Мониторинг и анализ СМИ применяется в совершенно разных областях. Компании и крупные коммерческие структуры используют мониторинг СМИ для анализа внешней среды: бренд-мониторинг (что и как говорят о компании), конкурентная разведка (что говорят о деятельности конкурентов), мониторинг госзакупок (какие государственные тендеры разыгрываются в этой отрасли), мониторинг изменений законодательства (какие новые законодательные акты касаются этой сферы) и многие другие темы, мониторинг которых необходим малому и крупному бизнесу для построения успешной стратегии развития. Государственные структуры и бюджетные организации тоже активно занимаются мониторингом и анализом информации: например, в префектурах некоторых округов г. Москвы стоят системы для мониторинга новостей о происшествиях в округе и для систематизации электронных обращений граждан.

Типы мониторинга и анализа СМИ

Со времен Второй мировой войны технологии мониторинга значительно шагнули вперед. Если во времена Черчилля использовался ручной мониторинг, то теперь существуют системы автоматического мониторинга, которые быстро обрабатывают и структурируют огромные массивы информации. Их преимущество в полноте охвата источников и «тотальном» анализе информации, то есть при автоматическом мониторинге практически исключается пропуск важных новостей. Ручной мониторинг по-прежнему широко распространен, хотя обычно «ручная» подборка информации все равно основывается на предварительной автоматической обработке с помощью системы, так как полностью ручной мониторинг малоэффективен.

Типы мониторинга различаются по источникам для сбора информации: мониторинг может быть с полным или частичным охватом источников. Основные источники информации:

  • печатная пресса
  • ТВ и радио
  • Интернет-ресурсы:
    • Новостные и тематические сайты
    • RSS-ленты
    • Блоги
    • Форумы
    • Социальные сети

95% информации дает мониторинг Интернет-ресурсов, так как сейчас абсолютное большинство мировых СМИ публикует информацию в Интернете. Преимуществами мониторинга Интернета является минимальный интервал между опубликованием новости и доставкой ее пользователю, а также при необходимости охват большого количества иностранных СМИ и социальных медиа. Но в то же время все равно существуют 5% информации, которые не публикуются в сети Интернет, обычно это региональные СМИ, освещающие информацию локального значения.

Некоторые полнофункциональные системы мониторинга (например, система компании «ЛКС Аналитика»), устанавливаемые на технической базе заказчика, кроме описанных источников предлагают подключение внутренних ресурсов заказчика: электронная почта, ftp и файловая система, что позволяет безопасно обрабатывать и структурировать большие объемы внутренней информации.

Выделяется целая группа сервисов мониторинга (IQBuzz, YouScan, Babkee и др), которые ориентированы только на мониторинг социальных медиа – блоги, форумы, социальные сети и сайты отзывов. Данные сервисы используются для отслеживания упоминаний о брендах и построения эффективной PR-стратегии компании. При выпуске нового продукта компания может точно отслеживать реакцию потребителей на этот продукт и своевременно корректировать стратегию его продвижения на рынке.

Мониторинг СМИ различается по типу конечного продукта, который получает клиент. Существуют два основных варианта:

  • Дайджест (сводка новостей в текстовом формате)
  • Система мониторинга и анализа СМИ (программа или online-сервис, позволяющие самостоятельно анализировать информацию)

Дайджесты обычно содержат информацию, автоматически собранную системой мониторинга и представленную в виде отчета, который клиент получает по электронной почте. Это удобный и недорогой способ быть в курсе событий в своей сфере и при этом тратить на просмотр новостей 5 минут в день. Стоимость подписки на дайджесты варьируется от 5 до 20 тыс. рублей в месяц. Некоторые компании за дополнительную плату предлагают в формате дайджеста не только мониторинг, но и анализ информации, приведенной в дайджесте.

Система мониторинга СМИ позволяет осуществлять полноценную информационно-аналитическую деятельность. Она автоматически отслеживает появление новой информации на заданные темы 24 часа в сутки. Затем пользователь может самостоятельно анализировать структурированную информацию с помощью различных функций: поиск по базе новостей, графический и статистический анализ, анализ фактографической информации (поиск людей, организаций, формирование досье) и другие функции, которые варьируются в зависимости от конкретной системы. Доступ к online-сервису для мониторинга СМИ в среднем может стоить от 25 до 50 тыс. рублей/месяц, а полная стоимость стационарных систем мониторинга и их индивидуальной настройки под большие аналитические отделы начинается от 500 тыс. рублей, а чаще всего исчисляется миллионами.

Следует различать два основных типа мониторинга – постоянный и оперативный . Постоянный мониторинг – это ежедневный отбор информации по определенным темам. Оперативный мониторинг – это решение срочных аналитических задач и мониторинг сообщений по новым темам. Часто оказывается невозможным ограничиться одними и теми же темами для мониторинга: например, появление нового конкурента, новой сферы деятельности компании, какое-то чрезвычайное происшествие, – требуют быстрого и полного анализа. Очевидно, что оперативный мониторинг и анализ информации возможен только в рамках полнофункциональных систем («Метапоиск» - приложение к системе «ЛКС Аналитика»), но не дайджестов, которые предлагают информацию исключительно по заданным темам.

Еще одним важным отличием разных услуг и продуктов по мониторингу СМИ является уникальность тем для мониторинга: например, ряд компаний предлагает готовые дайджесты по стандартным темам (нефтяная промышленность, химическая промышленность, банки, экология, и пр.). Такие дайджесты собираются по ключевым словам: например, для нефтяной промышленности ключевыми словами будут нефть, нефтяной, нефтяник и пр. Но более эффективными для информационной аналитики являются уникальные темы для мониторинга, т.к. мониторинг должен настраиваться индивидуально и полностью отвечать интересам заказчика. Причем стоит учесть, что сложность и уникальность темы для мониторинга практически не влияет на стоимость конечного продукта, готовый дайджест и дайджест по индивидуальным темамбудет вписываться в те же рамки – от 5 до 20 тыс. рублей/месяц.

Что такое эффективный мониторинг и анализ СМИ?

Главное правило – эффективный мониторинг должен отвечать поставленным задачам! Чтобы подобрать правильный мониторинг, нужно ответить на ряд вопросов:

1) Является ли мониторинг СМИ Вашей основной деятельностью? На какие временные и трудовые затраты вы рассчитываете?

Если Вам надо быть в курсе последних событий в Вашей сфере, то достаточно получать дайджесты по интересующим Вас темам. Если же у Вас в штате есть хотя бы один сотрудник, непосредственно занятый информационно-аналитической деятельностью, то для большей результативности ему стоит предоставить инструмент для мониторинга. Если же организация располагает целым аналитическим отделом, то необходимость в мониторинге СМИ с помощью системы еще выше: полнофункциональные системы мониторинга имеют возможность создавать профили для разных пользователей и разграничивать их права в работе с информацией, таким образом, все специалисты будут работать в единой системе, но каждый будет заниматься своей сферой.

2) Сколько и какие темы Вы хотите мониторить?

Определите, насколько уникальны Ваши темы: если кроме состояния отрасли Вам интересны какие-то еще темы, то стоит обратиться в компанию, которая предоставляет индивидуальную настройку мониторинга, тем более это важно, если сама задача мониторинга нетривиальна (например, нужна детальная проработка тем, разделение информации на негативную и позитивную, мониторинг информации на других языках и др.). От количества тем зависит стоимость мониторинга в рамках выбранного продукта.

3) Какие источники Вы хотите мониторить?

Этот вопрос Вам помогут решить в компании, в которую Вы обратитесь за услугами мониторинга. Но нужно иметь в виду, что подбор источников зависит от тем для мониторинга. Для конкурентной разведки и бренд-мониторинга подходят блоги, соцсети и специализированные сайты отзывов (отзыв.ru, yandex.market). Для мониторинга политических тем в качестве источника следует брать центральные и региональные СМИ, а также блоги. Если тема специализированная, то стоит обратить внимание на мониторинг тематических форумов, где можно найти множество уникальной информации по теме. То есть в каждом конкретном случае набор источников, как и набор тематик, должен быть индивидуален, чтобы не собирать лишнюю информацию, в которой потенциально может попасться «мусор». На цену услуг мониторинга может влиять количество источников, а также их уникальность: обычно у компаний уже есть база источников, но если Вам требуется подключить какие-то дополнительные, не входящие в уже сформированную базу источники, тогда стоимость мониторинга может значительно увеличиться.

4) Какой тип мониторинга – постоянный или оперативный – Вам нужен?

Если Вам достаточно один раз заданных тематик, то подойдет постоянный мониторинг, который предоставляют все компании. Инструменты для оперативного мониторинга, которые позволяют задавать свои темы для мониторинга и быстро анализировать поступающую информацию, - разработка, имеющаяся не у каждой компании. Поэтому существует некоторый промежуточный вариант, по которому пользователь может при необходимости вносить изменения в состав исходных тематик, а компания, предоставляющая услуги мониторинга, за несколько дней добавляет новые темы для мониторинга.

Итоги и цены

Итак, в пределах выбранного продукта (дайджеста или полнофункциональной системы мониторинга СМИ) стоимость услуг будет варьироваться в зависимости от следующих причин:

  • Количества тематик и источников
  • Уникальности тематик и источников
  • Наличия инструментов для оперативного мониторинга

Но при выборе услуг мониторинга и анализа СМИ всегда помните: мониторинг не должен оцениваться по шкале «дорогой» - «дешевый», главное в мониторинге – его эффективность. И эффективность зависит не от цены, а от того, насколько индивидуален подобранный тип мониторинга. Только при точной настройке мониторинга Вы сможете опираться на собираемую информацию в принятии стратегически важных решений.

Как известно, информация – важный ресурс любой деятельности, обладание которым дает серьезное преимущество. Учитывая, что сегодня материалы бесконечно генерируются и распространяются через самые разные каналы, обработка большого потока данных становится критичным и обязательным условием успешной деятельности. Особенно, если речь идет о PR, а поддержание конкурентоспособности через управление медиа-полем вокруг компании – ваша прямая обязанность.

Оперативного мониторинга текущей ситуации уже недостаточно, необходимым становится качественное изучение смыслов и контекстов, которые не только представляют картину настоящего, но дают основание для прогнозирования. Справиться с растущим объемом информации помогают другие основные ресурсы – время и деньги. Именно сроками, задачами и бюджетом будет определятся оптимальный способ мониторинга и анализа данных.

В этом обзоре инструментов поиска релевантных данных мы попробуем разобраться существует ли золотая середина между быстро/дешево/качественно.

Печатные издания

Печатные издания, пожалуй, одни из самых трудоемких ресурсов для сбора и обработки. Выбор инструмента их мониторинга во многом зависит от количества времени, которым вы располагаете при поиске, и имеющегося бюджета.

Бесплатные инструменты подразумевают методичный ручной поиск в сети подходящих ресурсов и публикаций. В этом помогут:

  • Электронные архивы изданий (к сожалению, они есть далеко не у всех газет и журналов).
  • Расширенный поиск по источнику на базе систем Яндекс и Google (подойдет лишь в том случае, если нужная периодика дублируется в сети).

Ручной поиск становится необходим, когда качественная составляющая анализа преобладает над количественной или поиск является разведывательным. Тогда при меньшем объеме информации в результате получается содержательное описание ситуации или объекта, которое может стать основной для будущего глубинного анализа.

В каких же случаях можно/нужно/удобно использовать бесплатные способы мониторинга:

  • знакомство с определенной темой, проверка адекватности поискового запроса, подготовка к более глубокому по охвату и проникновению анализу;
  • решение краткосрочных/текущих задач, которые покрывают малые периоды времени;
  • поиск по конкретному ресурсу/изданию/источнику.

Альтернативным, но уже не бесплатным, вариантом поиска по печатным и прочим изданиям выступают электронные библиотеки.

Это эффективный профессиональный инструмент, предоставляющий доступ к полнотекстовым публикациям из сотен изданий и ресурсов одновременно. Такие базы в автоматическом режиме собирают и хранят информацию по множеству СМИ в России и мире. Доступ для постоянной работы в подобных системах платный, но есть возможность получить тестовый аккаунт - правда, с ограниченным функционалом.

Однако, этого будет достаточно для просмотра простых запросов и быстрого, ознакомительного анализа небольшого массива данных.

К наиболее популярным электронным базам СМИ на российском и зарубежных рынках относятся:

Электронные СМИ и социальные сети

Электронные СМИ и социальные медиа имеют свою аудиторию и функциональную направленность. На подобных площадках пользователи дают оценки и высказывают суждения, которые сложно получить «формальными методами» (например, опросами).

Ценность социальных медиа состоит в стихийно создаваемых дискуссиях вокруг объекта, которые умелый специалист может модерировать и направлять в русле актуальных PR-целей. Для сбора и анализа таких данных тоже существуют бесплатные и бюджетные инструменты.

Бесплатные инструменты мониторинга социальных медиа

Яндекс.Блоги . Сервис позволяет выполнить поиск ключевого слова/объекта по блогозаписям и комментариям к ним. Поиск настраиваемый. Есть возможность задать область поиска (оставив только блоги в целом, или блогозаписи, либо лишь комментарии в блогах), можно указать имя блогера, название сообщества, а также местоположение автора и период поиска.

Google Trends . Сервис, что логично, основывается на данных поисковой системы Google и показывает, как часто пользователи ищут определенный объект/словосочетание по отношению к общему объему поисковых запросов во всем мире. Результаты поиска отображаются простыми и понятными графиками, на которых можно увидеть не только динамику роста/снижения количества упоминаний интересующего нас объекта, но и распределение популярности запроса по регионам, городам и языкам.

Платные системы мониторинга социальных медиа

Платные системы мониторинга в автоматическом режиме собирают данные по соцсетям и блогам, предлагая в качестве результата сводную матрицу сообщений, с заданными параметрами (тональность, география, авторы, ссылки на записи, количество откликов пользователей– репостов и лайков).

На российском рынке к таким системам, например, относятся:

Каждая система проводит мониторинг и анализ по похожим алгоритмам, но глубина охвата ресурсов у всех разная. Сервисы не идентично охватывают форумы и отзывы, из-за этого релевантность финальной выдачи может варьироваться. Отдельно стоит отметить, что автоматический мониторинг может допускать ошибки в качественных оценках сообщений (например, указание тональности сообщений), что приводит к дополнительной ручной перепроверке параметров.

Важно понимать, что при автоматическом поиске по блогам, в выдачу попадают только открытые для поисковиков сообщества и профили. Закрытые группы и профили не индексируются поисковиками и не попадают в платные системы мониторинга. К другим ресурсам, которые также можно отсматривать только вручную, относятся и комментарии к редакционным материалам, отраслевые форумы, отзывы в интернет-магазинах и не охваченные автоматическими системами профили пользователей Facebook.