ИВК Сонет

"ИВК СОНЕТ™" (Информационно-аналитическая Система Обработки Неформализованных Естественных Текстов) позволяет автоматизировать один из самых трудоемких процессов - обработку текстовой информации, ее классификацию, составление тезаурусов, описывающих ту или иную предметную область, производить контент-анализ информационных потоков. Продукт является весомым аналитическим инструментом для широкого круга специалистов (работников пресс-служб, аналитиков, маркетологов, журналистов и др.).

 

Фундамент системы "ИВК СОНЕТ™" - лингвистическая обработка текстовой информации:

  • морфологический анализ - выделяет основы слова, флективные окончания и определяет части речи
  • синтаксический анализ - строит словосочетания из двух и более слов, используя систему языковых категорий, связанных с правилами сочетания слов и построения предложений
  • семантический анализ – производит классификацию, кластеризацию и контент- анализ информации

 

Аналитическая обработка информации в системе "ИВК СОНЕТ™" выполняется в интерактивном (диалоговом) режиме и включает в себя следующие процедуры:

Поиск информации по сложным критериям:

  • по ключевым словам или по их комбинации с использованием булевой алгебры
  • по дате или за период
  • по атрибутам (источник информации, автор, рубрика)

Классификация - систематизация информации по рубрикам с дальнейшим просмотром:

  • списка, сформированного из заголовков сообщений
  • полного текста этих сообщений

Контент-анализ – формирование списка словосочетаний, указывающего на основные проблемные вопросы «вокруг» анализируемого объекта.

Контент-анализ создает информационный портрет объекта исследования по наиболее часто встречающимся словосочетаниям из двух и более слов.

В качестве анализируемого объекта (предметной области для анализа) совсем необязательно должно выступать физическое или юридическое лицо, заранее определенное в каком-либо классификаторе объектов. Предметная область может быть сформулирована динамически оператором-аналитиком в процессе поискового запроса с указанием временного диапазона, названия (номера) рубрики, ключевых слов, источников сообщений и других параметров. Например, в качестве анализируемого объекта может быть некий процесс или событие, происходящее в обществе.

Процедуры, выполняемые ПО «ИВК СОНЕТ™» в автоматическом режиме:
  • первичная обработка информации из разнородных источников
  •       - количество источников: десятки на сервер; скорость обработки входного потока: порядка нескольких тыс. документов в сутки
  •            - поддерживаемые форматы: TXT, HTML, XML, RTF (встроенные средства), DOC, E-MAIL и др. (с использованием программ-конвертеров)
  •            - протоколы извлечения данных: HTTP, возможно использование протоколов FTP, RSS, Atom и др.
  • преобразование полученной информации в единый формат данных
  • ежедневное накопление массива текстов в базе данных информационных сообщений
  • полнотекстовое индексирование сообщений
  • классификация единого входного потока исходной информации (включая морфологический и синтаксический анализ)
Процедуры, выполняемые ПО «ИВК СОНЕТ™» в интерактивном режиме:
  • поиск информации по заданным параметрам
  • кластеризация
  • контент-анализ
  • отслеживание динамики изменения основных понятий, выявленных в процессе контент-анализа (контент-анализ по временным срезам)
  • формирование описаний рубрик (при настройке системы)
 Сферы применения ПО «ИВК СОНЕТ™»:
  • выявление тенденций
  • «информационная разведка»
  • идентификация информационных кампаний
  • анализ действий конкурентов
  • выявление спроса и перспективных направлений
  • изучение рынка
  • другие
Предметные области, где применялось ПО «ИВК СОНЕТ™»:
  • судебная система
  • спорт
  • нефтяной комплекс
  • чрезвычайные ситуации
  • гуманитарная область
  • под индивидуальные требования заказчика могут быть созданы новые предметные области
Пользователи ПО «ИВК СОНЕТ™»:
  • госструктуры
  • силовые ведомства
  • крупные корпоративные структуры
  • общественные организации