TALISMAN

Фреймворк для анализа данных о людях, сообществах, продуктах и организациях. Основан на современных методах машинного обучения, компьютерной лингвистики, анализа сложных сетей и обработки больших данных.

Возможности

Работа Talisman базируется на результатах актуальных научных исследований. В основе большинства алгоритмов лежат методы машинного обучения с учителем, работающие с помощью упрощенного получения размеченных выборок большого размера. Для успешной работы фреймворка была разработана специализированная система разметки, сочетающая два подхода: активное обучение и краудсорсинг. Точность и полнота алгоритмов решения прикладных задач основаны на понимании фундаментальных принципов развития сложных сетей.

Анализ любых больших данных

В том числе, корпоративных и новостных, а также информации из социальных сетей (Вконтакте, Facebook, Twitter, Instagram, Одноклассники, Youtube, LinkedIn и др.), блогов (LiveJournal), открытых каналов мессенджера Telegram и ресурсов Dark web. Для проведения анализа Talisman может взаимодействовать как с оригинальной технологией сбора данных ИСП РАН (ISP Crawler), так и со внешними сборщиками.

Семантический анализ текстов на русском и английском языках с использованием собственной платформы Texterra (входит в Единый реестр российского ПО)

• Скорость полного разбора текста ∼13 600 слов/сек;
• Уникальная для русского языка работа с концептами (более 7 миллионов понятий);
• Масштабируемость как по скорости обработки текста, так и по объему знаний (с помощью Apache Ignite и оригинальной облачной технологии ИСП РАН Big Data Open Lab);
• Построение базы без привлечения экспертов (автоматическое пополнение с помощью Wikipedia, MediaWiki, Linked Open Data и др.);
• Высокая точность анализа текста (адаптивность к сленгу, хештегам и ошибкам, анализ эмоциональной окраски и др.).

Получение отчетов по объектам мониторинга в течение нескольких минут после публикации информации

Talisman использует технологии анализа больших данных стека Apache Hadoop и эластичной масштабируемости системы с применением оригинальной облачной технологии ИСП РАН (Big Data Open Lab).

Анализ больших графов из сотен миллионов узлов

В частности, автоматическое построение графов распространения информации с определением ролей: первоисточник, распространитель, лидер мнения, читатель.

Автоматическая группировка сообщений в информационные сюжеты

Составление карты всех обсуждаемых тем в информационном пространстве с учетом перетекания между различными ресурсами.

Выявление истинных параметров пользователей соцсетей с помощью интеллектуального анализа данных

Уточнение пола, возраста (с точностью до года), образования, семейного положения, региона проживания на основе анализа профилей и активности пользователей (расширяемый список).

Продукты

На основе фреймворка Talisman разработаны два продукта, предназначенные для коммерческого использования

ЦЕЛИ И ЗАДАЧИ

Talisman нацелен на решение широкого ряда типовых задач для создания успешных PR-стратегий, оптимизации HR-менеджмента, повышения уровня безопасности в компании, а также для проведения многоцелевого мониторинга ситуации в медиапространстве.

Выявление групп по интересам

Определение целевой аудитории (как в маркетинговых целях, так и при формировании политических программ), выявление точек социального напряжения, злободневных проблем с наибольшим числом недовольных и т. д.

Оптимизация управления персоналом

Эффективный подбор сотрудников, верификация данных, помощь в разработке систем мотивации на основе текущих и долговременных интересов, выявление скрытой деятельности и скрытых связей, а также мониторинг утечек и разглашения внутренней информации.

Выяснение общественного мнения

об организациях, людях и товарах.

Решение задач в области репутационного менеджмента

в частности, выявление причин недовольства сотрудников и клиентов.

Выявление информационных кампаний, манипулирующих мнением целевой аудитории

а также определение аудитории, на которую направлена кампания.

Определение ключевых трендов

в частности, для прогнозирования эффективности интернет-рекламы.

Комплекс технологий Talisman разработан в Институте системного программирования им. В.П. Иванникова Российской академии наук (ИСП РАН).

Сферы деятельности Института

Анализ и обработка больших объемов данных

Семантический анализ текстов

Технологии информационного поиска

Облачные вычисления

Операционные системы

Компиляторные технологии