IPRI - www.ipri.kiev.ua -  IPRI - www.ipri.kiev.ua -

Аналітіка

Методи і засоби моніторингу, адаптивного агрегування та узагальнення потоків інформації з глобальних комп’ютерних мереж для інформаційно-аналітичної діяльності

Звіт про НДР: 324 с., 94 рис., табл.2, 122 джерел, 3 додатка.

РЕФЕРАТ

Об’єкт дослідження: потоки інформації з глобальних комп’ютерних мереж для інформаційно-аналітичної  діяльності.

Мета роботи: дослідження та розвиток теоретичних і технологічних засад, методів і програмно-технічних засобів моніторингу, агрегування та узагальнення інформаційних потоків великого обсягу у комп’ютерних мережах.

Методи дослідження: математичне моделювання, семантичний аналіз, статистичний аналіз, теорія ймовірностей.

Основні результати:

1. Визначено основні характеристики комп’ютерних мереж (надано визначення інформаційних документальних потоків у глобальних комп’ютерних мережах (ГКМ); побудовано математичну модель інформаційних документальних потоків у ГКМ).

2. Проведено аналіз характеристик наявних мережевих інформаційно-пошукових систем з урахуванням кількісних та якісних характеристик та динаміки інформації, що охоплюється ними, результати якого мають скласти теоретичну базу для створення автоматизованих систем моніторингу, агрегування та узагальнення інформаційних потоків, побудови та ведення різноманітних тематичних інформаційних ресурсів великих обсягів.  Проаналізовано технологічні засади організації метапошукових систем (надано огляд технологічних рішень організації метапошукових систем у масивах документальної інформації (статей, тез, дисертацій, наукових звітів тощо) у глобальних мережах).

3. Розглянуто підходи до адаптації та модифікації методів аналітичної обробки та узагальнення інформації (надано огляди: методів аналітичної обробки та узагальнення документальної текстової інформації з інформаційних потоків та інформаційних сховищ надвеликого обсягу; технологічних рішень організації інформаційних сховищ текстової інформації надвеликих обсягів).

4. Досліджено технологічні засади моніторингу, адаптивного агрегування та узагальнення інформаційних потоків у глобальних мережах (надано огляди: технологій моніторингу інформації з веб-простору у відповідності з інформаційними потребами користувача; технологічних рішень конвертації даних до текстового вигляду (plain text) з інших форматів, що містять у собі текст). Досліджено теоретичні засади організації інформаційних ресурсів та документальних сховищ, а саме формування адаптивного документального сховища для забезпечення науково-аналітичної роботи.

Результати НДР свідчать про можливість та необхідність розвитку методів і програмно-технічних засобів орієнтації в інформаційних потоках великих обсягів, методики інтеграції потоків за визначеними критеріями, методів і засобів змістовного аналізу інформації.

Ключові слова. ІНФОРМАЦІЯ, ІНФОРМАЦІЙНИЙ ПОТІК, МОНІТОРИНГ, ТЕХНОЛОГІЇ АГРЕГУВАННЯ ТА УЗАГАЛЬНЕННЯ ІНФОРМАЦІЇ, ГЛОБАЛЬНІ МЕРЕЖІ, АНАЛІТИЧНА ОБРОБКА ІНФОРМАЦІЇ.

 ЗМІСТ

Перелік скорочень

Вступ

1. Дослідження динаміки та характеристик потоків інформації в глобальних комп’ютерних мережах

1.1. Визначення поняття інформаційного потоку

1.1.1. Якісний опис інформаційних потоків

1.1.2. Формальне визначення інформаційних потоків

1.2. Властивості потоків інформації в глобальній комп’ютерній мережі Інтернет

1.2.1. Урахування процесу старіння інформації

1.2.2. Дослідження властивостей джерел інформації

1.2.3. Дослідження змістовного дублювання документів

1.3 Математичні моделі потоків інформації  в глобальних комп’ютерних мережах

1.3.1. Тематичні інформаційні потоки

1.3.2. Традиційні моделі інформаційних потоків

1.3.3. Логістична модель інформаційних потоків

1.3.4. Змістовні кластери в інформаційних потоках

1.3.5. Емерждентність інформаційних кластерів

1.3.6. Синерггетичний підхід до вивчення  інформаційних потоків

1.3.7. Екстремальні підходи до вивчення  інформаційних потоків

1.3.8. Моделювання інформаційних потоків на базі концепції клітнинних автоматів

1.4. Методи аналізу динаміки характеристик потоків інформації в глобальних комп’ютерних мережах

1.4.1. Інформаційні потоки в інформаційному просторі

1.4.2. Кореляційний аналіз інформаційних потоків

1.4.3. Вейвлет-аналіз

1.4.4. Дисперсійний аналіз – метод DFA

1.5. Методи прогнозування динаміки тематичних інформаційних потоків у глобальних комп’ютерних мережах

1.5.1. Cамоподібність стохастичних процесів

1.5.2. R/S-аналіз

2 ТЕОРЕТИЧНІ І ТЕХНОЛОГІЧНІ ЗАСАДИ МОНІТОРИНГУ ПОТОКІВ ІНФОРМАЦІЇ В ГЛОБАЛЬНИХ КОМП’ЮТЕРНИХ МЕРЕЖАХ

2.1.Огляд технологічних засобів моніторингу потоків  інформації в глобальних комп’ютерних мережах

2.1.1 Поняття моніторингу

2.1.2. Сфери застосування моніторингу

2.1.3. Класифікація існуючих систем моніторингу

2.1.4 Типи моніторингу

2.1.5 Особливості об'єктів моніторингу

2.1.6 Контент-моніторинг інформаційних потоків

2.1.7 Метод контент-аналізу

2.1.8  Засоби моніторингу інформації Інтернет

2.2 Аналіз характеристик документальних мережевих   інформаційно-пошукових систем

2.3. Методи забезпечення доступу до даних моніторингу – концепція інформаційних проксі-серверів

3. Теоретичні та технологічні засади агрегації потоків інформації

3.1 Агрегація  потоків документальної інформації в глобальних комп’ютерних мережах

3.2 Модель агрегації та  розподілу інформації в глобальних комп’ютерних мережах

3.3 Архітектура адаптивного документального сховища корпоративної інформаційно-аналітичної системи

4. Теоретичні засади узагальнення потоків інформації (Text Mining)

4.1. Огляд методів аналітичної обробки та узагальнення інформації. Концепція Text Mining

4.1.1 Пошук знань в інформаційних мережах

4.1.2 Метод контент-аналізу

4.1.3  Основи технології Text Mining як форми пошуку даних в інформаційних потоках

4.2. Методи класифікації та кластерізації документальної інформації

4.2.1. Методи класифікації документальної інформації

4.2.2. Методи кластерізації документальної інформації

5. Теоретичні та технологічні засади мережевої аналітики

5.1. Основні положення теорії складних мереж

5.1.1. Web-простір як складна мережа

5.1.2. Соціальні мережі

5.1.3. Параметри вузлів мережі

5.1.4. Загальні параметри мережі

5.1.5. Виявлення мережевих підструктур

5.1.6. Шлях між вузлами

5.1.7. Коефіцієнт кластеризації

5.1.8. Еластичність мережі

5.1.9 Структура співтовариства

5.1.10. Модель слабких зв'язків

5.1.11. Малі світи 

5.1.12. Перколяція

5.1.13. Топологія WWW

5.1.14. Новинний Web

5.1.15. Візуалізація

5.2. Визначення репутації вузлів мереж

5.2.1. Алгоритм HITS

5.2.2. Алгоритм PageRank

5.2.3. Алгоритм Salsa

5.3. Архітектура засобів змістовної навігації в інформаційних мережах 

6 Технологічні засади побудови метапошукових систем

6.1. Дослідження можливостей сучасних мережних метапошукових систем

6.2. Архітектура метапошукових систем

6.3. Методологія побудови адаптивного документального інформаційного сховища

6.4. Принципи побудови інтерфейсу користувача документального інформаційного сховища

6.5. Засоби реалізації адаптивної метапошукової системи, інтегрованої з документальним інформаційним сховищем

ВИСНОВКИ

Використана література

Додаток 1. КОРОТКИЙ ГЛОСАРІЙ

ДОДАТОК 2.  МЕТОДИЧНІ РЕКОМЕНДАЦІЇ ЩОДО МОНІТОРИНГУ, АДАПТИВНОГО АГРЕГУВАННЯ ТА УЗАГАЛЬНЕННЯ ІНФОРМАЦІЙНИХ ПОТОКІВ У ГЛОБАЛЬНИХ МЕРЕЖАХ ДЛЯ ЗАБЕЗПЕЧЕННЯ ПІДТРИМКИ ІНФОРМАЦІЙНО-АНАЛІТИЧНОЇ ДІЯЛЬНОСТІ

ДОДАТОК 3. ІНСТРУКЦІЯ КОРИСТУВАЧА СИСТЕМИ  DOC’S BUNDLE 

 Умови отримання звіту:  за договором.

03113, м.Київ, вул. М. Шпака, 2, ІПРІ НАН України.