bigpo.ru
добавить свой файл
1 2 ... 22 23


ОМСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ


На правах рукописи


Земсков Илья Аркадьевич


МОДЕЛИРОВАНИЕ МОНИТОРИНГА

ИНФОРМАЦИОННОГО ПОЛЯ INTERNET


05.13.11 – Математическое и программное обеспечение вычислительных
машин, комплексов и компьютерных сетей


ДИССЕРТАЦИЯ

на соискание ученой степени

кандидата технических наук


Научный руководитель

д.ф.-м.н., профессор

А.К. Гуц


Омск – 2005

Оглавление

Введение 3

Глава 1. Анализ систем мониторинга информационного
поля Internet 8


Глава 2. Моделирование системы мониторинга 27

Глава 3. Реализация программного комплекса
имитационного моделирования систем мониторинга 44


Глава 4. Пример использования разработанного комплекса 102

Заключение 124

Литература 127

Приложение 1. 137

Приложение 2. 141

Приложение 3. 149

Приложение 4. 158

Приложение 5. 160

Приложение 6. 169

Приложение 7. 177



Введение

Современные научные, образовательные центры, которые построили развитые локальные («внутрикорпоративные») компьютерные сети с постоянным выходом в Internet, имеют беспрецедентную возможность быстро и сравнительно дёшево знакомить региональное и мировое сообщество с результатами своей деятельности. Для этого им достаточно создать внутри своей сети один или несколько Web-серверов, на которых осуществлять электронную публикацию всех необходимых сведений. По такому пути пошли, например, в таком знаменитом научно-образовательном центре, как Стэнфордский университет (Stanford University), список серверов и сайтов которого содержит несколько сотен ссылок (http://www.stanford.edu/home/atoz). Но со временем объём опубликованной на всех Web-серверах информации становиться настолько большим, что посетителям становится трудно ориентироваться в получившемся сегменте информационного поля, а значит трудно находить путь к требуемым сведениям. Однако, решая внедрить программный комплекс, который будет реализовывать функции поисковой системы (ПС), владельцы сегмента информационного поля сталкиваются с многочисленными проблемами выбора.

Если осуществляется выбор готового продукта из большого количества коммерческих и свободно распространяемых программных комплексов ПС, то основной проблемой является отсутствие объективной (отличной от рекламных «фактов») информации по каждому рассматриваемому варианту (не наблюдается практика публикации числовых данных, которые характеризуют сегменты информационного поля и эффективность внедрения какой-либо системы). Поэтому потребности практики обуславливают необходимость разработки программных средств, которые позволят относительно легко (при минимальных требованиях) получить данные для объективного сравнения вариантов поисковых систем или некоторых стандартных модулей поисковых систем.

Если же ведётся самостоятельная разработка, то основной проблемой является выбор наиболее эффективных алгоритмов, которые будут реализовывать основные модули ПС. Эта ситуация усугубляется тем, что в Internet присутствует большое количество публикаций (для начала можно обратиться к докладам на международных ежегодных специализированных конференциях: http://www2003.org/, http://www.iadis.org/icwi2003), в которых предлагаются методы (возможно очень эффективные) совершенствования различных аспектов функционирования ПС. Причём может получиться так, что после изучения описаний нескольких алгоритмов одного и того же модуля разработчики формулируют свой алгоритм (отличный от всех известных ранее или некую «компиляцию» выгодных качеств чужих алгоритмов). Чтобы окончательно убедиться в перспективности того или иного алгоритма (и тем самым осуществить выбор) логично обратиться к методам имитационного моделирования и осуществить предварительное исследование эффективности каждого из альтернативных алгоритмов. Однако в проанализированных работах наблюдается явная нехватка не только готовых моделей, но и подходов к их построению и программной реализации.

Цель работы состоит в разработке моделей и программного комплекса на их основе, позволяющих получить данные для проведения исследований относительной эффективности функционирования различных вариантов системы мониторинга.

Основные задачи работы включали:

  • разработать классификацию существующих стратегий мониторинга информационного поля Internet;

  • выявить набор критериев эффективности, которые могут охарактеризовать любой вариант системы мониторинга;

  • разработать математическую модель процесса мониторинга;

  • разработать имитационные модели системы мониторинга;

  • разработать программный комплекс, который предназначен для проведения дискретно-событийного имитационного моделирования систем мониторинга и который допускает быструю модификацию при исследовании непредусмотренных вариантов системы;

  • получить экспериментальное подтверждение практической применимости разработанного программного комплекса.

Методы исследования. При решении поставленных задач в работе использованы элементы математического и имитационного моделирования, а также методы и средства объектно-ориентированного программирования, баз данных.

Научная новизна. К новым результатам диссертации можно отнести:

  • предложенную математическую модель процесса мониторинга информационного поля Internet;

  • предложенную сенсорную технологию осуществления мониторинга;

  • разработанный программный комплекс имитационного моделирования системы мониторинга сегмента информационного поля Internet (в Отраслевом фонде алгоритмов и программ получено свидетельство о регистрации разработки №4255 от 24.01.2005);

  • применение разработанного программного комплекса для имитационного исследования нескольких вариантов системы мониторинга.

Практическая ценность работы заключается в возможности использования полученных научно-технических результатов при проектировании, эксплуатации, научном исследовании систем мониторинга в задачах, требующих относительного сравнения альтернативных алгоритмов и стратегий мониторинга.

Апробация работы. Результаты работы были представлены на следующих научных конференциях:

  1. X Всероссийской научно-методической конференции «Телематика’2003» (Санкт-Петербург, 2003).

  2. VI Всероссийской научной конференции молодых ученых и аспирантов «Новые информационные технологии. Разработка и аспекты применения» (Таганрог, 2003)

  3. IV Всероссийской конференции молодых ученых по математическому моделированию и информационным технологиям (Красноярск, 2003)

  4. Образование. Экология. Экономика. Информатика. VIII Международной конференции "Нелинейный мир" (Астрахань, 2003).

  5. Всероссийской научной молодежной конференции «Под знаком «Сигма» (Омск, 2003)

  6. XLI Международной научной студенческой конференции «Студент и научно-технический прогресс» (Новосибирск, 2003).

  7. VI рабочем совещании по электронным публикациям "El-Pub2001" (Новосибирск, 2001)

Также результаты работы докладывались на семинарах кафедр математического моделирования и кибернетики Омского государственного университета, на семинаре лаборатории сложных систем Омского филиала института математики им. С.Л. Соболева СО РАН, на семинаре научно-исследовательского института интеллектуальных информационных систем Тюменского государственного университета СО РАН и УрО РАН, на семинаре кафедры системного программирования Челябинского государственного университета, на семинаре кафедры системного программирования Южно-Уральского государственного университета.

По результатам выполненных исследований опубликовано 11 печатных и 2 электронных работы (одна на английском языке).

Разработанный программный комплекс SimCOSAR, а также полученные с его помощью данные были использованы в процессе проектирования систем мониторинга Web-ресурсов, что подтверждено соответствующими актами о внедрении.


Основные положения, выносимые на защиту:

  • модели системы мониторинга, которые принадлежат двум различным классам в классификации стратегий мониторинга;

  • SimCOSAR - программный комплекс дискретно-событийного имитационного моделирования систем мониторинга;

  • Результаты проведённых имитационных компьютерных экспериментов.

Структура и объём работы. Диссертация состоит из введения, четырёх глав, заключения, списка литературы и семи приложений. Общий объём работы составляет 180 страниц. Библиографический список насчитывает 97 наименований.



следующая страница >>