bigpo.ru
добавить свой файл
1

Лекция №4. Модели данных

4.Лекция №4. Модели данных


Вопросы организации данных в ГИС, в частности, модели структуры данных, форматы, - одна из самых сложных, самых важных и определяющих тем в ГИС.

Выбор способа организации данных в ГИС, в первую очередь модели данных значительно важнее, чем выбор программного пакета поскольку напрямую определяет многие функциональные возможности создаваемой ГИС. Некоторые функции или не реализовываются для определенных типов организации данных, или обеспечиваются очень сложными манипуляциями. Организация данных в ГИС напрямую определяет и применимость тех или иных технологии ввода данных В той же степени от нее зависит пространственная точность представления графической части ин формации возможность получения качественного картографического материала и организации контроля качества карт. В значительной степени способом организации данных в ГИС определяется также быстродействие системы, например, при выполнении запроса или визуализации на экране. Возможность работать с большими объемами данных или точными данными по большим территориям, удобство редактирования и обновления данных, возможности организации многопользовательской работы в режиме редактирования, создания распределенных по сети баз данных - это все тоже связано в первую очередь с организацией данных и уже во вторую - с конкретным программным обеспечением.

Иногда высказывается мнение, что модели данных - слишком абстрактная категория для массового пользователя, а форматы данных - дело только программистов. Постараемся показать что это не совсем так. Определенное представление о существующих способах организации данных в ГИС, думается, должен иметь и массовый конечный пользователь, и тем более руководитель проекта, технолог, специалист, занятый контролем качества и сертификацией цифровых карт наконец, даже руководитель более высокого уровня участвующий в решении стратегических вопросов внедрения и развития ГИС технологии.

Ошибки в выборе модели данных могут сказаться решающим образом на возможности выполнения ГИС требуемых функции, расширения их списка в будущем, на успешности проекта с экономической точки зрения и, что очень важно, могут определить ценность накапливаемых баз данных пространственной информации в долговременной перспективе. Обмен данными и даже смена пакета, если применяемые модели данных близки, обычно не очень большая проблема. В других случаях может оказаться так, что объем труда, необходимого для конвертирования существующих данных, сопоставим с затратами на повторный ввод информации или даже превышает их. Все это несмотря на то, что проблемы формальной конвертации форматов файлов обычно не существует. Так что понятия «защита инвестиций, вложенных в создание ГИС» и «модель данных» не столь далеки друг от друга, как это кажется на первый взгляд.

Для рассмотрения проблемы нужно попытаться разобраться в том, что определяет организацию пространственных данных в ГИС, какими терминами она описывается.
^

4.1.О моделях данных, структурах моделей данных и форматах файлов.


Модель данных - это концептуальный уровень организации данных, логический уровень. Если говорить о компьютерных моделях данных, а нас только они здесь и интересуют, то это всегда цифровое представление данных. Не только числовые характеристики, но и информация положения, и пространственная геометрическая (положения и формы), и пространственная топологическая (взаиморасположение и связи объектов), и описательная словесная (неколичественная) информация всегда в компьютерных моделях данных присутствуют в числовой форме. Термины типа "полигон", "полилиния", "дуга", "идентификатор", "таблица" как раз относятся к этому уровню, равно как и понятие "слой", "тема", "способ индексирования". Это более уровень пользователя и администратора базы данных, а также и разработчика систем, и касается все это не столько программирования, сколько некоторых разделов математики, с одной стороны, и соотношения элементов модели данных с действительными объектами реального мира, с другой. Основной решаемый на этом уровне вопрос - это вопрос степени адекватности модели данных решаемой задаче. Достаточно ли точно, с сохранением всех ли нужных связей выбранная модель данных позволит смоделировать в компьютере реальную ситуацию? И к рассмотрению проблем на этом уровне обязательно следует привлекать пользователя - специалиста по конкретной задаче, конкретному применению ГИС.




Уровни организации данных


Более детальный уровень рассмотрения организации данных часто называется структурой модели данных. Здесь уже фигурируют и математические и программистские термины, такие, как матрицы, списки, системы ссылок, указатели, механизмы сжатия информации, а основные вопросы, рассматриваемые на этом уровне - это вопросы эффективности в смысле экономии места и быстродействия, то есть уже чисто внутренние компьютерные вопросы эффективности.

На следующем по детальности уровне организации данных мы уже имеем дело со структурой файлов данных и их конкретными форматами. Это уже вопросы размещения информации в файле - что вынесено в его заголовок, и как он организован, что в какой последовательности и какими формами представления чисел записано в этих файлах. Это уровень уже чисто программистский, рядовому конечному непрограммирующему пользователю вникать в этот уровень обычно уже нет необходимости совсем. Другое дело, что назначение конкретных файлов в определенных структурах данных, возможности и ограничения по использования конкретных форматов файлов знать полезно.

Ну, и наконец, следует сказать об уровне организации конкретной структуры базы данных ГИС, которая уже может быть уникальна для каждого конкретного проекта - какие объекты вносятся в базу данных, как они распределены между слоями (если мы используем принцип послойной организации данных), какие используются классификаторы и т.д. Этот уровень сегодня не является предметом нашего рассмотрения. Разумеется, данная схема весьма условна и не претендует на строгость изложения.

Хотя модели данных, структуры данных - это достаточно абстрактная категория и, может быть, самый сложный и математизированный раздел теоретической геоинформатики, определенное представление об этом должны иметь, на взгляд автора, и конечные пользователи ГИС, а не только системные администраторы и программисты. Тем более это относится к руководителям проекта, технологам, специалистам, занятым контролем качества и сертификацией цифровых карт. Наконец, эта тема важна даже для руководителей более высокого уровня, участвующих в решении принципиальных и стратегических вопросов внедрения и развития ГИС-технологий.

Дело в том, повторим, что выбор тон или иной модели организации пространственных данных - вопрос гораздо более принципиальный, чем выбор конкретного программного пакета в рамках одного типа модели и тем более конкретной компьютерной платформы. Ошибки в решении этого вопроса могут проявиться решающим образом в самой возможности выполнения ГИС требуемых функций, в возможности расширения списка этих функций в будущем, в успешности или неуспешности проекта с экономической точки зрения и, что очень важно - могут определить ценность накапливаемых пространственных баз данных в долговременной перспективе. Будут ли Ваши данные совместимы с другими, будут ли они нужны другим, наконец, не придется ли Вам на каком-то этапе эксплуатации и развития системы бросить все и переходить на принципиально другую систему, поддерживающую другую модель данных, и придется ли Вам при этом отвергнуть весь уже накопленный материал и вводить его заново, или нет - это во многом зависит от правильного ответа на вопрос о выборе способа организации пространственных данных, модели данных. Как известно, обмен данными между двумя разными ГИС и даже полная смена программного пакета - обычно не очень большая проблема, если используемые в них модели данных близки. В других же случаях может оказаться так, что объем труда, необходимого для конвертирования существующих данных сопоставим с затратами на повторный вводи информации или даже превышает их. И это все несмотря на то, что проблемы формальной конвертации форматов файлов обычно не существует. Так что понятия "защита инвестиций, вкладываемых в создание ГИС" и "модель данных" не столь далеки друг от друга, как это кажется на первый взгляд. Такие сугубо практические моменты мы затрагиваем здесь, в разделе, посвященном теоретической геоинформатике, не случайно. Мы хотим подчеркнуть практическую важность этого раздела, касающегося моделей данных. К сожалению, иногда его значение недооценивается. Мы и в следующих разделах книги еще неоднократно будем обращаться к теме организации данных в ГИС и пространственных базах данных, рассматривая этот вопрос и более детально, и более формально, и более практически. Пока же в заключение данного выпуска мы рассмотрим вопрос об организации данных в ГИС в самом общем виде.

Вспомним, что информация о реальном мире частично относится к индивидуализированным объектам, а частично к непрерывно распределенным в пространстве свойствам. Последние можно рассматривать как пространственные поля каких-либо характеристик, числовых или нечисловых. Например, индивидуализированные объекты - дома. Они находятся на некоторой местности, рельеф которой удобно представить себе в виде числового поля - поля абсолютных высот рельефа. Независимо от способа организации информации в нашей ГИС, независимо от того, насколько детально и правильно мы в ней представили рельеф местности, у нас не возникает сомнений, что эта характеристика носит принципиально непрерывный характер - нигде не может быть участка с "никаким" рельефом местности, с отсутствием этой характеристики. Могут быть участки, где рельеф скрыт от непосредственного наблюдения (под зданием), где значение этой характеристики неоднозначно (вертикальные или нависающие обрывы), но сама непрерывность ее не вызывает сомнений (если, конечно, считать за ту же характеристику и рельеф суши, и рельеф дна водоемов - или водной поверхности). И тем самым просматривается ее принципиальное отличие от индивидуализированных объектов. На самом деле взаимоотношения здесь более сложные и не столь антагонистичные, но эти детали мы опускаем.

Индивидуализированные объекты, в свою очередь, могут иметь четкие, определенные границы или положение, достаточно хорошо описываемые, например, линией их контура (для площадного объекта), или быть размытыми с нечеткими границами (с зоной постепенного перехода на границе, с границей, определенной статистически или с границей, переменной во времени.) Как всегда, с нечеткими объектами все гораздо сложнее, мы их здесь пока подробно рассматривать не будем.

Пространственные поля могут быть полями характеристик, измеряемых в разных шкалах (количественных и качественных). Они могут быть одномерными и многомерными, то есть представляющими одну или одновременно несколько характеристик. Они могут быть скалярными и векторными, то есть характеризоваться числом без направления, как, например, поле температур, так и числом с направлением в пространстве (например, поле ветра, характеризующееся величиной и направлением). Существуют и более сложные их типы, но нам достаточно и этого.
^

4.2.Основные характеристики объектов реального мира


Для начала отметим те особенности информации об объектах реального мира, с которыми мы имеем дело в ГИС. Информация о реальном мире частично относится

  • к индивидуализированным объектам,

  • к некому непрерывно распределенному в пространстве свойству, т.е. пространственному полю каких либо характеристик.

Например, мы имеем отдельные дома и рельеф местности. Объекты могут быть с четкими, определенными границами или положением, достаточно хорошо описываемыми, например линией их контура (для площадных), или быть размытыми с нечеткими границами. Объекты могут иметь разную размерность в геометрическом смысле - быть точечными (нулевая длина и ширина, размерность 0), линейными (ненулевая длина при нулевой ширине, размерность 1) и площадными (ненулевые длина и ширина размерность 2).

Однако такое деление условно и зависит от масштаба рассмотрения. Для ГИС этот факт имеет большее значение, чем для традиционной картографии, так как карта в ГИС - объект динамический, с меняющимся по ходу работы масштабом рассмотрения. Объекты могут относиться к разным категориям и образовывать целые иерархии, например, линейные объекты могут быть реками (элементы гидрографии), железными дорогами, автомобильными дорогами центральными линями улиц (элементы транспортной сети), линиями газопроводов нефтепроводов (элементы трубопровод ной сети). Автомобильные дороги например, могут быть далее подразделены на множество различных классов по разным признакам и сочетаниям признаков. Такие смысловые группировки объектов в разные категории тоже не могут быть абсолютными на все случаи жизни — выбор той или иной из них зависит от стоящих перед нами задач. Это, конечно, не исключает того, что для конкретных массовых применений такие группировки могут быть заданы как стандартные или рекомендуемые, т.е. имеют право на существование стандартные классификаторы объектов, например, имеющие иерархическую структуру. Но классификатор объектов не может служить основой построения модели данных - получающиеся при этом модели оказываются малопригодными для комплексного использования, слишком статичны, трудно расширяемы и изменяемы, имеют проблемы связи с реляционными СУБД.
^

4.3.О представлении индивидуализированных объектов.


Для начала рассмотрим индивидуализированные объекты.

Индивидуальные объекты могут иметь различную размерность в геометрическом смысле - быть точечными (нулевая длина и ширина, размерность 0), линейными (нулевая ширина при ненулевой длине, размерность 1) и площадными (ненулевая длина и ширина, размерность 2). Следует отделять от понятия размерность объекта понятие размерности пространства его описания. Линейное пространство (размерности 1) - это, например, система координат вдоль линии, такая как километровые столбы вдоль шоссе; двумерное плоское пространство (размерности 2) - это, например, карта с системой картографических координат; трехмерное пространство (размерности 3) - это наше обычное "реальное" пространство. Встречается даже термин 2.5-мерное пространство -он относится к 3-х мерному пространству, в котором определена некоторая неплоская в общем случае поверхность с системой двумерных координат на ней. Непрерывного объема нет - ничего нельзя позиционировать в свободном трехмерном пространстве, но каждая точка имеет координаты X, Y, Z. Однако каждая из точек с одними Х и Y имеет только одно Z. Такого типа пространство удобно для описания пространственных данных об объектах местности вместе с рельефом местности, на которой они находятся, для работы с перспективным изображением местности, для создания, как сейчас принято говорить, "виртуальных" отображений действительного или смоделированного ландшафта - высокореалистичного и динамичного его отображения. Также и многие существенно трехмерные, например, некоторые геологические задачи, могут быть успешно смоделированы с помощью 2.5-мерного пространства, достаточно только расширить его до возможности оперировать не с одной, а с несколькими поверхностями.

Легко заметить, что размерность пространства описания связана определенным образом с размерностью объекта, а именно: максимальная размерность объекта равна размерности пространства описания. На линии можно расположить точечные и линейные объекты, на карте - точечные, линейные и площадные, в трехмерном пространстве - точечные, линейные, площадные и объемные.

Упомянутое подразделение объектов на элементарные геометрические типы характерно для картографии. Точечные объекты отображаются на картах внемасштабными условными знаками (маркерами), линейные объекты - линейными условными знаками, площадные - площадными.1 Нетрудно, однако, заметить, что такое деление условно и зависит от масштаба рассмотрения. Для геоинформатики этот факт имеет большее значение, чем для традиционной картографии, так как карта в ГИС - объект динамичный, с меняющимся по ходу работы масштабом рассмотрения. К тому же иногда единая пространственная база данных создается по бумажным картам нескольких масштабов или вообще без участия бумажной карты прямо по полевым наблюдениям или в результате дешифрирования данных дистанционного зондирования.

Объекты могут относиться к разным категориям и находиться между собой в сложных соотношениях, например, образовывать иерархические структуры соподчиненное™. К примеру, линейные объекты могут быть реками (элемент гидрографии), железными дорогами, автомобильными дорогами, центральными линиями улиц (элементы транспортной сети), линиями газопроводов, линиями нефтепроводов (элементы трубопроводной сети).

Автомобильные дороги, например, могут быть далее подразделены на множество различных классов по разным их признакам и сочетаниям признаков [значение, ширина, число полос движения, тип дорожного покрытия, sro состояние, время постройки, время и содержание последнего ремонта или инспекции, принадлежность к той или иной организации обслуживания, интенсивность движения - может быть, разная в разное время суток, день недели, сезон - дальше можно продолжать очень долго). И из этих признаков можно построить не единственную систему классификации дорог - в зависимости от того, какие признаки считать более существенными, а какие -относительно менее существенными, им подчиненными. Ясно, что такие смысловые подразделения и группировки объектов в разные категории не могут быть абсолютными на все случаи жизни - выбор гой или иной из них зависит от стоящих перед нами задач. Это не исключает, однако, того, что для конкретных массовых применений такие группировки не могут быть заданы как стандартные или рекомендуемые - то есть имеют право на существование и необходимы стандартные классификаторы объектов, например, имеющие иерархическую структуру. Однако ясно, что служить основанием для организации пространственных данных в ГИС или пространственной базе данных сколько-нибудь общего назначения такие классификаторы объектов не могут - получающиеся структуры данных оказываются негибкими и не могут обеспечить решение сколько-нибудь широкого и меняющегося спектра задач. Конкретно иерархические структуры к тому же могут иметь проблемы в организации удобных связей с внешними СУВД, которые сегодня в основном строятся на базе реляционной модели (см. в последующих выпусках).

С индивидуальным объектом, если мы хотим трактовать его как индивидуальный, должен быть связан его уникальный идентификатор - например, какой-то номер, формально присваиваемый ему программой в процессе ввода или имеющий содержательный смысл и вне пространственной базы данных, например, его номер по какому-то перечню или кадастру. Это может быть, в принципе, и какое-то уникальное нечисловое имя - например, уникальное название, неповторяющееся более нигде в пределах области изучения. (Или только той ее части, в пределах которой требуется сохранять уникальность идентификаторов. В последнем случае мы имеем как бы двухуровневое деление, и имя (код) этой части может рассматриваться как составная часть идентификатора (префикс идентификатора) объекта.) В общем, идентификатор необходим, в противном случае объект не является уникальным и его нельзя трактовать как в полной мере индивидуальный, самостоятельный. Идентификатор объекта, как в виде номера, так и в виде имени и в реальной жизни, и в компьютерной системе может меняться - он необязательно сопровождает объект на протяжении всей истории его существования. Например, объект в реальном мире может быть переименован - Сталинград - Волгоград. В компьютерной системе изменение идентификатора объекта часто бывает необходимо при реорганизации структуры базы данных - например, при слиянии двух прежде раздельных ее частей. Но изменение идентификатора объекта и в том, и в другом случае - операция совершенно особого рода, требующая особого внимания и контроля и часто выполняющаяся с помощью специальных средств и приемов. У идентификаторов объектов могут быть дополнительные имена-синонимы для удобства использования. Но это случай нетипичный для организации данных в компьютерных системах. Использование не номеров, а имен собственных в качестве идентификаторов объектов хотя и возможно в принципе, но не очень удобно и надежно - в России есть несколько (много!) рек с названием Быстрая, на земном шаре несколько городов с названием Paris, и даже на одном листе топографической карты 1:100000 нередко можно встретить различные географические объекты с одними и теми же названиями Индивидуальный объект имеет определенное положение, позицию Информация о его положении, однако, тоже неудобна для использования в качестве его идентификатора. Объект, как природный (река), так и техногенный (мост) может со временем изменить свое положение. Кроме того, позиционная информация, как мы уже видели, являясь метрической, может отличаться по точности (инструмент, метод измерения, тот или иной способ представления численных значений координат в данном формате файла), а также может отличаться из-за использования той или иной системы координат, той или иной картографической проекции, той или иной модели эллипсоида.

Тем не менее, естественно, что информация о положении (а также форме, размерах) объекта крайне важна в ГИС. Обычно такую информацию, как бы она ни была выражена - числовыми координатами, или как-то еще, называют информацией положения (локатором) и отделяют ее от информации идентификации (идентификатора). Вся остальная информация об объекте может рассматриваться как его атрибуты - набор характеристик. Атрибуты можно подразделить на пространственные и непространственные. Пространственные - это, например, периметр и площадь площадного объекта, длина линейного. Непространственные атрибуты могут быть самыми различными - числовыми, текстовыми значениями каких-то величин, описывающих объект. Пространственные атрибуты часто являются функциями параметров положения -например, периметр площадного объекта может рассчитываться из координат слагающих его контур точек.

Можно говорить об объектах элементарных (обычно это точка, линия и полигон) и об объектах неэлементарных (группировках). представляющих объединения (постоянные или временные группировки) элементарных объектов. Если такая группа в свою очередь имеет уникальный идентификатор, то она тоже может рассматриваться как индивидуальный объект. Такая группировка может быть организована на базе как однотипных, так и разнотипных объектов. В последнем случае назовем такие объекты (группировки) комплексными объектами. Более того, в нее могут входить также и объекты неэлементарные, которые уже, в свою очередь, являются группировками.
^

4.4.Измерения и пространственные взаимоотношения


Рассматриваемые объекты реального мира могут быть отграничены от их окружения и их положение в пространстве может быть задано в той или иной системе привязки, выполнение различных задач с использованием информации об этих объектах может потребовать определения пространственных характеристик этих объектов и наличия средств измерения этих характеристик.

Рассмотрим примеры пространственных характеристик, определенные для индивидуальных объектов.

1. Длина , например, длина реки или береговой линии озера.

2. Площадь – поверхности, например, площадь озера, острова или конкретного земельного участка.

3. Объем -, например, количество земли, которое необходимо удалить для постройки дорожной выемки.

4. Форма, например, округлая или вытянутая, прямолинейная или изогнутая.

5. Регулярность или неправильность формы, например, угловатая, состоящая из прямолинейных отрезков граница штата Юта в США, или резко нерегулярная форма морского побережья в Далмации на Адриатике.

6. Ориентировка, например, направление длинной оси друмлина.

7. Объект может иметь центр, как, например, середина дороги или центр города.

8. Уклон, крутизна склона - это пространственное свойство, например, горы.

(Примеры можно продолжить, конечно.)

Как обстоит дело с измерением этих свойств? Все замечательно просто, если мы уже имеем отображение этих объектов на карте или в геоинформационной системе. Или если мы в состоянии посетить объекты на местности и произвести прямые наблюдения и измерения. Однако мы получим различные ответы, например, при измерении длины, в зависимости от точности используемых нами измерительных устройств, а также в зависимости от масштаба, в котором мы изначально зафиксировали объекты. (То есть при разной детальности рассмотрения). Длина береговой линии даже такого относительно простого по конфигурации побережья как Мурманский берег Кольского полуострова будет значительно отличаться, если мы произведем ее измерения по картам масштаба 1:1000000 и 1:50000. В случае более изрезанного побережья различия будут еще значительнее. Поэтому обычно измерения пространственных характеристик объектов реального мира включают и рассмотрение вопроса о необходимой и достаточной точности измерения, допустимой величине ошибки, источниках данных, методах и инструментах проведения измерений. В одних случаях требуется высокая инструментальная точность, как в описании землевладения в земельном кадастре, в других - достаточно визуальной качественной оценки, как это часто бывает при описании формы объекта.

Более того, некоторые пространственные характеристики являются величинами многомерными. Например, форма может пониматься просто как соответствие по форме той или иной правильной геометрической фигуре (например, кругу или прямоугольнику), а может учитываться еще и каким-то образом измеренная количественно степень отклонения от этой правильной формы. Например, степень кривизны линии. Для описания склона часто недостаточно простого указания его уклона, он может быть различен в различных точках, склон может быть вогнутым или выпуклым. Часто пространственную характеристику можно измерить не одним единственным способом, так что указание ее значения без описания способа измерения может быть лишено смысла. Часто требуется указывать еще и точное место измерения характеристики в пределах объекта. В ряде случаев для одного объекта может потребоваться несколько измерений одной характеристики, в особенности если она меняется со временем. Например, и площадь, и форма некоторых объектов, как техногенных, так и природных может меняться значительно. Например, некоторые соленые и пересыхающие озера и водотоки в аридных областях, положение главного русла реки в пределах широкой горной долины, береговая линия водохранилища, зависящая от режима его использования. Или, например, площадь и форма территории, в пределах которой на спрос сильно влияют покупки, производимые жителями города Москвы, сильно разнится для зимнего и летнего (дачного) сезонов. (И, кстати еще - "сильно влияют". Как сильно? - требуется точно определить ту степень влияния, начиная с которой нас начинает интересовать эта проблема.) В таких случаях иногда прибегают к описанию пространственных характеристик с использованием вероятностного или статистического подхода.

Для более-менее однородных по тематике типов объектов, например, для озер, могут рассматриваться их групповые пространственные характеристики. Например, определенные типичные формы бывают характерны для озер, связанных своим происхождением с тектоническими разломами на древних щитах, другие формы характерны для озер в местах активного развития многолетнемерзлых грунтов.

Как для описания изменчивых во времени пространственных характеристик одного объекта, так и для описания обобщенных, групповых характеристик нескольких однородных объектов, часто используется один из вариантов такого обобщенного, генерализованного описания.

"1. Минимальное и максимальное значения характеристики или диапазон возможных значений.

2. Среднее значение характеристики и характеристика степени ее изменчивости (дисперсия, среднеквадратическое отклонение и т.п.).

Некоторые пространственные характеристики имеют смысл и определены только для некоторых множеств объектов, а не для единичных объектов. Кроме того, хотя площадь и форма и могут быть определены для единичного озера, они имеют смысл и для группы озер, например, как средние величины для группы или как суммарная площадь всех озер в пределах данной территории.

Примеры пространственных характеристик для групп объектов:

(Рис. 7)

1. Рисунок распределения в пространстве несвязанных между собой отдельных объектов может отличаться (объекты могут располагаться сгруппированно или рассеянно).

2. Объекты могут располагаться компактно или порознь (например, все земельные участки одного владельца могут располагаться компактно вблизи его домовладения, или быть разбросаны на большой территории, перемежаясь чужими участками).

3. Объекты могут граничить с различным числом других объектов того же типа. В том числе, и с нулевым их числом, как, например, изолированные вырубки в лесу. (Например, различные государства граничат с различным числом соседних государств.).

4. Объекты могут быть разным образом связаны, соединены друг с другом, как, например, транспортные сети различных авиакомпаний связаны друг с другом наличием общих аэропортов как пунктов пересадки.

5. Группу объектов могут характеризовать определенные направления, как, например, система преимущественных путей и направлений сезонных миграций диких животных.

6. Группы пространственных объектов могут характеризоваться наличием или отсутствием определенной последовательности, закономерности в порядке их расположения (зоны высотной поясности растительности в горах обычно сменяют друга последовательно, а вблизи крупного города сначала обычно располагаются плотно населенные пригороды, а не малолюдные сельскохозяйственные территории).

В этой части книги мы не будем рассматривать конкретные методы проведения измерений, вопросы точности измерений, допустимых ошибок, а сосредоточимся больше на принципиальных вопросах, на типизации свойств пространственных объектов.

Обратим внимание, что ряд характеристик, упомянутых выше (которые можно рассматривать как пространственные), относящихся к группам объектов, фактически определяется характеристиками положения объекта и его атрибутивными (описательными) характеристиками. Например, это касается высотной поясности растительности или типов территории вблизи города. Вообще, когда рассматриваются особенности взаиморасположения объектов, упорядоченности в их расположении, последовательности расположения, мы обычно не можем обойтись одними геометрическими или топологическими характеристиками, а учитываем атрибутивные характеристики объектов, задающие деление их на классы, ранжирование, степень подобия по значениям каких-либо непространственных параметров. Хотя из этого правила и есть исключения - постепенное расширения русла реки вниз по ее течению.


^

4.5.Об описательных характеристиках
индивидуализированных объектов - атрибутах.


Чуть подробнее коснемся атрибутов объектов. Для них важнейшей характеристикой является тип использованной шкалы измерений. Общепринято деление шкал (и, соответственно, данных в этих шкалах) на "качественные" и "количественные". К "качественным" относят шкалы номинальную (наименований) и ординальную (порядковую, ранговую). К "количественным" относят интервальную (интервалов) и рациональную (отношений) шкалы.

Отметим, что это деление не имеет ничего общего с формой записи или кодированием значений - и данные в номинальной шкале могут быть представлены (и всегда в конечном счете представляются в компьютере) числом. Но это число как бы и не численное значение, это просто код класса, число здесь выступает просто как заменитель названия. В случае номинальной и порядковой шкал для этого числа не имеют смысла некоторые арифметические операции (для порядковой шкалы - имеется только операция упорядочения и сравнения "больше-меньше-равно", а для номинальной -только сравнение "равно-не равно").

Проиллюстрируем различие между разными шкалами.




Качественные




Количественные




Шкалы

Номинальная

Порядковая

Интервальная

Рациональная

Свойства

Наличие/

отсутствие

Качественное

различие

Отнесение к

одному и тому

же или другому

классу



Место в

определенной

последователь

ности

Относительная

позиция по

сравнению с

другими

Больше, меньше

или равно

Различие

Условное начало

отсчета(услов

ный нуль)

Вычитание,

сложение - на

сколько


Отношение - во

сколько раз

Умножение

Деление




















Порождающий процесс

Классификация

Ранжирование

Измерения

Примеры

Название города

Большой город

Температура в градусах Цельсия

(Не Кельвина!)

Число жителей в городе



Тип землепользования

Название шоссе

Самая богатая гумусом почва

Шоссейная дорога местного значения


Азимут в градусах

Прирост числа жителей города за 10 лет

Площадь Земельного Участка

Расстояние между двумя горными вершинами


Кроме этого, атрибуты могут быть первичными (измеренными, введенными) и вторичными, расчетными, полученными расчетом из значений других атрибутов. Частный случай таких вторичных рассчитываемых - это атрибуты (обычно пространственные), которые рассчитываются исходя из позиционных параметров объектов (например, периметр).

И, конечно, сегодня, в эпоху мультимедиа, вполне естественным является расширение понятия атрибутов объекта на другую связанную с ним информацию - растровую графику - фотографию объекта или отсканированную схему каких-то документов, с ним связанную, видеофильм или компьютерную анимацию, звуковую информацию. Поэтому можно говорить о классических (алфавитно-цифровых) атрибутах объекта, а также о его расширенных атрибутах (мультимедийных, в частности). В современных ГИС возможно иногда связывание с объектом некоторого действия, например, запуск какой-то программы или макро при активизации объекта указанием на него. Возможно также при активизации объекта (например, площадного объекта "Московская область" на карте России) перейти к другой карте - более подробной карте Московской области с районным делением или к карте Москвы -столице области. Таким образом другую карту, организованную в рамках той же (например, векторно-топологической) или другой (например, растровой) модели данных или какой-то индивидуальный объект в них можно тоже рассматривать в качестве атрибута первого объекта. При этом возможна организация связи между ними различным образом, в том числе с установлением иерархических связей соподчиненности между как индивидуальными объектами, так и их множествами (картами, тематическими слоями). Все это позволяет создавать конкретные структуры баз данных очень сложные и изощренные. Но это и осложняет теоретическое рассмотрение моделей данных. С одной стороны, теряется четкость понятия «атрибут» - атрибутом одного объекта могут быть другие объекты, в том числе их позиционная информация, их графический образ. С другой стороны, появляются «атрибуты-действия», и усложняется проведение границы между тем, что относится обычно к категории "данные" (атрибут) и тем, что является компьютерной программой и рассматривается обычно в категории «знания» или «инструменты работы с данными». Все это вызывает необходимость введения понятия «обобщенные атрибуты» и ярко демонстрирует условность и относительность деления информации об объекте на атрибутивную и неатрибутивную (графическую, например). Этот пример также хорошо демонстрирует сложность взаимоотношений между способами организации данных и способами организации и воплощения наших знаний.
^

4.6. Формы представления непрерывных признаков - полей.


Некоторое свойство, непрерывно распределенное в пространстве, например, на земной поверхности, удобно в математическом смысле рассматривать в качестве поля. (Вообще говоря, разного вида -скалярного, векторного, тензорного, трехмерного или двумерного, определенного только на поверхности земли или с ней не связанного, а только проектируемого на нее или пересекаемого ею, но всех сложностей мы сейчас касаться не будем). Типичные формы представления подобных непрерывных свойств таковы:

^ Нерегулярная сеть точек - произвольно расположенные точечные объекты, в качестве атрибутов имеющие значение поля в данной точке. С помощью такого способа представления, если не иметь очень густо расположенных по сравнению с пространственной изменчивостью поля точек, трудно гарантировать его адекватное представление. Сеть может быть слишком редкая, или точки, выбранные случайно, не попадают на характерные представительные места/значения, или, наоборот, точки выбраны неслучайно и тоже не являются представительными (например, все значения кислотности почвы измерялись только там, где можно было легко передвигаться по местности, то есть на голых водоразделах, а не в заболоченных речных долинах).





Способ представления изолиниями - наиболее распространен в традиционной картографии. Обычно нет никакой информации о поведении поля между изолиниями, и вторая проблема состоит в том, что по одним и тем же исходным данным (обычно это точки нерегулярной сети) интерполяция и последующее проведение изолиний может быть сделана не единственным способом. Способ представления очень привычный, но не самый удобный для анализа.


Наиболее удобен для многих случаев вариант, когда поля задаются регулярно расположенными в пространстве точками достаточной густоты (регулярная модель), особенно когда это точки не интерполированные из нерегулярных, а измерения, проведенные по регулярной сети. Из них легко перейти к любой другой форме представления.

1

2

Value

Count

Type

Code

1

4

Maple

400

2

7

Oak

500


















Несколько особняком стоит модель данных TIN (Triangulated Irregular Network), специально предназначенная для представления поверхностей значений, полей (например и в первую очередь -поверхности рельефа местности). Это также нерегулярная сеть точек, но точек связанных, соединенных особым образом выбранной сетью прямых отрезков, при этом эти отрезки (называемые часто ребрами - edges) образуют множество треугольников, как бы грани (фасеты). Наличие таких связок между точками дает некоторое представление (линейное приближение) о поведении поля (или форме поверхности) на данном участке в промежутке между точками. Поэтому модель данных типа TIN часто позволяет получать более качественное и более экономное представление поверхностей (полей). В особенности удачным оказывается применение этой модели данных для ситуации, когда изменчивость поля (например, рельефа местности) очень разная в разных частях территории, например, если район изучения захватывает и горный район, и плоскую предгорную равнину. К сожалению, многие типы аналитических задач трудно выполнимы на этом типе модели данных.




Треугольник

Список точек

Соседи

А

1,2,3

-,B,D

B

2,4,3

-,C,A

C

4,8,3

-,G,B

D

1,3,5

A,F,E

E

1,5,6

D,H,-

F

3,7,5

G,H,D

G

3,8,7

C,-,F

H

5,7,6

F,-,E






^

4.7.О некоторых требованиях к представлению
пространственных данных.


Отметим, что карты (это касается как бумажных карт, так и их компьютерного представления в ГИС) могут быть геометрически точны (рассчитаны на то, чтобы правильно с точностью до искажений картографической проекции передавать форму, размеры и абсолютное положение объектов; по таким картам можно производить те или иные геометрические измерения) и могут быть только топологически точны (например, схема железных дорог, на которой ни формы линий не соблюдены, ни масштаб не одинаков в разных местах. Но если города А и В соединены железной дорогой, и она проходит именно через город С, то этот факт точно отражен в графике). Такие "карты", по которым принципиально нельзя мерить расстояния и координаты объектов, но которые сохраняют все топологические свойства нужного множества объектов, например, дорожной сети (что с чем связано, или что с чем граничит, например) - чаще называются не картами, а схемами, а их компьютерное представление часто может рассматриваться как граф. Конкретная карта может быть одновременно и геометрически, и топологически точна, но могут быть и карты, точные геометрически, но не топологически, или наоборот.

Карту, равно как и упомянутый граф дорожной сети, можно рассматривать как разновидности моделей пространственных данных, может быть, компьютерные, может быть, нет.

^

4.8.Типы моделей пространственных данных -первый обзор.


Итак, какие же бывают модели пространственных данных. Как часто случается в жизни, их нельзя расклассифицировать по одной оси, они различаются как бы "в разные стороны".

Несколько схематизируя ситуацию, заметим, что в ГИС о модели данных можно говорить в нескольких смыслах. Во-первых, сами пространственные данные, а это в значительной части графическая, позиционная компонента, могут быть организованы различно по своему внутреннему устройству, в соответствии с разными моделями. Во-вторых, можно говорить и о разных моделях организации атрибутивных данных внутри себя, безотносительно к графической компоненте. Наконец, и это уже момент, специфичный именно для ГИС, можно говорить о разных моделях отношений между пространственной и атрибутивной информацией, или, упрощая, между графической и описательной. Такое раздельное рассмотрение названных аспектов полезно не всегда, иногда модель данных весьма тесно интегрирует пространственную и атрибутивную информацию.

^

4.9.Модели построения взаимоотношений между атрибутивной и пространственной графической информацией.


В целом существует три подхода к организации совместной работы с пространственной и атрибутивной информацией, три модели такого взаимодействия. Иногда этот аспект именуют принципами взаимодействия ГИС с базой данных. Во-первых, наиболее известная и распространенная на сегодня модель этих взаимоотношений - геореляционная, называемая также иногда гибридной или смешанной. Однако последние два термина лучше оставить за гибридными растрово-векторными моделями, и мы будем использовать термин "геореляционная". В этом случае пространственная компонента организована по-своему, а атрибутивная - по своему, между ними просто устанавливаются и поддерживаются связи через идентификатор объекта. Пространственная информация, метрическая, а в некоторых системах также и топологическая, хранится совершенно отдельно от атрибутивных в своих файлах или системах файлов. Атрибутивная информация организована в таблицы, которые управляются с помощью реляционной СУБД. Эта СУБД может быть как встроенной в ПО ГИС как его функциональная подсистема или может быть внешней по отношению к ГИС. Иногда, как в ARC/INFO или Arc View, реализуются одновременно оба подхода - есть и простая встроенная подсистема, и возможно использование внешних СУБД для хранения атрибутивной информации. Этот подход исходит из того, что трудно добиться одновременной оптимизации хранения и графических, и атрибутивных данных. Кроме того, во многих применениях ГИС сегодня существует тенденция как бы достраивать ГИС к существующим под управлением СУБД большим базам данных, добавления в них пространственных компонент и соответствующих средств работы с ним.

Второй вариант - интегрированный. Здесь предусматривается использование средств реляционных СУБД для хранения как графической, так и атрибутивной компоненты. В этом случае ГИС выступает как бы в качестве некоторой надстройки над СУБД. Этот подход обладает рядом преимуществ, особенно для крупных хранилищ информации, работающих в режиме активного многопользовательского использования, когда существенной проблемой становится обеспечение целостности данных. Однако современные традиционные реляционные СУБД мало подходят для работы с пространственными объектами общего вида (отличными от точечных). Примеры такого подхода в коммерческом ПО известны -например, GFIS фирмы IBM, но широкого распространения они не получили.

Наконец третий подход - объектный. Обладает очень многими привлекательными сторонами, в особенности в части возможности описания в нем очень сложных структур данных, взаимоотношений между объектами и возможностями решать многочисленные задачи моделирования. Однако в чистом виде для общего вида пространственных задач применим с трудом, гораздо более интересен появляющийся сегодня союз реляционных СУБД и объектного подхода в виде объектно-реляционной модели данных.


^

4.10.Модели организации пространственных объектов, организации связей между ними.


Два общих принципа, два подхода к организации пространственных данных нами уже упоминались ранее (см. стр. 28). Это различные принципы группировки объектов в логически связанные структуры более высокого порядка. (Они могут в той или иной мере сочетаться с разными только что описанными моделями взаимоотношений пространственных объектов и их атрибутов.) Один - это принцип послойной организации информации (его часто называют классическим), второй - опять же основан на объектно-ориентированном подходе. Надо сразу отметить, что объектно-ориентированный подход здесь понимается не обязательно в том смысле, что в объектно-ориентированном программировании (и только что упомянут выше), и что между двумя упомянутыми принципами организации информации "антагонистического противоречия", конечно, нет. Послойный принцип организации информации очень нагляден и хорошо соотносится с приемами традиционной картографии. Он заключается в том, что находится некоторое деление объектов на тематические слои; и объекты, отнесенные к одному слою, образуют некоторую логически (а часто и физически) отдельную единицу данных - например, они собираются в один файл или в одну директорию, они имеют единую и отдельную от других слоев систему идентификаторов, к ним можно обращаться как к некоторому множеству. Например, мы выносим в один слой все объекты гидрографии, или все шоссейные дороги, или все, относящееся к растительному покрову. Чаще всего при этом организуется также и деление одного тематического слоя по горизонтали - по аналогии с отдельными листами карт. Это делается в основном из удобства администрирования баз данных и чтобы избежать работы с чрезмерно большими файлами.

Для случая векторно-топологических моделей данных (то есть тех, которые позволяют строить и хранить в самой модели данных топологические отношения между объектами) обычно существуют некоторые дополнительные ограничения - в один лист одного тематического слоя можно поместить объекты не всех геометрических типов одновременно.

Так, в ARC/INFO в одном покрытии (так называется физическая единица, соответствующая одному листу одного тематического слоя) можно поместить или только точечные, или только линейные, или только площадные объекты, или комбинацию линейных и точечных, либо линейных и площадных, но нельзя собрать вместе точечные и площадные или все три типа объектов Это ограничение для практики никаких проблем не представляет, но оно типично для векторно-топологической модели данных


^ Векторные нетопологические модели данных в этом смысле предоставляют больше свободы, но все равно часто и в них в один слой помещаются только объекты одного геометрического типа. Число слоев при послойной организации данных может быть ограничено, может быть практически не ограничено в зависимости от конкретной реализации. При послойной организации данных очень удобно манипулировать большими группами объектов, представленных слоями, как единым целым, например, включая или выключая слои для визуализации, определять операции, основанные на взаимодействии слоев. В целом можно сказать, что послойная организация данных имеет большой аналитический потенциал. Она часто используется при организации как векторно-топологических, так и векторно-нетопологических моделей пространственных данных для ГИС. (Так же как нередко и в САПР. Там, впрочем, отдельные слои могут обычно включать все типы объектов и само это деление на слои носит более простой и формальный характер - они часто используются только для управления визуализацией и как удобный способ задания умолчаний для чертежа). И абсолютно преобладает послойный принцип организации в растровых моделях данных для представления непрерывно распределенных признаков.


Объектно-ориентированный принцип организации данных в ГИС акцентирует внимание не столько на общих свойствах объектов (моделируемых через деление на слои в предыдущем подходе), сколько на их положении в какой-либо сложной иерархической схеме классификации, на взаимоотношениях между объектами. В силу этого удобно отображаются различные родственные и генетические отношения между объектами, отношения соподчиненное™, функциональные связи между объектами. В целом этот подход в чистом виде менее распространен, чем послойный, вероятно, отчасти из-за больших трудностей практической организации всей системы взаимосвязей объектов. Трудозатраты на подготовительный этап формирования конкретной структуры базы данных могут быть очень велики. Могут быть и определенные сложности с изменением сформированной структуры базы данных и приспособлении ее к новым задачам. Для информации о природных объектах вообще применяется реже, чем послойный подход. Трудно также представить себе растровую ГИС, эффективно реализующую объектный подход.

Сегодня в моделях данных в ГИС преобладает послойный принцип организации информации. Два этих подхода, (если отмести крайности) вообще не противоречат друг другу. Существуют возможности использования обеих подходов совместно (имеются такие примеры). В будущем можно ожидать более тесного их взаимодействия, эти тенденции уже отчетливо видны. Однако сегодня могут существовать проблемы обмена информацией между системами, использующими два этих разных подхода. Иногда высказывается мнение, что объектно-ориентированный подход более эффективен при работе с ГИС только по техногенньш объектам, а послойный - при работе с природными объектами и для случая, когда имеешь дело и с теми и с другими. Я не уверен, что это положение носит общий характер, скорее оно касается (если вообще справедливо) только каких-то конкретных систем.

^

4.11. Модели представления графической информации.


Не менее важным является деление моделей данных на векторные. оперирующие непосредственно с координатами объектов и слагающих его точек и модели данных с делением пространства. где положение объекта или слагающего его элемента задается принадлежностью к некоторому дискрету, элементу делимости пространства. Наиболее распространенным видом моделей с делением пространства являются растровые модели данных, то есть использующие регулярную сетку точек или, что эквивалентно, разбиение пространства на регулярные ячейки прямоугольной (чаще квадратной) формы. Однако хочется подчеркнуть, что хотя их практическое значение и распространенность гораздо больше, чем у других моделей данных с делением пространства, вся эта группа очень разнообразна и представляет значительный теоретический интерес. Отдельные на первый взгляд экзотические модели данных из этой группы находят довольно неожиданное применение в комбинации с векторными и растровыми данными. Например, с их помощью могут строиться системы пространственного индексирования.






Серьезные ГИС сегодня также должны обладать возможностями работать с непрерывно распределенными данными, что часто заставляет в одной системе использовать комплексные (часто говорят, гибридные) модели данных (то есть фактически несколько разных моделей данных). Все это делает ГИСовские модели данных и форматы в среднем более сложными, чем все остальные. Можно думать, что и передний край теоретического осмысления общих вопросов о моделях и форматах данных также сегодня проходит в области геоинформатики.

Если вернуться только к области ГИС, то все равно сохраняется подразделение моделей и форматов данных по типу использования. Я говорю о моделях и форматах внутренних (реально используемых системой при ее основном функционировании) и моделях и форматах обменных, предназначенных для обмена с другими (ГИСовскими и неГИСовским пакетами).
^

4.12.Квадратомическое дерево


Иерархическая структура данных, известная как квадратомическое дерево, используется для накопления и хранения географической информации. В этой структуре двухмерная геометрическая область рекурсивно подразделяется на квадраты, что определило название данной модели.

На рис. 3.8 показан фрагмент двухмерной области QT, состоящей из 16 пикселей. Каждый пиксель обозначен цифрой. Вся область разбивается на четыре квадранта: А, В, С, D. Каждый из четырех квадрантов является узлом квадратомического дерева. Большой квадрант QT становится узлом более высокого иерархического уровня квадратомического дерева, а меньшие квадранты появляются на более низких уровнях.

Технология построения квадратомического дерева основана на рекурсивном разделении квадрата на квадранты и подквадранты до тех пор, пока все подквадранты не станут однородными по отношению к значению изображения (цвета) или пока не будет достигнут предопределенный заранее наименьший уровень разрешения.

Если регион состоит из 2n х 2n пикселей, то он полностью представлен на уровне n, а единичные пиксели находятся на нулевом уровне. Квадрант уровня 1 (0<1
На рис. 3.9 показано квадратомическое дерево, построенное по данным рис. 3.8. Как видно, эта структура являет собой классический пример Е-дерева. Преимущество такой структуры состоит в том, что регулярное разделение обеспечивает накопление, восстановление иобработку данных простым и эффективным способом. Простота проистекает из геометрической регулярности разбиения, а эффективность достигается за счет хранения только узлов с данными, которые представляют интерес.






Рис. 3.8. Фрагмент растра, квантованный для построения квадратомического дерева





Рис. 3.9. Квадратомическое дерево в виде Е-структуры

Поскольку квадратомическое дерево известно как пространственно-рациональный способ представления сгруппированных однородных ми сопряженных изображений, их преимущество над векторной репрезентацией многих (но не всех) пространственных алгоритмов относительно затрат машинного времени весьма существенно.

Первоначально большинство приложений моделей квадратомических деревьев было сделано для обработки изображений. Из этой области данная модель была перенесена в ГИС.

Модели, основанные на квадратомических деревьях, обеспечивают расчеты площадей, центроидные определения, распознавание образов, выявление связанных компонентов, определение соседства, преобразование расстояний, разделение изображений, сглаживание данных и усиление краевых эффектов. Вследствие этого появилась возможность использовать квадратомические деревья для хранения географических данных. Однако при этом требуется развитие процедур для превращения растровых данных в формат квадратомического дерева и усовершенствование техники линейного кодирования.

Во-первых, работах по квадратомическим деревьям связи между квадрантом и подквадрантом давались в виде дерева со степенью ветвления, равной четырем. В такой структуре связи между родительским и дочерним уровнем определяются системой внешних указателей.

Все узловые точки дерева, за исключением корневой, имеют одного родителя. В то же время все они, за исключением листьев, связаны с четырьмя дочерними узловыми точками.

Преимущество представления, основанного на указателях, заключается в том, что оно выражает только значимую часть полного квадратомического дерева.

Последние исследования показали, что для больших квадратомических деревьев наиболее подходящей структурой является линейное квадродерево. В нем каждый листовой узел представлен линейным числовым кодом, который базируется на упорядоченном списке узловых точек прародителей. Последующее преобразование дерева в код достигается использованием битового уровня или модулярной арифметики. Система линейных кодов обеспечивает эффективную связь между структурами пространственных данных и алгоритмами, применяемыми в вычислительной геометрии для решения проблем восстановления прямоугольников и определения ближайшего "соседа".

Рядом исследователей была рассмотрена возможность использования искусственного интеллекта для совершенствования очень больших географических информационных систем, основанных на квадратомических деревьях.

Иерархические модели, как и прочие, могут описывать системы, данные и схемы процессов обработки данных. Следует, однако, подчеркнуть, что правильно составленная иерархическая схема должна содержать в качестве записей ( вершин) атрибуты или агрегаты атрибутов либо типы сущностей. Атрибуты или агрегаты атрибутов соответствуют множествам или расширенным множествам. Дуги могут использоваться для представления агрегации двух атрибутов в тип сущности или двух типов сущности в тип связи. На практике часто в запись вставляют не только сущности базы данных, но и связи. Такая схема описывается моделью "сущность-связь" и будет рассмотрена ниже.

Анализ иерархических моделей (связей между их частями) с "неправильным" описанием необходимо проводить, выделяя типы сущностей.
^

4.13.Подразделение моделей и форматов данных по их назначению.


Разумеется, можно также проводить деление моделей и форматов данных по их назначению. Для использования в ГИС, для использования в САПР, для использования в простых чертежно-рисовальных системах. ГИСовские модели и форматы обычно четко отделяются на сегодняшний день от всех прочих за счет необходимости организации и активного использования связи между информацией положения и атрибутивной информацией объекта.
^

4.14.Некоторые дополнительные моменты.


Здесь можно сделать несколько замечаний. Во-первых, относительно деления позиционных параметров на параметры положения и параметры, определяющие форму объекта. Только для точечных объектов это всегда полные синонимы - точка формы не имеет, или ее положение - это и есть ее форма. Для линейных же и площадных объектов ситуация иная. В дальнейшем мы еще будем подробнее рассматривать способы описания линейных и площадных объектов в различных моделях данных, а сейчас только заметим, что они могут описываться как координатами каких-то их точек, так и каким-то описанием их формы, например, заданием функций, график которой дает форму требуемого объекта или просто словесным описанием формы -"квадрат со стороной 2 метра". Нетрудно заметить, что в последнем случае (а иногда и в предпоследнем) информацию положения можно отделить от информации, описывающей форму, поместив ее просто в атрибуты объекта. Для однозначности надо только определить, в каком месте объекта расположена та его точка, положение которой задается локатором. Назовем эту точку привязочной точкой объекта. определив ее положение в собственной системе координат объекта, а точку в пространстве, которая задается для такого объекта локатором - точкой вставки объекта.

Это подход традиционно используемый в отношении внемасштабных условных знаков для точечных объектов. Но он может быть обобщен, если трактовать графическое представление условного знака как пространственный объект, и вообще использоваться в других ситуациях, если нам удастся описать форму, размер и ориентировку объекта через его атрибуты, например. Правда, многие задачи, требующие взаимодействия пространственных объектов, анализа их взаимоотношений, могут затруднены при таком представлении. Эти рассуждения показывают нам условность подразделения информации об объекте на атрибутивную и информацию о его форме, а также возможность иногда рассматривать отдельно информацию о положении, форме, размере и ориентировке (угле поворота) объекта.

4.15.Метаданные.


Помимо информации, относя­щейся к индивидуальным объектам, большое зна­чение имеет так называемая метаинформация, или метаданные, как часто говорят, т.е. данные о данных. Метаданные могут быть различными и относиться к различным множествам данных, на­пример, ко всем данным в конкретной базе дан­ных. сведения о назначении базы данных, кто, когда и для какой цели ее организовал и собирал информацию (см. проект государственного стан­дарта «Метаданные электронных карт». - Прим. ред.). Это могут быть сведения о методах сбора информации (может быть, различных для разных объектов, для разного времени и разных прост­ранственных частей базы данных). Так это могут быть:

- определения объектов (то есть принцип их вы­деления);

- определения атрибутов (что, например, скры­вается за краткими заголовками полей таблиц или именами полей в базе данных);

- объяснение способа измерения значений ат­рибутов или источники этих данных и способ кодирования атрибутов;

- пояснение к цветовой легенде карты и услов­ным знакам (легенда);

- правила, по которым проводились границы объектов;

- сведения о дате, на которую информация акту­альна;

- сведения об источниках информации, методах ее получения;

- пояснения к отсутствующим значениям в атри­

бутах - какой код отсутствия значений, что он означает (данный атрибут не имеет смысла для данного объекта, данное значение не бы­ло померено или результат измерения был за­бракован, или измерения дали нулевой ре­зультат, т.е. значение ниже предела обнаруже­ния);

- любая информация, которая или способствует правильному использованию информации о нужных нам объектах, или даже просто необ­ходима для этого.

Для карты практически во всех случаях необхо­димым элементом метаданных являются сведения об использованной системе координат и карто­графической проекции, а информация о методе составления (полевые работы, генерализация) и использованных материалах обязательной являет­ся не всегда или не для всех пользователей.

Кроме того, атрибуты могут быть первичными (измеренными, введенными) и вторичными, расчетными, полученными расчетом из значений других атрибутов Частный случай таких расчет­ных - это атрибуты (обычно пространственные), рассчитываемые исходя из позиционных парамет­ров объектов (например, периметр).

И, конечно, сегодня, в эпоху мультимедиа, вполне естественным является расширение поня­тия атрибутов объекта на другую связанную с ним информацию - растровую графику: фотографию объекта или отсканированную схему каких-то до­кументов, с ним связанную, видеофильм или ком­пьютерную анимацию, звуковую информацию. Поэтому можно говорить о классических (алфа-витно-цифровых) атрибутах объекта, а также о его расширенных атрибутах (мультимедий-ных, в частности). В современных ГИС возможно иногда связывание с объектом некоторого дей­ствия, например, запуск какой-то программы или макро при активизации объекта указанием на него Возможно также при активизации объекта, например площадного объекта «Московская об­ласть» на карте России, перейти к другой карте -более подробной карте Московской области с районным делением или к карте Москвы - столи­це области. Таким образом, другую карту, орга­низованную в рамках той же (например, вектор-но-топологической) или другой (например, рас­тровой) модели данных, или какой-то индивиду­альный объект в них можно тоже в некотором смысле рассматривать как атрибут первого объ­екта. При этом возможна организация такой свя­зи различным образом, в том числе с установле­нием иерархических связей соподчиненности между как индивидуальными объектами, так и их множествами (картами, тематическими слоями) Все это позволяет создавать конкретные структу­ры баз данных, очень сложные и изощренные. Это вызывает необходимость введения понятия «обобщенные атрибуты» и ярко демонстриру­ет условность и относительность деления инфор­мации об объекте на атрибутивную и неатрибу1 тивную (графическую, например) в ГИС. То есть нельзя ставить знак равенства между пространст­венной и графической информацией в ГИС. Гра­фическая не всегда пространственная (графичес­кие атрибуты - чертежи), а пространственная -не всегда графическая (атрибуты площади, пери­метра, длины объекта, а также его характеристи­ка связи с другими объектами - топологическая информация).

^

4.16. Краткое резюме и практические следствия.


Модели и форматы данных в ГИС в целом гораздо сложнее устроены, чем в других типах ПО Это связано с тем, что требуется поддерживать связь между атрибутивной и пространственной информацией, и с тем, что природные объекты очень разнятся по своей природе - индивидуализированные объекты различных геометрических типов с четкими границами, объекты с нечеткими границами и непрерывные поля числовых и нечисловых признаков Сложность моделей данных также обусловливается необходимостью обеспечить выполнение многочисленных, часто сложных, функций






^ Рис. 6. Модель данных квадродерево


В отличие от САПР, сегодня не существует полностью трехмерных ГИС общего назначения, в ГИС могут быть возможности по трехмерной визуализации, работ с 2,5-мерным пространством (серии поверхностей в трехмерном пространстве)

^ Сегодня реально используются следующие модели:

  • растровая - на регулярной сетке (с одним размером ячейки),

  • модель типа квадродерева - на нескольких сетках с кратными размерами ячеек (рис 6), (Для оптимизации хранения и поиска )

  • модель векторная нетопологическая (с элементами объектной организации или без них, построенная на «вшитом» иерархическом классификаторе или без такового),

  • векторная топологическая, где в явном виде в модели данных хранятся топологические отношения между объектами,

  • модели данных, предназначенные для использования топологических отношений, но не хранящие их в файлах, а рассчитанные на их построение «на лету», в процессе запроса, модели данных типа TIN (рис 7).



^ Рис. 7. Модель данных TIN

И наконец, внутри каждой из названных моделей могут быть варианты, отличающиеся по организации связей между пространственными и атрибутивными характеристиками и по типу взаимодействия с базами данных Понятно, что конкретных вариантов набирается очень много, а конкретных реализации в разных пакетах - еще больше Поэтому в краткой статье более подробно их рассмотреть невозможно Говорить, какая из них лучше «вообще», без анализа конкретной ситуации, нельзя.

Но если вы задумываете использовать ГИС, то еще перед выбором конкретного пакета советую подумать о модели данных - какие к ней будут предъявляться требования.

Мы познакомились с некоторыми общими принципами построения моделей данных в пространственных информационных системах, затронули кратко вопросы о разновидностях моделей данных. Были приведены некоторые отдельные соображения, показывающие сложность вопроса - как только мы выходим за рамки единственной конкретной программной системы с ее моделью данных и ее ограничениями, многое, даже определения и классификация элементов, слагающих модель данных, становятся непростой задачей, многое оказывается дискуссионным.

Мы затронули также принципиальную важность вопроса о выборе модели данных - часто это вопрос номер 1, когда мы задумываемся о работе с пространственными данными и только начинаем планировать ее. Это относится как к разработчикам оригинальных программных систем - новых инструментальных средств для геоинформатики, так и к разработчикам приложений и к пользователям, которые стоят перед проблемой выбора программного продукта для реализации проекта.

Геоинформационные технологии принесли компьютерные методы в практику многих и многих областей знания, где до этого использование компьютеров было ограниченным и вспомогательным, усадили за компьютер много специалистов, которые до знакомства с ГИС практически не имели дела с какими-либо информационными технологиями. Это порождает определенные проблемы как в обучении геоинформатике, так и в практическом освоении технологий. Может быть, сейчас стоит назвать некоторые из этих проблем, поскольку они в значительной мере связаны с предыдущим текстом.

1. Многие пользователи не знают, не могут четко сформулировать, чего они хотят. Процесс постановки задачи и выбора модели данных, программного средства и конкретной технологии связаны поэтому очень тесно. На этих этапах очень желательно тесное взаимодействие специалиста-прикладника, способного формулировать задачу на содержательном уровне и специалиста по общей геоинформатике, выступающего в роли системного аналитика. Весьма вероятно, что этот процесс должен быть итеративным - идти методом последовательных приближений.

2. Пользователи могут думать, что применение какого-то программного обеспечения само по себе решит их проблемы. Однако никакие самые совершенные средства обработки и анализа не состоянии решить никаких проблем без достаточного обеспечения качественными данными и продуманной постановки задачи.

3. Некоторые операции, возможные теоретически, на практике оказываются слишком дорогими за счет необходимости сбора дополнительной информации, за счет того, что алгоритмы их реализации требуют слишком больших вычислений даже для современных компьютерных систем. Уровень реализации некоторых методов анализа в современных программных средствах может быть недостаточен для их применения в определенных ситуациях (ограничения на число объектов...).


4.17.Определения


^ Векторное представление – Цифровое пространственных объектов в виде набора координатных пар (векторов), описывая только геометрию объектов (см. модель «спагетти»- нетопологическое В.п. линейных и полигональных объектов) или геометрию и их взаимные отношения (топологию) в виде векторно-топологического представления; в машинной реализации В.п. соответствует векторный формат пространственных данных.

^ Векторно-топологическое представление. (т.е. линейно-узловое представление) – разновидность векторного представления линейных и полигональных пространственных объектов, описывая не только их геометрию, но (см. модель «спагетти»), но и топологические отношения между ними и образующими их элементами (дугами и узлами).

^ Модель «спагетти» (векторно-нетопологическая) - Разновидность векторного представления линейных и полигональных пространственных объектов, описывая их геометрию, но не топологию в виде неупорядочного набора дуг или совокупности сегментов.

^ Квадрометрическое представление. Квадродерево – один из способов представления пространственных объектов в виде иерархической древовидной структуры, основанный на декомпозиции пространства на квадратные участки, каждый из которых делится рекурсивно на 4 вложенных квадрата до достижения некоторого уровня, обеспечивающего требуемую детальность описания объектов; обычно используется как средство повышения эффективности обработки и компактности хранимых данных по сравнению с растровыми представлениями.

^ Полигон Тиссена. Полигональные области, образуемые на данном множестве точек таким образом, что расстояние от любой точки области до данной точки меньше, чем для любой другой точки множества;

^ Представление пространственных данных. (модель пространственных данных). – способ цифрового описания пространственных объектов, тип структуры пространственных данных; наиболее универсальные и употребительные из них: векторное представление (векторно-топологическое и векторно-нетопологическое), растровое представление, регулярно ячеистое представление и квадродерево. К менее распространенным относится модель типа TIN и ее многомерные расширения (где используются полигоны Тиссена). Машинные реализации п.п.д. называются форматами пространственных данных.

1 (Кстати, заметим, что в традиционной картографии, даже на топографических картах, и, тем более, на картах более сложных по содержанию, например, геологических, уделено определенное внимание и площадным объектам с нечеткими границами - заболоченные территории на топокартах, крапы зон наложенных изменений типа ороговикования на геологических картах. Заметим также, что в современных ГИС недостаточно развиты) средства представления и работы с такими объектами, особенно если говорить и об их участии в анализе, и об их наглядной визуализации Здесь также видится одно из возможных интересных направлении развития будущей геоинформатики