XML-документы с точки зрения спецификации
XML-документы с точки зрения спецификации
Теперь, когда мы разобрали практически все структурные единицы XML, осталось определить стандартным образом синтаксис для самих XML-документов. Им соответствует продукция document:
[1] document ::= prolog element Misc
Итак, XML-документ состоит из пролога, единственного корневого элемента и дополнительного нетерминала Misc, который может включать инструкции по обработке, комментарии и пробельные символы:
[27] Misc ::= Comment | PI | S
Остановимся отдельно на прологе XML-документа. Пролог состоит из необязательной декларации XML (XMLDecl), необязательной декларации типа документа (doctypedecl), инструкций, комментариев и пробельных символов:
[22] prolog ::= XMLDeci? Misc* (doctypedecl Misc*)?
В зависимости от того, насколько строго документы соответствуют спецификации XML и собственным DTD-объявлениям, они могут быть хорошо оформленными (well-formed) и правильными (valid).
Хорошо оформленный документ соответствует всем синтаксическим правилам XML и некоторым дополнительным ограничениям, например:
? имя открывающего тега элемента должно совпадать с именем его закрывающего тега;
? имена атрибутов элемента не должны повторяться;
? в значении атрибута нельзя использовать символ "<". Этот символ должен обязательным образом заменяться на сущность;
? сущности должны быть определены до использования;
? сущности-параметры могут быть использованы только в блоках DTD;
? документ должен иметь единственный корневой элемент, содержащий все остальные элементы и символьные данные этого документа. Вне корневого документа допускаются только комментарии, инструкции по обработке, декларация XML и блок DTD.
Правильные документы должны быть хорошо оформленными, и при этом их логическая структура должна удовлетворять объявлениям, которые содержатся в декларации типа документа (DTD).
Для того чтобы документ мог быть обработан различными приложениями стандартным образом, он должен как минимум быть хорошо оформленным. Выполнение этого требования означает, что документ корректен с точки зрения синтаксиса, и для его логического представления можно использовать любую из стандартных моделей. Например, если в элементе документа приведены два атрибута с одинаковыми именами, возможно, с точки зрения автора, это логично и корректно, однако, стандартными средствами такой документ обработать не удастся.
Требование правильности означает четкое соответствие выбранной логической схеме документа. Объявления декларации типа документа накладывают на логическую структуру документа определенные ограничения с тем, чтобы он мог быть стандартным образом обработан не только синтаксическими, но и семантическими процессорами, то есть программами, которые не только могут распознать синтаксис XML-документа, но и "понять" его смысл, переданный разметкой.
Более 800 000 книг и аудиокниг! 📚
Получи 2 месяца Литрес Подписки в подарок и наслаждайся неограниченным чтением
ПОЛУЧИТЬ ПОДАРОКЧитайте также
Комментарии по поводу функций управления очередью с точки зрения производительности
Комментарии по поводу функций управления очередью с точки зрения производительности В приложении В представлены данные, характеризующие производительность программы 10.5, в которой используются функции управления очередью. Приведенные ниже замечания по поводу
С точки зрения программиста
С точки зрения программиста В 1970 году С. С. Хассон (S. S. Husson) определил термин «архитектура компьютера» как «характеристики (вычислительной) системы с точки зрения программиста»[ 5 ]. Архитектура включает в себя набор команд, типы данных, операции ввода-вывода и другие
1.3 ОБЗОР С ТОЧКИ ЗРЕНИЯ ПОЛЬЗОВАТЕЛЯ
1.3 ОБЗОР С ТОЧКИ ЗРЕНИЯ ПОЛЬЗОВАТЕЛЯ В этом разделе кратко рассматриваются главные детали системы UNIX, в частности файловая система, среда выполнения процессов и элементы структурных блоков (например, каналы). Подробное исследование взаимодействия этих деталей с ядром
Сходства и отличия «боевого» и «мирного» продвижения своей точки зрения
Сходства и отличия «боевого» и «мирного» продвижения своей точки зрения Принципиально задача донести до людей свою точку зрения в Интернете в ходе информационной войны очень похожа на задачу продвижения сайта или блога компании в рекламных целях. Однако при всем
Анализ сайтов-конкурентов с точки зрения персонажей
Анализ сайтов-конкурентов с точки зрения персонажей Как бы вы изменили содержимое сайта конференции SES, зная эти обстоятельства?Чтобы лучше понять каждую из Джанет, будет полезно пройтись по аналогичным сайтам и представить, как она себя поведет в каждом конкретном
Pocket PC с точки зрения программиста
Pocket PC с точки зрения программиста Windows CE и Pocket PCДля программиста общение с устройством – это прежде всего общение с его операционной системой. Даже те программисты, которые пишут драйверы на языке ассемблера, машинных кодах или языке C, все равно пишут их для определенной
Социальные сети с точки зрения Mail.ru Марина Пелепец
Социальные сети с точки зрения Mail.ru Марина Пелепец Социальная сеть "Мой Мир@Mail.Ru" занимает третье место в Рунете по числу пользователей после «Одноклассников» и "В Контакте". Анна Артамонова, вице-президент Mail.Ru по коммуникационным сервисам, и Алексей Терехов, руководитель
РЕПОРТАЖ: 5D, или Декабрьский графический пленум: Многомерность декабря с точки зрения Российской графики
РЕПОРТАЖ: 5D, или Декабрьский графический пленум: Многомерность декабря с точки зрения Российской графики Автор: Серж СкаутНачало декабря в Москве — впрочем, как и в других городах — удачно пришлось на выходные. Первого декабря, как вы помните, случилась пятница, а это
Кибервойна с точки зрения классики жанра
Кибервойна с точки зрения классики жанра Автор: Ваннах МихаилТо, что человечество вступило в эпоху кибервойн, знают уже не только читатели "КТ", но и широкая публика, вскормленная среднебюджетными технотриллерами. Как же соотносится новомодное - всего-то