Содержание
Этот раздел спецификации описывает базовые типы данных, которые могут быть элементами содержимого или значениями атрибутов.
Вводную информацию о том, как читать ОТД (DTD) HTML, см. в справочнике SGML.
Каждое определение атрибута включает информацию о чувствительности его значения к регистру. Информация о регистре представлена следующими ключами:
Если значением атрибута является список, ключи применяются к каждому значению списка, если не указано иное.
Определение типа документа (ОТД) специфицирует синтаксис содержимого элемента и значения атрибута HTML, используя лексемы SGML (напр., PCDATA, CDATA, NAME, ID и т.д.). См. их полные определения в [ISO8879].
Здесь
суммирована ключевая информация:
ПА могут игнорировать ведущие и конечные символы пробела в значениях атрибута CDATA(напр., " myval " может интерпретироваться как "myval"). Авторам не следует объявлять атрибуты с ведущими и конечными пробелами.
Для некоторых атрибутов HTML 4 со значениями атрибутов CDATA спецификация устанавливает дальнейшие ограничения допустимых значений этого атрибута, которые могу быть не определены ОТД.
Хотя элементы STYLE и SCRIPT используют CDATA в своих моделях данных, CDATA для этих элементов обрабатывается ПА по-другому. Метки и мнемоники
должны рассматриваться как необработанный текст и передаваться в приложение "как есть/as is".
Первое появления последовательности символов "</" (первые символы закрывающего тега) рассматривается как конец содержимого элемента. В правильно составленных документах, это закрывающий тег
элемента.
Атрибуты текста ( %Text в ОТД) делают его пригодным для чтения.
Введение об атрибутах см. в учебной дискуссии об атрибутах.
Данная спецификация использует термин URI, как определено в [URI] (см. также [RFC1630]).
Заметьте, что URI включают URL (как определено в [RFC1738] и [RFC1808]).
Относительные URI дополняются до полных URI, используя базовые URI.
[RFC1808], раздел 3, определяет нормативный алгоритм этого процесса. Дополнительную информацию о базовых URI см. в разделе базовые
URI в главе о ссылках.
URI представляются в ОТД мнемоникой %URI;.
URI в общем случае нечувствительны к регистру. Могут быть URI, или части URI, где регистр не имеет значения (напр., имя машины/хост), но их идентификация может быть затруднительна. Пользователь должен всегда предполагать, что URI чувствительны к регистру (чтобы быть уверенными в последствиях своих действий).
Пожалуйста, прочтите дополнение к информации о не-ASCII символах в значениях атрибутов URI.
Значение атрибута "color" (%Color;) ссылается на определение цвета [SRGB]. Значение цвета может быть или 16-ричным числом (предваряемым знаком #), или одним из следующих 16 названий цвета. Названия цветов нечувствительны к регистру.
Black ="#000000" | Green ="#008000" | ||
Silver ="#C0C0C0" | Lime ="#00FF00" | ||
Gray ="#808080" | Olive ="#808000" | ||
White ="#FFFFFF" | Yellow ="#FFFF00" | ||
Maroon ="#800000" | Navy ="#000080" | ||
Red ="#FF0000" | Blue ="#0000FF" | ||
Purple ="#800080" | Teal ="#008080" | ||
Fuchsia ="#FF00FF" | Aqua ="#00FFFF" |
Таким образом, значение "#800080" и "Purple" оба обозначают пурпурный цвет.
Хотя цвета придают много дополнительного смысла документу и делают его более "читабельным", учитывайте следующие советы при использовании цвета в Ваших документах:
HTML специфицирует три типа значений размера для атрибутов:
Значения размера нейтральны к регистру.
Примечание: "Тип носителя" (определённый в [RFC2045] и [RFC2046]) специфицирует природу связанного ресурса. Эта
спецификация использует термин "content type\тип содержимого", а не "media type\тип носителя", в соответствии с текущей практикой.
В то же время, в этой спецификации, "media type" может относиться к дескрипторам там, где ПА воспроизводит документ.
Этот тип представлен в ОТД: %ContentType;.
Тиры содержимого нечувствительны к регистру.
Примеры типа содержимого: "text/html", "image/png", "image/gif", "video/mpeg", "text/css" и "audio/basic".
Текущий список зарегистрированных MIME-типов см. в [MIMETYPES].
Значение атрибута, чей тип - код языка ( %LanguageCode в ОТД), ссылается на код языка, специфицированный в [RFC1766],
раздел 2.
О том, как специфицировать код языка в HTML, см. в разделе коды языка. Пробелы внутри кода языка недопустимы.
Коды языка нечувствительны к регистру.
Атрибуты "charset" (%Charset в ОТД) ссылаются на кодировку символов, как описано в разделе кодировка символов. Значения должны быть строками (напр., "euc-jp") из регистра IANA (см. полный список в [CHARSETS]).
Наименования кодировки символов нечувствительны к регистру.
Пользовательские агенты (ПА) должны осуществлять серию шагов, предусмотренных в разделе определения кодировки символов, чтобы определить характер кодировки внешнего ресурса.
Определённые атрибуты вызывают отдельные символы из кодового набора документа. Эти атрибуты имеют тип %Character в ОТД.
Отдельные символы могут быть определены также мнемониками (напр., "&").
[ISO8601] допускает много вариантов и опций в представлении даты и времени. Данная спецификация использует один из форматов, описанный в [DATETIME], для определения действительных строк date/time (%Datetime в ОТД).
Формат таков:
YYYY-MM-DDThh:mm:ssTZDгде:
YYYY = год из 4 цифр MM = месяц из 2 цифр (01=January, и т.д..) DD = число месяца из 2 цифр (от 01 до 31) hh = час - 2 цифры (от 00 до 23) (am/pm НЕДОПУСТИМЫ) mm = минуты - 2 цифры (от 00 до 59) ss = секунды - 2 цифры (от 00 до 59) TZD = часовой пояс
Обозначение часового пояса - одно из следующих:
Компоненты должны быть представлены точно в такой пунктуации.
Заметьте, что "T" стоит в строке как буква (должна быть в верхнем регистре), показывая начало элемента "время" , как специфицировано в [ISO8601].
Если приложение "не знает" время с точностью до секунд, оно может использовать значение секунд "00" (и минуты и часы так же, если необходимо).
Примечание. [DATETIME] не адресует учёт високосных секунд.
Авторы могут использовать следующие распознаваемые типы ссылок, перечисленные здесь с их интерпретацией в соответствии с соглашениями. В ОТД %LinkTypes ссылается на разделённый пробелами список типов ссылок. Пробелы внутри типов ссылок недопустимы.
Типы ссылок нечувствительны к регистру, т.е., "Alternate" значит то же, что и "alternate".
ПА, поисковые машины и т.д. могут интерпретировать эти типы ссылок различными способами. Например, ПА может предоставить доступ к связанному ресурсу через панель навигации/navigation bar.
Автор может пожелать определить дополнительные типы ссылок, не описанные в этой спецификации. Чтобы сделать это, он должен использовать профиль для цитирования соглашений, используемых для определения типов ссылок. См. атрибут profile элемента HEAD.
Для продолжения обсуждения типов ссылок см. ссылки в документах HTML.
Список распознаваемых дескрипторов типа носителя ( %MediaDesc в ОТД):
Будущие версии HTML могут вводить новые значения и могут допускать параметризованные значения. Чтобы облегчить введение этих расширений, соответствующие ПА должны быть способны разобрать значения атрибута media так:
media="screen, 3d-glasses, print and resolution > 90dpi"
разбирается в :
"screen""3d-glasses""print and resolution > 90dpi"
"screen" "3d-glasses" "print"
Примечание. Таблицы стилей могут включать независимые от типа варианты внутри себя (напр., конструкция CSS @media). В таких случаях может быть удобно использовать "media=all".
Данные сценариев ( %Script; в ОТД) могут быть содержимым элемента SCRIPT и значением внутреннего события атрибута. ПА не должны вычислять данные сценария как метки HTML, а вместо этого должны передавать их как данные обработчику сценария.
Чувствительность к регистру данных скрипта зависит от применяемого языка сценариев.
Обратите внимание, что данные скрипта, являющегося содержимым элемента, могут не содержать символьных мнемоник, но данные скрипта, являющегося значением атрибута, могут их содержать. Дополнение содержит информацию о спецификации не-HTML данных.
Данные таблиц стилей (%StyleSheet; в ОТД) могут быть содержимым элемента STYLE и значением атрибута style. ПА не должен вычислять данные стиля как метки HTML.
Чувствительность к регистру данных стиля зависит от языка таблиц стилей.
Заметьте, что данные таблиц стилей, являющиеся содержимым элемента, могут не содержать символьных мнемоник, но данные, являющиеся значением атрибута могут содержать их. В дополнении предлагается дополнительная информация о спецификации не-HTML данных.
За исключением зарезервированных имён, перечисленных ниже, имя целевого фрэйма (%FrameTarget; в ОТД) должно начинаться алфавитным символом (a-z, A-Z). ПА должны игнорировать все другие имена.
Следующие имена целевого фрэйма зарезервированы и имеют специальное применение: