RSS — это формат распространения веб-контента.
Его название представляет собой аббревиатуру Really Simple Syndicate.
RSS — это тип XML. Все документы RSS соответствуют спецификации XML 1.0, опубликованной на веб-сайте W3C.
В начале документа RSS находится узел <rss> и указанный атрибут version, который указывает, какая версия RSS будет представлена документом. Если документ представлен этой спецификацией, его атрибут версии должен быть равен 2.0.
На один уровень ниже узла <rss> находится независимый узел <channel>, который содержит информацию и контент о канале.
Об этом документеЭтот документ был написан осенью 2002 года, когда версия RSS была 2.0.1.
Он содержит все изменения и дополнения со времени спецификации RSS 0.91 (2000 г.), а также новые функции, включенные в RSS 0.92 (декабрь 2000 г.) и RSS 0.94 (август 2002 г.).
Требуемый узел канала Ниже приведен список узлов канала, которые необходимо включить, каждый с кратким описанием, примером, где он должен появиться, и гиперссылкой на более подробное описание.элемент | описывать | пример |
заголовок | Название канала. Он сообщает другим, как получить доступ к вашему сервису. Если у вас есть веб-сайт HTML, содержимое которого соответствует вашему RSS-файлу, значение элемента заголовка должно совпадать с заголовком вашего веб-сайта. | Заголовки новостей GoUpstate.com |
связь | URL-адрес веб-сайта, который отвечает на канал | http://www.goupstate.com/ |
описание | Описание об этом канале | Последние новости с GoUpstate.com, веб-сайта Spartanburg Herald-Joural. |
Ниже приведен список дополнительных элементов канала.
узел | описывать | пример |
язык | используемый язык. Это позволяет агрегатору группировать все итальянские сайты. | ru-нас |
авторское право | Заявление об авторских правах | Copyright 2002, Spartanburg Herald-Journal. |
управляющий редактор | Электронная почта ответственного за контент | [email protected] (Джордж Матески) |
веб-мастер | Письмо от технического специалиста | [email protected] (Бетти Гернси) |
pubDate | время выхода контента | Сб, 07 сентября 2002 г., 00:00:01 GMT |
последняя сборкадате | Последнее обновление | Сб, 07 сентября 2002 г., 09:42:31 GMT |
категория | Укажите одну или несколько категорий, к которым принадлежит этот канал. Следует тем же правилам, что и элементы категорий на уровне элемента. | <category>Газеты</category> |
генератор | Название программы, сгенерировавшей канал | Система контента MightyInHouse v2.3 |
документы | URL-адрес, указывающий на документ формата RSS? | http://blogs.law.harvard.edu/tech/rss |
облако | Позволяет всем процессам регистрироваться в облаке для получения уведомлений об обновлении канала и реализует упрощенный протокол публикации-подписки для RSS-каналов. | <cloud domain=rpc.sys.com port=80 path=/RPC2 RegisterProcedure=pingMe протокол=soap/> |
ТТЛ | ttl — это аббревиатура от «Время жить». Он указывает эффективное время хранения кэша. | <ttl>60</ttl> |
изображение | Адрес изображения, отображаемый вместе с каналом | |
рейтинг | Статистический адрес изображения канала | |
текстовый ввод | Укажите текстовое поле для отображения вместе с каналом | |
пропустить часы | Сообщите пользователю, какие периоды времени можно игнорировать | |
пропустить дни | Сообщите пользователям, какие дни можно игнорировать |
<image> — это необязательный дочерний узел <channel>, который содержит три обязательных дочерних элемента и три необязательных дочерних элемента.
<url> — URL-адрес файла изображения GIF, JPEG или PNG, который представляет весь канал.
<title> используется для описания приведенного выше изображения, что эквивалентно атрибуту alt <img> в языке HTML.
<link> — это URL-адрес сайта для подключения, и когда канал отображается, ссылка на изображение указывает на этот сайт.
<title> и <link> должны иметь те же значения, что и <title> и <link> канала.
Необязательные узлы включают <width> и <height> — числовые типы, определяющие ширину и высоту изображения в пикселях.
<description> — это текст в атрибуте TITLE ссылки, который будет отображаться при вызове веб-страницы.
Максимальное значение ширины изображения — 144, значение по умолчанию — 88.
Максимальное значение высоты изображения — 400, значение по умолчанию — 31.
<канал>дочерний узел<облако><cloud> — необязательный дочерний узел <channel>.
Он определяет веб-службу, которая может поддерживать интерфейс rssCloud, который можно реализовать с помощью HTTP-POST, XML-RPC или SOAP1.1.
Его цель — разрешить обновление уведомлений о каналах процессов, зарегистрированных как облако, тем самым реализуя упрощенный протокол публикации-подписки.
<clouddomain=rpc.sys.comport=80path=/RPC2registerProcedure=myCloud.rssPleaseNotifyprotocol=xml-rpc/>В этом примере, чтобы запросить уведомления канала, вам необходимо отправить сообщение XML-RPC на порт 80 rpc.sys.com , путь — /RPC2. Вызванный процесс — myCloud.rssPleaseNotify.
<канал>дочерний узел<ttl><ttl> — необязательный дочерний узел <channel>.
ttl — сокращение времени жизни. Он указывает, как долго канал должен кэшироваться перед очисткой. Это позволяет управлять RSS-каналами через сеть, поддерживающую общий доступ к файлам, например Gnutella.
Например: <ttl>60</ttl>
<channel>дочерний узел<textInput>
<textInput> — это необязательный дочерний узел <channel>, а <textInput> содержит четыре дочерних узла.<title> — Метка кнопки отправки.
<description>--Описание области ввода текста.
<имя> — имя области ввода текста.
<link> — URL-адрес CGI-скрипта, обрабатывающего ввод текста.
Цель использования <textInput> несколько загадочна(?). Вы можете использовать его, чтобы предоставить поле ввода для поисковой системы или позволить читателям оставлять отзывы. Многие агрегаторы игнорируют этот узел.
Узел <элемента>Канал может содержать множество узлов элементов. Элемент может представлять собой историю, скажем, историю в газете или журнале. В этом случае описание элемента представляет собой краткое изложение истории, а ссылка на элемент указывает на то, где хранится вся история. Все узлы проекта не являются обязательными, но должны содержать как минимум заголовок и описание.
узел | описывать | пример |
заголовок | название предмета | Венецианский кинофестиваль пытается перестать тонуть |
связь | URL-адрес элемента | http://www.nytimes.com/2002/09/07/movies/07FEST.html |
описание | сводка по пунктам | Самые горячие разговоры на Венецианском кинофестивале на этой неделе были о том, как инсценируется прибытие звезд в Палаццо дель Кино. |
автор | Адрес электронной почты автора | [email protected] |
категория | Товары могут быть включены в одну или несколько категорий. | Персонажи Симпсонов |
комментарии | Адрес комментария, относящегося к элементу | http://www.myblog.org/cgi-local/mt/mt-comments.cgi?entry_id=290 |
ограждение | дополнительные медиа-объекты | |
гид | Строка, которая однозначно идентифицирует элемент. | http://inessential.com/2002/09/01.php#a2 |
pubDate | Время выпуска предмета | Вс, 19 мая 2002 г. 15:21:36 GMT |
источник | источник RSS-канала | Цитаты дня |
<source> — необязательный узел для <item>.
Его значением является имя RSS-канала, из которого поступает элемент, полученное из заголовка элемента. Он имеет обязательный URL-адрес атрибута, который ссылается на источник сериализации XML.
<sourceurl=http://static.userland.com/tomalak/links2.xml>Tomalak'sRealm</source>Роль этого узла — повысить репутацию ссылки и дальнейшее продвижение источника новости. Его можно использовать в команде Post агрегатора. При доступе к элементу из агрегатора через веб-блог <source> может быть автоматически сгенерирован.
<item>Дочерний узел<корпус> <enclosure> — необязательный узел для <item>.Он имеет три необходимых свойства. Атрибут url указывает местоположение вложения, длина указывает его размер в байтах, а атрибут type указывает его стандартный тип MIME.
URL-адрес должен быть http-URL.
<enclosureurl=http://www.scripting.com/mp3s/weatherReportSuite.mp3length=12216320type=audio/mpeg/>
<item>Дочерний узел<категория> <category> — необязательный узел для <item>.У него есть необязательный атрибут или поле, которое представляет собой строку, определяющую таксономию.
Значением этого узла является строка, разделенная косой чертой, которая идентифицирует иерархическое расположение в указанной таксономии. Процессор может установить сеанс для идентификации категорий. (Процессоры могут устанавливать соглашения для интерпретации категорий.) Вот два примера:
<category>GratefulDead</category>
<categorydomain=http://www.fool.com/cusips>MSFT</category> Вы можете включить столько узлов категорий для разных доменов, сколько вам нужно, и вы можете иметь обратную ссылку в разных частях тот же элемент домена.
<item>Дочерний узел<pubDate> <pubDate> — необязательный узел для <item>.Его значением является дата публикации элемента. Если это дата, которая еще не наступила, агрегатор может не отображать элемент до наступления этой даты.
<pubDate>Sun,19May200215:21:36GMT</pubDate> <item>Дочерний узел<guid>
<guid> — необязательный узел для <item>.
guid — это аббревиатура глобального уникального идентификатора. Это строка, которая однозначно идентифицирует элемент. Когда элемент публикуется, агрегатор может дополнительно использовать эту строку, чтобы определить, является ли элемент новым.
<guid>http://some.server.com/weblogItem3207</guid>
Для направляющих не существует особых правил синтаксиса; агрегатор должен рассматривать их как строку. Создает уникальный строковый GUID в зависимости от источника начального значения.
Если узел guid имеет атрибут isPermaLink и его значение равно true, читатель подумает, что это постоянная ссылка на элемент. Постоянная ссылка — это URL-ссылка, которую можно открыть в веб-браузере и которая указывает на все элементы, описанные узлом <item>.
<guid isPermaLink=true>http://inessential.com/2002/09/01.php#a2</guid>
isPermaLink — необязательный атрибут, значение по умолчанию — true. Если значение равно false, GUID не будет считаться URL-адресом или URL-адресом, указывающим на какой-либо объект.
<item>Дочерний узел<комментарий> <comment> — необязательный узел для <item>.Если он присутствует, он указывает на URL-адрес обзора элемента.
<comments>http://rateyourmusic.com/yaccs/commentsn/blogId=705245&itemId=271</comments>
<item>дочерний узел<автор> <author> — необязательный узел для <item>.Это адрес электронной почты автора статьи. Для газет и журналов, распространяемых через RSS, автором может быть лицо, написавшее статью, описанную в этом элементе. Для объединенных веб-блогов автор не может быть редактором или веб-мастером. Для личных блогов имеет смысл игнорировать узел <author>.
<author>[email protected] (Юрист Бойер)</author>