Принцип работы протокола NNTP
🕛 27.06.2009, 14:44
Современные серверы новостей используют для обмена между собой и для взаимодействия с клиентами протокол NNTP (Network News Transfer Protocol - протокол передачи сетевых новостей). Как правило, серверы NNTP используют порт 119. Следует заметить, что распространение групп новостей не всегда осуществлялось посредством протокола NNTP. Более того, на ранних этапах развития данной службы материалы передавались в сетях, отличных от TCP/IP. Несмотря на то что NNTP - не единственный протокол, применяемый для поддержки новостей, в сетях ТСРЛР он используется для этой цели наиболее часто.При работе протокола NNTP происходит обмен сообщениями, которые также называют статьями. Сообщение - это отдельный документ, автором которого является один пользователь. (Существуют средства для работы нескольких пользователей над одним документом, но на практике подобное взаимодействие осуществляется крайне редко.) Сообщения объединяются в группы. Одно сообщение может быть отправлено одновременно в несколько групп, но такое дублирование во многих случаях нежелательно. Группы новостей, в свою очередь, объединяются в категории, организуя иерархию групп. Полное имя группы состоит из нескольких компонентов, разделяемых точками. Имена групп создаются по тому же принципу, что и имена каталогов файловой системы. В начале расположено имя, определяющее общую тему, а затем тема уточняется. Например, группы comp. os . linux. miscи comp. os . linux. hardware принадлежат категории comp. os. linux, и темы этих групп сходны. Материалы группы comp. dcom. modems существенно отличаются от comp. os . linux. misc и comp. os . linux. hardware, а группа rec. arts . sf. dune не имеет ничего общего с перечисленными выше группами.
Когда пользователь посылает сообщение, сервер добавляет к нему поле заголовка Message-Id, содержащее идентификационный код. Этот код состоит из последовательного номера, генерируемого сервером, и имени сервера. Поскольку идентификатор содержит имя сервера, он является уникальным во всей системе Usenet. Посредством идентификаторов сервер новостей определяет, какие сообщения были просмотрены и какие должны быть переданы клиенту.
Для взаимодействия серверов новостей используются два типа протокола NNTP: протокол передачи (push protocol) и протокол получения (pull protocol). Во время передачи данных один из серверов выступает в роли клиента, а другой - в роли сервера. При использовании протокола передачи клиент сообщает серверу о каждом имеющемся у него сообщении, передавая его идентификатор. Сервер ищет это сообщение в своей базе данных и определяет, нужно ли оно ему. Процесс повторяется для каждого сообщения, которые присутствуют на сервере, выполняющем в процессе взаимодействия роль клиента. При этом производятся многочисленные обращения к базе данных. Альтернативой протоколу передачи является протокол получения, при использовании которого принимающий сервер выступает в роли клиента. Сначала принимающая система получает полный список сообщений, поступивших на сервер с указанного момента, а затем запрашивает конкретные сообщения. Такой протокол работает более эффективно, но при этом необходимо принимать меры предосторожности, чтобы сервер не передал сообщение, предназначенное для внутреннего использования.
Поскольку пользователи постоянно присылают новые сообщения, сервер должен удалять устаревшие статьи, в противном случае жесткий диск быстро переполнится. (На самом деле угроза переполнения диска существует даже тогда, когда старые сообщения периодически удаляются с сервера.) Обычно сообщения удаляются с сервера через определенное время после их поступления. Время хранения сообщений на сервере зависит от многих факторов, например, от имеющегося в наличии дискового пространства, от количества поддерживаемых групп новостей, от трафика, связанного с передачей сообщений в эти группы, и от того, насколько популярна та или иная группа среди пользователей. Серверы новостей позволяют устанавливать для разных групп новостей различное время хранения материалов.
Независимо от используемого протокола и времени хранения сообщений, в передаче материалов групп может участвовать несколько компьютеров. Серверы новостей взаимодействуют друг с другом, образуя сложную структуру. Передача материалов групп от одного сервера другому называется поставкой новостей. Как правило, небольшие серверы, подключенные через линии с относительно невысокой пропускнои способностью, получают материалы групп у крупных серверов. Например, сервер, находящийся в небольшом колледже (назовем его условно Tiny College), может получать содержимое групп новостей у сервера большого университета (Pangaea University). Это означает, что основная часть сообщений, находящихся на сервере news . tiny. edu, получена с сервеpa news . pangaea. edu. Однако часть данных может передаваться и в противоположном направлении, так как пользователи news . tiny, edu посылают свои сообщения в группы и эти сообщения должны быть доставлены на сервер news .pangaea. edu. Кроме того, в Tiny College могут поддерживаться свои группы новостей; при передаче этих групп news . tiny. edu станет поставщиком для news . pangaea. edu. Pangaea University, в свою очередь, получает и т. д.
В службе новостей не соблюдается строгая иерархия. Например, не исключено, что на сервере news . pangaea. edu не поддерживаются некоторые группы, в которых испытывают необходимость пользователи news . tiny. edu. В этом случае администратор Tiny College должен принять меры для получения материалов этих групп с другого сервера. То же самое делает администратор Pangaea University для получения групп, необходимых его пользователям. Не все группы, находящиеся у поставщика новостей, должны быть переданы. С целью экономии дискового пространства получатель может отказаться от некоторых групп и даже от целых категорий групп, не требующихся пользователям.
В результате взаимодействия серверов новостей формируется система, в которой несколько крупных серверов являются поставщиками новостей для других серверов меньшего размера. Эти серверы, в свою очередь, поставляют материалы групп другим серверам и т. д. Любой из серверов новостей может обслуживать клиентские программы. Клиентские программы, или программы просмотра новостей, также используют протокол NNTP. Они могут принимать и передавать сообщения, но не могут выступать в качестве поставщиков новостей. Помимо обмена материалами групп, серверы также модифицируют заголовки сообщений, включая в них идентификаторы серверов, а часто и идентификаторы клиентов, с которых были переданы сообщения.
Необходимо помнить, что поток сообщений передается в обоих направлениях. Если бы новые сообщения не передавались от сервера, получающего материалы, серверу, выступающему в роли поставщика, то у поставщика не было бы материалов групп. Крупные серверы выполняют функции "накопителей", на которые стекаются новые сообщения от пользователей. Но следует заметить, что небольшие серверы получают от поставщиков новостей гораздо больший объем материалов, чем они генерируют сами.