Простой протокол передачи
почты (SMTP)
- Модель протокола.
- Команды SMTP
- Последовательность команд SMTP
- Коды ответов SMTP
- Промежуточные агенты
Агент передачи почты - основной компонент
системы передачи почты Internet. Как уже говорилось,
МТА как бы представляет данный сетевой компьютер
для сетевой системы электронной почты.
Пользователи редко имеют дело с МТА, поскольку он
не вполне "дружелюбен", однако без него не
обходится ни одна почтовая система. После того
как UA пошлет сообщение в выходную очередь, за
дело принимается МТА. Он извлекает сообщение и
посылает его другому МТА. Этот процесс
продолжается до тех пор, пока сообщение не
достигнет компьютера-получателя. Для передачи
сообщений по TCP-соединению большинство МТА
пользуются протоколом SMTP. Сообщения
форматированы по правилам виртуального сетевого
терминала (NVT), то есть в NVT ASCII. NVT подобен
виртуальному сетевому протоколу и нужен затем,
чтобы скрыть различия в восприятии разными
компьютерами разных символов, например
переводов каретки, переводов строки, маркеров
конца строки, очистки экрана и т. д. Символ в NVT
состоит из семи битов набора ASCII и является
буквой, цифрой или знаком пунктуации. Семи битный
набор ASCII часто называется NVT ASCII.
Модель протокола.
Взаимодействие в рамках SMTP строится по
принципу двусторонней связи, которая
устанавливается между отправителем и
получателем почтового сообщения. При этом
отправитель инициирует соединение и посылает
запросы на обслуживание, а получатель - отвечает
на эти запросы. Фактически отправитель выступает
в роли клиента, а получатель - сервера.
Канал связи устанавливается непосредственно
между отправителем и получателем сообщения. При
таком взаимодействии почта достигает абонента в
течение нескольких секунд после отправки.
Команды SMTP
Простой протокол передачи почты обеспечивает
двухсторонний обмен сообщениями между локальным
клиентом и удаленным сервером МТА. МТА-клиент
шлет команды МТА-серверу, а он, в свою очередь,
отвечает клиенту. Другими словами, протокол SMTP
требует получать ответы (они описаны в этой главе)
от приемника команд SMTP. Обмен командами и
ответами на них называется почтовой транзакцией
(mail transaction). Данные, как мы уже говорили,
передаются в формате NVT ASCII. Кроме того, команды
тоже передаются в формате NVT ASCII. Команды
передаются в форме ключевых слов, а не
специальных символов, и указывают на
необходимость совершить ту или иную операцию. В
табл.1 приведен список ключевых слов (команд),
определенный в спецификации SMTP - RFC 821.
Таблица 1. Команды простого протокола
передачи почты (SMTP)
Команда |
Обязательна |
Описание |
HELO |
X |
Идентифицирует модуль-передатчик
для модуля-приемника (hello). |
MAIL |
X |
Начинает почтовую транзакцию,
которая завершается передачей данных в один или
несколько почтовых ящиков (mail). |
RCPT |
X |
Идентифицирует получателя
почтового сообщения (recipient). |
DATA |
|
Строки, следующие за этой
командой, рассматриваются получателем как
данные почтового сообщения. В случае SMTP, почтовое
сообщение заканчивается комбинацией символов:
CRLF-точка-CRLF. |
RSET |
|
Прерывает текущую почтовую
транзакцию (reset). |
NOOP |
|
Требует от получателя не
предпринимать никаких действий, а только выдать
ответ ОК. Используется главным образом для
тестирования.(No operation). |
QUIT |
|
Требует выдать ответ ОК и
закрыть текущее соединение. |
VRFY |
|
Требует от приемника
подтвердить, что ее аргумент является
действительным именем пользователя. (См.
примечание.). |
SEND |
|
Начинает почтовую транзакцию,
доставляющую данные на один или несколько
терминалов (а не в почтовый ящик). |
SOML |
|
Начинает транзакцию MAIL или SEND,
доставляющую данные на один или несколько
терминалов или в почтовые ящики. |
SAML |
|
Начинает транзакцию MAIL и SEND,
доставляющие данные на один или несколько
терминалов и в почтовые ящики. |
EXPN |
|
Команда SMTP-приемнику
подтвердить, действительно ли аргумент является
адресом почтовой рассылки и если да, вернуть
адрес получателя сообщения (expand). |
HELP |
|
Команда SMTP-приемнику вернуть
сообщение-справку о его командах. |
TURN |
|
Команда SMTP-приемнику либо
сказать ОК и поменяться ролями, то есть стать STMP-
передатчиком, либо послать сообщение-отказ и
остаться в роли SMTP-приемника. |
Примечание: В RFC 821 сказано, что команда VRFY не
является обязательной для минимального набора
команд SMTP. Однако в RFC 1123 <Требования для сетевых
компьютеров Internet - приложения и обеспечение
работы> (Requirements for Internet Hosts - Application and Support,Braden, 1989),
команда VRFY фигурирует в списке обязательных для
Internet команд реализации SMTP.
В соответствии со спецификацией команды,
помеченные крестиком (X) в табл.1, обязаны
присутствовать в любой реализации SMTP. Остальные
команды SMTP могут быть реализованы дополнительно.
Каждая SMTP-команда должна заканчиваться либо
пробелом (если у нее есть аргумент), либо
комбинацией CRLF. В описании команд употреблялось
слово <данные", а не <сообщение>. Этим
подчеркивалось, что, кроме текста, SMTP позволяет
передавать и двоичную информацию, например
графические или звуковые файлы. Другими словами,
SMTP способен передавать данные любого содержания,
а не только текстовые сообщения. Это значит, что,
рассматривая вопросы, касающиеся SMTP, не
забывайте, что термин "сообщениее"
обозначает не только текстовые данные.
Последовательность команд SMTP
Как мы уже отмечали, SMTP обеспечивает
двухстороннюю связь между агентами передачи
почты (МТА), клиентом и сервером. Клиенты шлют
команды серверу, а серверы отвечают клиентам.
Однако SMTP оговаривает последовательность SMTP-команд.
Лучший способ понять это - взглянуть на образец
почтовой транзакции. Следующий пример (он взят
целиком из RFC 821) демонстрирует типичную почтовую
транзакцию. В примере фигурирует мистер Smith (на
компьютере usc.edu), посылающий сообщения мистерам
Jones, Green и Brown (на компьютере mit.edu). Агент передачи
почты хоста mit.edu принимает почту для мистеров Jones
и Brown, однако не знает, где расположен почтовый
ящик мистера Green.
Для целей дальнейшего повествования каждой
строке присвоен номер и обозначено, кому они
принадлежат - передатчику или приемнику. Текст
справа от слов <RECEIVER> или <SENDER> содержит
действительно передаваемые данные. Трехзначные
цифровые комбинации в начале передаваемых строк
обозначают коды ответа (их значение объясняется
позже). Ответ SMTP похож на сообщения-подтверждения
о доставке, поскольку появляется лишь в том
случае, когда приемник получил данные.
1 |
RECEIVER |
220 mit.edu Simple Mail Transfer Service Ready |
2 |
SENDER |
HELO usc.edu |
3 |
RECEIVER |
250 mit.edu |
4 |
SENDER |
MAIL FROM: <Smith@usc.edu> |
5 |
RECEIVER |
250 OK |
6 |
SENDER |
RCPT TO:<Jones@mit.edu> |
7 |
RECEIVER |
250 OK |
8 |
SENDER |
RCPT TO:<Green@mit.edu> |
9 |
RECEIVER |
550 No such user here |
10 |
SENDER |
RCPT TO:<Brown@mit.edu> |
11 |
RECEIVER |
250 OK |
12 |
SENDER |
DATA |
13 |
RECEIVER |
354 Start mail input; end with <CRLF>.<CRLF> |
14 |
SENDER |
Blah blah blah... |
15 |
SENDER |
...etc. etc. etc. |
16 |
SENDER |
. |
17 |
RECEIVER |
250 OK |
18 |
SENDER |
QUIT |
19 |
RECEIVER |
221 mit.edu Service closing transmission channel |
Как видно из строки 1, когда SMTP-клиент
устанавливает TCP-соединение с портом протокола 25,
SMTP-сервер отвечает кодом 220. Это означает, что
соединение успешно установлено:
1. RECEIVER: 220 mit.edu Simple Mail Transfer Service Ready
После того как MTA компьютеров mit.edu и usc.edu
установили соединение и обменялись приветствием,
первой командой, согласно спецификации, должна
быть команда HELO. Как указано в строке 2,
SMTP-клиент передает HELO, указывая имя
своего компьютера в качестве аргумента. Другими
словами, он сообщает: <Привет, я - usc.edu>. Команда HELO
употребляется с аргументом, как показано ниже:
2. SENDER: HELO usc.edu
В ответ на HELO приемник выдает код 250,
сообщая передатчику о том, что команда принята и
обработана:
3. RECEIVER: 250 mit.edu
После установления TCP-соединения и
идентификации (при помощи HELO) SMTP-клиент
приступает к почтовой транзакции. Для начала он
выполняет одну из следующих команд: MAIL, SEND, SOML или
SAML. В нашем примере использована команда
MAIL:
4. SENDER: MAIL FROM:<Smith@usc.edu>
Все четыре команды, MAIL, SEND, SOML и SAML,
имеют одинаковый синтаксис:
MAIL <пробел> FROM:<reverse-path> <carriage-return
line-feed>
Примечание: Команды SEND, SOML и SAML
дополнительны и используются довольно редко.
Аргумент <обратный путь> (reverse path) указывает
серверу, кому в случае ошибки отослать
соответствующее сообщение. Мы еще рассмотрим его
подробнее. На данный момент для нас важно, что в
аргументе содержится адрес источника сообщения (в
нашем случае, Smith@usc,edu). После того как сервер
выдал код ответа 250 (строка 5), согласившись
обработать сообщение от Smith@usc.edUt необходимо
указать получателя сообщения. Это делается при
помощи команды RCPT. Команда RCPT имеет аргумент - имя
получателя. На одну команду приходится только
одно имя, поэтому, если получателей несколько,
команда RCPT выдается несколько раз. В
нашем примере команды RCPT выполняются в
строках 6, 8 и 10. Синтаксис RCPT похож на
синтаксис команды MAIL:
RCPT <пробел> TO:<forward-path> <CRLF>
Однако, в отличие от MAIL, аргумент RCPT
начинается со слова <ТО:>. Содержимое
аргумента - путь передачи сообщения (forward path), а не
обратный путь. На данный момент для нас важно, что
в пути передачи сообщения указано имя почтового
ящика получателя. Выдав команду RCPT, МТА-клиент
ожидает получить ответ с кодом 250. Однако в ответ
на восьмую строку
8. SENDER: RCPT TO:<Green@mit.edu>
сервер отвечает кодом 550:
9. RECEIVER: 550 No such user here
Код ответа 550 означает, что МТА не в состоянии
выполнить запрос клиента, поскольку не знает, как
доставить почту указанному пользователю. То есть,
скорее всего, у мистера по фамилии Green нет
почтового ящика (Green@mit,edu) на этом компьютере. В
протоколе SMTP сказано, что сервер обязан
информировать клиента об отсутствии почтового
ящика получателя сообщения. Однако в
спецификации SMTP ничего не говорится о том, как
клиент должен реагировать на это сообщение.
После того как посланы все команды RCPT,
клиент начинает передачу данных при помощи
команды DATA. В строке 12 показано, как МТА-клиент
(передатчик) высылает команду DATA, в
строке 13 - как сервер отвечает кодом 354. Этот код
означает, что передача данных разрешена и должна
заканчиваться комбинацией CRLF-<точка>-CRLF (новой
строкой, содержащей только точку).
12. SENDER: DATA
13. RECEIVER: 354 Start mail input; end with <CRLF>.<CRLF>
После того как получен код 354, клиент может
начать передачу данных. МТА-сервер, в свою
очередь, помещает принятые данные в очереди
входящих сообщений. Сервер не высылает никаких
ответов до тех пор, пока не получит комбинацию CRLF-точка-CRLF
от клиента, означающую конец передачи данных. Как
показано в строках 16 и 17, в ответ на полученную
комбинацию CRLF-<точка>-CRLF, сервер выдает код 250.
Как мы уже говорили, код ответа 250 означает
успешное окончание операции:
16. SENDER: .
17. RECEIVER: 250 OK
Для того чтобы закончить почтовую транзакцию,
клиент, по правилам SMTP, обязан послать команду QUIT.
Сервер, в свою очередь, отвечает кодом 221. Этот код
подтверждает клиенту, что соединение будет
закрыто, после чего соединение действительно
закрывается:
18. SENDER: QUIT
19. RECEIVER: 221 mit.edu Service closing transmission channel
В любой момент во время транзакции клиент может
использовать команды NOOP, HELP, EXPN и VRFY.
В ответ на каждую команду сервер высылает
клиенту определенную информацию. Конечно, в
зависимости от ответа клиент может предпринять
определенные действия, однако спецификация SMTP
ничего не говорит по этому поводу. Например,
клиент-МТА может передать команду VRFY для того,
чтобы убедиться, что имя пользователя
действительно. Если сервер ответит, что данного
имени не существует, клиент МТА может не
передавать почту для этого пользователя. В
спецификации SMTP, однако, на этот счет нет никаких
указаний - клиент может ничего не делать в ответ
на команду VRFY. МТА-клиент может ничего не
делать также в ответ на команды NOOP, HELP
и EXPN - ответственность целиком лежит на
разработчике конкретной реализации МТА.
Коды ответов SMTP
В спецификации SMTP требуется, чтобы сервер
отвечал на каждую команду SMTP-клиента. МТА-сервер
отвечает трехзначной комбинацией цифр,
называемой кодом ответа. Вместе с кодом ответа,
как правило, передается одна или несколько строк
текстовой информации.
Примечание: Несколько строк текста, как
правило, сопровождают только команды EXPN
и HELP.В спецификации SMTP, однако, ответ на
любую команду может состоять из нескольких строк
текста.
Каждая цифра в коде ответа имеет определенный
смысл. Первая цифра означает, было ли выполнение
команды успешно (2), неуспешно (5) или еще не
закончилось (3). Как указано в приложении Е
документа RFC 821, простой SMTP-клиент может
анализировать только первую цифру в ответе
сервера, и на основании ее продолжать свои
действия. Вторая и третья цифры кода ответа
разъясняют значение первой. Если вы
разрабатываете SMTP-приложение, обязательно
изучите конструкцию всех кодов SMTP-ответа. То, как
коды составлены в самом SMTP - превосходный образец
грамотного подхода к делу. В табл.2 приведены
возможные значения кодов ответа SMTP, определенные
в RFC 821.
Таблица 2. Коды ответа SMTP и их значение
Код |
Значение |
211 |
Ответ о состоянии системы или
помощь |
214 |
Сообщение-подсказка (помощь) |
220 |
<имя_домена> служба готова к
работе |
221 |
<имя_домена> служба закрывает
канал связи |
250 |
Запрошенное действие почтовой
транзакции успешно завершилось |
251 |
Данный адресат не является
местным; сообщение будет передано по маршруту
<forward-path> |
354 |
Начинай передачу сообщения.
Сообщение заканчивается комбинацией CRLF-точка-CRLF |
421 |
<имя_домена> служба недоступна;
соединение закрывается |
450 |
Запрошенная команда почтовой
транзакции не выполнена, так как почтовый ящик
недоступен |
451 |
Запрошенная команда не выполнена;
произошла локальная ошибка при обработке
сообщения |
452 |
Запрошенная команда не выполнена;
системе не хватило ресурсов |
500 |
Синтаксическая ошибка в тексте
команды; команда не опознана |
501 |
Синтаксическая ошибка в
аргументах или параметрах команды |
502 |
Данная команда не реализована |
503 |
Неверная последовательность
команд |
504 |
У данной команды не может быть
аргументов |
550 |
Запрошенная команда не выполнена,
так как почтовый ящик недоступен |
551 |
Данный адресат не является
местным; попробуйте передать сообщение по
маршруту <forward-path> |
552 |
Запрошенная команда почтовой
транзакции прервана; дисковое пространство,
доступное системе, переполнилось |
553 |
Запрошенная команда не выполнена;
указано недопустимое имя почтового ящика |
554 |
Транзакция не выполнена |
Промежуточные агенты
Термин "маршрут доставки" (forward-path) служит
для того, чтобы отличать почтовый ящик (mailbox), имя
которого абсолютно, от пути (он может быть
различным), по которому следует почта.
Предположим, что мы хотим доставить два почтовых
сообщения на один и тот же сетевой компьютер. Оба
сообщения имеют один и тот же адрес, однако не
обязательно будут следовать по одному и тому же
маршруту. Точно так же, если на пришедшие
сообщения выдаются ответы, они не обязательно
будут следовать по указанному обратному
маршруту (reverse-path). Как правило, конкретный
маршрут для почты выбирается системным
администратором. Чтобы направить почту по
нужному пути, используются значения маршрута
доставки и обратного маршрута, в которых
указываются промежуточные агенты (relay agents).
Промежуточный агент доставки - это МТА, так
называемый почтовый хаб (mail hub), настроенный на
передачу транзитной почты. Чтобы доставить
сообщение, местный агент пользователя (UA)
передает его местному МТА, который, в свою
очередь, передает его промежуточному агенту МТА.
В следующем примере Smith@usc.edu является почтовым
ящиком, a HOSTI, HOST2 и HOST3 - промежуточными агентами:
MAIL FROM:<@HOSTI, @HOST2, @HOST3:Smith@usc.edu>
В наше время промежуточные агенты присутствуют
практически во всех сетях, входящих в Internet. На рис.6
приведена типичная конфигурация почтовой
системы Internet с участием промежуточных агентов.
Чтобы упростить процесс конфигурации почтовой
системы, в локальной сети устанавливается один
компьютер, служащий промежуточным агентом (relay
host). Вся почта пользователей попадает сначала на
него. Затем этот компьютер рассылает сообщения
по Internet. Кроме всего прочего, такой компьютер
может служить защитой фирмы от взломщиков-хакеров
из Internet. Ограничивая общение локальной сети с
внешним миром до уровня почты, организация
сводит до минимума риск нежелательного
вторжения в свои собственные системы.
Кроме того, администрировать и защищать в этом
случае приходится единственный компьютер. SMTP в
состоянии послать сообщение непосредственно с
компьютера пользователя на компьютер адресата в
том случае, если между ними существует прямое
почтовое соединение. К сожалению, это далеко не
всегда так. Как правило, между двумя компьютерами
находится один или несколько промежуточных
агентов. Чтобы обеспечить доставку, в почтовом
сообщении нужно указать имя компьютера-получателя
и точное наименование почтового ящика.
Аргументом команды MAIL является обратный маршрут,
включающий имя источника сообщения и имена всех
промежуточных агентов. Аргумент команды RCPT -
маршрут доставки, содержащий имя получателя
сообщения. Обратный маршрут описывает путь,
который прошло сообщение, тогда как маршрут
доставки идентифицирует место назначения.
Обратный маршрут используется SMTP, когда нужно
передать сообщение о случившейся ошибке или о
невозможности доставить сообщение, когда оно уже
прошло через промежуточный агент. По мере
продвижения сообщения по Internet записи о его
маршрутах изменяются. В обязанности системных
администраторов входит правильно настраивать
местные МТА на передачу сообщений
промежуточному агенту, и наоборот, промежуточные
агенты на доставку сообщений местным МТА. Если у
промежуточного МТА изменится имя, все, что нужно
сделать в конфигурации местного МТА - изменить
имя компьютера в системе DNS.
Другие параметры конфигурации не изменяются.
Другими словами, повторим еще раз, что иметь один
компьютер для промежуточной доставки - значит,
снять с себя значительную часть головной боли по
настройке почтовой системы - ведь придется
заботиться только об одном компьютере.
Рассмотрим почтовую транзакцию между
промежуточными агентами SMTP. До того как
сообщение будет передано следующему указанному
в маршруте (в поле ТО:) компьютеру, имя данного
компьютера удаляется из маршрута доставки и
добавляется в начало обратного маршрута. К тому
моменту, когда сообщение достигнет пункта
назначения, маршрут доставки будет содержать
только имя почтового ящика. В RFC 821 приведен
пример того, как изменяется содержимое маршрутов
по мере обработки почтового сообщения. Когда
промежуточный агент А получает почту со
следующими аргументами:
FROM: <USERX@HOSTY.ARPA>
TO: <@HOSTA.ARPA, @HOSTB.ARPA: USERC@HOSTD.ARPA>
он переправляет почту сетевому компьютеру В со
следующими аргументами:
FROM: <@HOSTA.ARPA: USERX@HOSTY.ARPA> TO: <@HOSTB.ARPA: USERC@HOSTD.ARPA> .
Как видим, промежуточный агент A (HOSTA.ARPA) убрал
свое имя из заголовка <ТО:> и добавил в
заголовок <FROM:>. Промежуточный агент
компьютера В совершит аналогичное действие, и
следующим пунктом назначения сообщения будет
почтовый ящик USERC на компьютере HOSTD.ARPA.
Примечание: Другими словами, обратные
маршруты и маршруты доставки строятся агентами
передачи почты по мере прохождения сообщения от
одного агента к следующему. Если очередной на
пути сообщения SMTP-агент не умеет обслуживать
промежуточную доставку, он должен ответить таким
же кодом, какой предусмотрен на случай
отсутствия местного почтового ящика. |