Причина "падения" "Яндекса" - проблема с маршрутизацией в сети компании

14:44 22.08.2011 |   1113



Сбой на "Яндексе" был зафиксирован 19 августа, около 17:00. Перестал работать не только yandex.ru, но и остальные сервисы "Яндекса" : "Карты", "Почта", "Деньги", "Маркет", "Директ". В общей сложности поисковик и сервисы были недоступны почти 3 часа.

В официальном сообщении "Яндекса" объяснили причину "падения". Проблема была вызвана ошибкой программного обеспечения на маршрутизаторе, расположенном в новом дата-центре в Амстердаме. В "Яндексе" используются протоколы маршрутизации – внутренний протокол OSPF и внешний протокол BGP. Из-за ошибки информация обо всех внешних маршрутах оказалась во внутренних таблицах маршрутизации. Это примерно на три порядка больше маршрутов, чем обычно. Протокол OSPF не рассчитан на такое количество. В результате у всех маршрутизаторов кончилась память, и они перестали работать. Нарушилась работа сети, и через несколько минут "Яндекс" стал полностью недоступен.

Внутренняя сеть тоже не работала. Специалистам потребовалось потратить много времени для того, чтобы по цепочке добраться до источника проблемы.

Администраторы исправили ошибку на маршрутизаторе. После этого, чтобы снять лишнюю нагрузку с остальных маршрутизаторов, которых у "Яндекса" больше сотни, специалистам пришлось разделить сеть на несколько частей. Количество трафика снизилось, у маршрутизаторов появилось больше свободной памяти, и они смогли самостоятельно восстановить связность сети.

"Яндекс" принес извинения своим пользователям за сбой в работе.


Теги: