return

sysadmins №64. Observability на стероидах

7 мая 2026, 17:36

 

Когда у тебя 3 миллиарда семплов в секунду, 60 гигабайт логов и 44 миллиона спанов — ты уже не «настраиваешь мониторинг», ты его пишешь с нуля. В гостях Владимир Гордийчук, CTO Yandex Monium — системы наблюдаемости, которая выросла внутри Яндекса, а теперь доступна как отдельный продукт. 9 лет разработки, большая часть кодовой базы написана лично, и чёткое понимание, почему Prometheus + Grafana — это не всегда ответ.

Кто:

Владимир Гордийчук — CTO Yandex Monium

Что обсудим:

  • Зачем писать свой мониторинг, когда есть Prometheus, Grafana и ELK
  • 3 млрд семплов/сек — какие архитектурные подходы позволяют держать такие нагрузки
  • Сколько стоит мониторить всё — и как это обосновать перед менеджментом
  • Alert fatigue: когда алертов столько, что на них перестают смотреть, и что с этим делать
  • Кто мониторит мониторинг, когда мониторинг падает
  • Самые запоминающиеся инциденты — и почему после них мониторинг стал другим
  • Рекомендации, которые можно внедрить уже завтра

Для тех, кто хочет мониторить, а не тонуть в дашбордах и ложных срабатываниях.

Когда: 13.05.2026 14:00:. Ссылка на календарь.

Оставайтесь на связи

Пишите нам: info@linkmeup.ru
Канал в телеграме: t.me/linkmeup_podcast
Канал на youtube: youtube.com/c/linkmeup-podcast
Подкаст доступен в iTunes, Google Подкастах, Яндекс Музыке, Castbox
Сообщество в вк: vk.com/linkmeup
Группа в фб: www.facebook.com/linkmeup.sdsm
Добавить RSS в подкаст-плеер.
Пообщаться в общем чате в тг: https://t.me/linkmeup_chat

Поддержите проект:

like 0 views 396 message 0

0 коментариев

Ещё статьи

CC2019. Расшифровка доклада "Комплекс автоматизатора"
25-го августа в Питере на Chaos Construction 2019 я выступил с докладом о сетевой автоматизации. Сразу после доклада и после него ко мне подходили несколько раз с просьбой выложить слайды. ...
like 470 11358 0
26 августа 2019
Задача №8.10
Схема: Условие: Никакого BGP. ЛинкМиАп использует статические маршруты к провайдерам. На маршрутизаторе msk-arbat-gw1 настроена PBR: HTTP-трафик должен идти через провайдера Филькин Сертификат, а трафик из сети 10.0.2.0 должен идти через ...
like 0 2357 2
24 июня 2013
Анонс подкаста. Выпуск 26
Друзья, в силу колоссальной загруженности ведущих и гостей подкаста, в этот раз мы делаем эфир прямо сегодня, 25 числа. В 26 выпуске мы продолжаем тему SDN и на этот раз ...
like 0 5066 0
25 апреля 2015