Эта глава показывает сеть не как фоновую инфраструктуру, а как центральную часть архитектуры глобального сервиса, особенно для ИИ-нагрузок и межрегионального перемещения данных.
В реальной инженерной работе она помогает учитывать топологию глобальной сети, защитное перенаправление маршрутов, управление трафиком и межрегиональные задержки как часть системного дизайна, а не как чужую зону ответственности.
В интервью и архитектурных обсуждениях она особенно полезна, когда нужно объяснить, как региональные сбои, перегрузка сети и хвостовая задержка начинают определять архитектуру не меньше, чем логика приложения.
Практическая польза главы
Практика проектирования
Помогает учитывать межрегиональную топологию и бюджет задержек при проектировании глобального сервиса.
Качество решений
Даёт ориентиры для маршрутизации ближе к пользователю, управления трафиком и устойчивости магистральной сети.
Аргументация на интервью
Позволяет объяснить, почему сеть становится частью архитектурной логики приложения.
Риски и компромиссы
Подсвечивает риск региональных сбоев, сетевой перегрузки и непредсказуемой хвостовой задержки.
Основной источник
Google Cloud Blog
Статья Google Cloud о глобальной сети нового поколения, построенной для нагрузок эпохи Gemini.
Эта глава суммирует эволюцию глобальной сети Google и её новые архитектурные принципы в эпоху ИИ. Материал основан на оригинальной статье Google Cloud и серии обзоров Книжный куб. Практический фокус: какие решения стоит перенести в системный дизайн при работе с глобальной сетью высокой пропускной способности, трафиком обучения и вывода моделей и требованиями к предсказуемой надёжности.
В этой главе рассматривается как , где , , и становятся частью архитектурного решения. Для ИИ-нагрузок важны не только и , но и , , и всей сетевой платформы. Когда такая сеть обслуживает облако, добавляются изоляция, , , , , , , , и . На уровне эксплуатации это превращается в , , , и .
Эволюция глобальной сети Google
Интернет-эпоха (2000-е)
От поисковых сервисов к собственной глобальной магистрали
Фокус был на быстром и надёжном доступе к поиску, почте и картам. Google строила частную магистральную сеть и крупные датацентры.
Эпоха потокового видео (конец 2000-х)
Сдвиг к видео и трафику, чувствительному к задержке
Рост YouTube и видеонагрузки потребовал снижать задержки и случайный разброс через кэширование ближе к пользователю, оптимизацию маршрутов и новые транспортные подходы.
Облачная эпоха (2010-е)
Изоляция, безопасность и SDN-управление на уровне облака
С ростом GCP усилились требования к мультиарендной изоляции, безопасности и управляемости сети через программные абстракции.
Масштаб сети сегодня по данным Google
2M+
миль оптоволокна
33
подводных кабеля
200+
точек присутствия (PoP)
3000+
точек сети доставки контента (CDN)
42
облачных регионов
127
зон доступности
Четыре вызова эпохи ИИ для сетевой архитектуры
Вызов 1
Глобальная сеть ощущается как локальная
Обучение базовых моделей требует связывать удалённые TPU/GPU-кластеры почти так же плотно, как стойки внутри одного датацентра.
Вызов 2
Почти нулевая терпимость к сбоям
Долгие контуры обучения и вывода чувствительны к сетевой деградации; переход на резервные пути должен занимать секунды, а не минуты.
Вызов 3
Безопасность и регулирование по умолчанию
Сеть должна одновременно поддерживать шифрование, изоляцию и ограничения на размещение данных для разных стран и клиентов.
Вызов 4
Операционная сложность растёт быстрее команд
Ручное управление не масштабируется линейно: нужны автоматизация, самовосстановление и прогнозирование ёмкости.
Новые принципы проектирования сети
Масштабирование через сетевые шарды
Сетевые шарды разделяются по контроллерам и каналам, поэтому пропускную способность можно наращивать параллельно и сдерживать радиус поражения.
По данным статьи, ёмкость WAN выросла в 7 раз за период 2020-2025.
Надёжность выше «пяти девяток»
Фокус смещается со средней доступности к редким, но дорогим инцидентам: длительные ИИ-нагрузки требуют предсказуемого поведения сети.
Protective ReRoute в статье связывается со снижением суммарного простоя до 93%.
Программируемость через намерения
Высокоуровневые сетевые намерения преобразуются SDN-контроллерами в конкретные решения по маршрутизации и безопасности.
В статье обсуждаются MALT-модели и открытые API как основа программируемости.
Автономные сетевые операции
ML и цифровые двойники помогают симулировать отказы, быстрее находить корневую причину и прогнозировать ёмкость с минимальным ручным вмешательством.
Реакция на инциденты эволюционирует от часов к минутам.
Что применить в собственном системном дизайне
- Думать о глобальной сети как о вычислительной ткани, а не только как о «транзитной трубе».
- Проектировать масштабирование через изоляцию доменов отказа: шарды, регионы и ячейки отказа.
- Формулировать сетевые намерения на языке требований бизнеса: задержка, суверенитет данных, безопасность и стоимость.
- Вкладываться в наблюдаемость и автоматизацию, чтобы сокращать MTTR и зависимость от ручного реагирования.
- Оценивать надёжность на хвосте распределения, а не только по средним SLA-метрикам.
Для связанного контекста: вводная по распределенным системам, консенсус и отказоустойчивость, принципы масштабируемых систем.
Источники
Google Cloud Blog: Google’s AI-powered next-generation global network
Основная статья Google Cloud, на которой построена глава.
Cloud WAN for the AI era
Как Google описывает глобальную сеть как облачный продукт для клиентов GCP.
Книжный куб: обзор #4030
Эволюция сети: интернет, потоковое видео и облако.
Книжный куб: обзор #4033
Четыре ключевых вызова сети в эпоху ИИ.
Книжный куб: обзор #4034
Четыре новых принципа проектирования сети.
Связанные главы
- Зачем нужны распределённые системы и консистентность - Объясняет, почему глобальная сеть становится частью распределённой архитектуры, а не внешней инфраструктурной деталью.
- Мультирегиональные и глобальные системы - Продолжает тему размещения данных, межрегионального трафика и устойчивости сервисов в разных частях мира.
- Принципы проектирования масштабируемых систем - Показывает, как планирование ёмкости, радиус поражения и устойчивость применяются к глобальным ИИ-нагрузкам.
- PACELC теорема - Даёт модель для оценки цены задержки и консистентности, которую напрямую задают глобальные сетевые решения.
- Консенсус: Paxos и Raft - Помогает связать стабильность сети с кворумами и согласованием состояния между удалёнными зонами.
- Синхронизация часов в распределённых системах - Раскрывает влияние задержек и случайного разброса сети на порядок событий, временные допущения и корректность протоколов.
- Зачем знать Cloud Native и 12 факторов - Связывает сетевую платформу с облачно-ориентированными практиками: изоляцией, автоматизацией и управляемостью сервисов.
- Kafka: The Definitive Guide, 2nd Edition (short summary) - Показывает сетевую цену потоковых платформ: межрегиональную репликацию, пропускную способность и восстановление при деградации WAN.
- Streaming Data (short summary) - Объясняет, как глобальная сеть влияет на задержку конвейеров и обработку непрерывных потоков данных.
- Google TPU: эволюция архитектуры и impact на ML-системы - Добавляет аппаратный и межсоединительный контекст эпохи ИИ: почему эволюция TPU повышает требования к глобальной сети.
