ChatGPT против Google: Сколько энергии потребляет каждый из сервисов?

Краткий обзор ChatGPT и Google: основные сервисы и масштабы

В цифровую эпоху два гиганта определяют ландшафт информации и взаимодействия: Google, с его доминирующим поисковым сервисом и широким спектром других продуктов (Gmail, YouTube, Maps и т.д.), и быстро набирающий популярность ChatGPT от OpenAI, флагманская модель в области генеративного искусственного интеллекта, способная генерировать текст, код и многое другое.

Google управляет глобальной сетью массивных дата-центров, обрабатывающих петабайты данных ежедневно и обслуживающих миллиарды запросов. ChatGPT, как и другие крупные языковые модели (LLM), требует значительных вычислительных ресурсов как на этапе обучения (тренировки модели на огромных объемах данных), так и на этапе инференса (генерации ответов на запросы пользователей).

Актуальность вопроса энергопотребления в эпоху развития ИИ

Быстрое развитие и повсеместное внедрение искусственного интеллекта, особенно генеративных моделей, порождает новые вопросы об их воздействии на окружающую среду. Вычисления, лежащие в основе ИИ, требуют значительных объемов электроэнергии. Этот аспект становится все более актуальным на фоне глобальных вызовов, связанных с изменением климата и необходимостью устойчивого развития.

Понимание энергозатрат ИИ-сервисов важно не только с экологической точки зрения, но и с экономической. Энергия — это существенная статья расходов для компаний, предоставляющих такие услуги, что в конечном итоге может влиять на стоимость и доступность сервисов для конечных пользователей.

Почему сравнение энергозатрат ChatGPT и Google имеет значение для пользователей и индустрии

Для пользователей, которые ежедневно обращаются к поиску Google или взаимодействуют с ChatGPT, понимание энергоемкости этих процессов помогает осознать цифровой след их активности. Это стимулирует обсуждение более эффективного использования технологий и поддержки компаний, стремящихся к энергосбережению.

Для индустрии сравнение энергозатрат является ключом к оптимизации. Оно позволяет выявить наиболее ресурсоемкие этапы и компоненты, стимулируя исследования и разработки в области энергоэффективного оборудования, алгоритмов и архитектур. Такое сравнение также подталкивает к более прозрачной отчетности компаний о своем воздействии на окружающую среду.

Как измеряется энергопотребление ChatGPT?

Архитектура ChatGPT и ее влияние на энергозатраты (модели, обучение, inference)

ChatGPT основан на архитектуре Трансформер (Transformer), которая, хотя и является очень эффективной для обработки последовательностей данных, требует значительных вычислительных мощностей. Энергопотребление связано с двумя основными этапами:

Обучение (Training): На этом этапе модель обрабатывает огромные объемы текстовых данных для изучения закономерностей языка. Это чрезвычайно ресурсоемкий процесс, требующий длительной работы тысяч специализированных процессоров (GPU или TPU). Энергия расходуется на выполнение миллиардов операций умножения и сложения, а также на перемещение данных между памятью и процессорами.

Инференс (Inference): Это этап использования модели для генерации ответов на запросы пользователей. Каждый запрос активирует часть модели, выполняя необходимые вычисления для предсказания следующего слова или токена. Хотя один инференс-запрос менее энергоемок, чем обучение, совокупное потребление от миллиардов запросов может стать значительным.

Оценка энергопотребления при обучении и использовании ChatGPT: известные данные и оценки

Точные данные об энергопотреблении конкретных моделей, таких как GPT-3 или GPT-4, являются коммерческой тайной OpenAI. Однако существуют экспертные оценки и публикации, пытающиеся количественно оценить эти затраты. Например, по некоторым оценкам, обучение модели масштаба GPT-3 могло потребовать несколько тысяч мегаватт-часов (МВт*ч) электроэнергии. Это эквивалентно годовому потреблению небольшого города.

Энергопотребление на этапе инференса оценивается в гораздо меньших единицах на один запрос – от долей ватта-часа до нескольких ватт-часов, в зависимости от сложности запроса, размера модели и эффективности используемого оборудования. Однако, учитывая миллионы или миллиарды запросов в день, общее потребление может достигать сотен или тысяч МВт*ч в сутки.

Факторы, влияющие на энергопотребление ChatGPT: сложность запросов, размер модели и т.д.

На энергопотребление инференса ChatGPT влияют следующие ключевые факторы:

Размер модели: Более крупные модели (с большим количеством параметров) требуют больше вычислений на каждый токен.

Длина запроса и ответа: Чем длиннее входной запрос и генерируемый ответ, тем больше вычислительных шагов требуется.

Сложность запроса: Запросы, требующие более глубокого анализа или генерации сложного текста, могут быть более ресурсоемкими.

Эффективность оборудования: Тип и поколение используемых GPU/TPU, а также оптимизация программного обеспечения сильно влияют на энергоэффективность.

Нагрузка на серверы: Количество одновременных пользователей и запросов влияет на общее потребление дата-центра, обслуживающего ChatGPT.

Реклама

Энергопотребление Google: общая картина

Инфраструктура Google: дата-центры и вычислительные мощности

Google владеет и управляет одной из крупнейших и самых современных инфраструктур дата-центров в мире. Эти центры распределены по всему земному шару и обеспечивают работу всех сервисов компании – от поиска и Gmail до YouTube и Google Cloud. Инфраструктура включает в себя миллионы серверов, сетевое оборудование, системы хранения данных и, конечно, мощные системы охлаждения, которые являются значительным потребителем энергии.

Масштаб инфраструктуры Google огромен, что делает компанию одним из крупнейших корпоративных потребителей электроэнергии в мире.

Энергоэффективность Google: усилия компании по снижению энергопотребления

Google является одним из лидеров в области энергоэффективности дата-центров. Компания инвестирует в передовые технологии охлаждения (например, использование наружного воздуха или воды), оптимизацию серверного оборудования и разработку собственного аппаратного обеспечения (например, TPU для ускорения ИИ-вычислений), которое зачастую более эффективно для конкретных задач.

Google также стремится к 100% компенсации своего энергопотребления за счет покупки возобновляемой энергии, активно заключая контракты на поставку солнечной и ветровой энергии для своих операций. Это не снижает фактическое потребление, но компенсирует его воздействие на окружающую среду.

Энергопотребление различных сервисов Google (поиск, почта, карты и т.д.)

Энергопотребление Google распределяется между множеством сервисов. Поиск, вероятно, является одним из самых ресурсоемких из-за огромного объема запросов и необходимости индексировать и обрабатывать миллиарды веб-страниц. Однако даже такие сервисы, как YouTube (хранение и потоковая передача видео), Gmail (хранение и обработка электронной почты) и Google Maps (обработка геоданных и изображений), требуют значительных вычислительных и энергетических ресурсов.

В целом, энергопотребление Google представляет собой совокупную нагрузку от работы всех его сервисов, распределенную по глобальной инфраструктуре.

Сравнение энергопотребления ChatGPT и Google

Сопоставление данных об энергозатратах: ChatGPT vs. Google (поиск, другие сервисы)

Прямое сравнение общего энергопотребления ChatGPT (или OpenAI в целом) и Google затруднительно. Google — это зрелая компания с десятилетиями истории и диверсифицированным портфолио сервисов, каждый из которых вносит вклад в общую энергозатрату. OpenAI, будучи относительно новой организацией, сосредоточена на ИИ-исследованиях и продуктах, таких как ChatGPT, которые, однако, являются одними из самых вычислительно интенсивных в мире.

Общее потребление Google как корпорации на порядки выше, чем потребление, связанное только с ChatGPT, просто из-за масштаба деятельности и количества сервисов. Однако, если рассматривать потребление на единицу определенной задачи, картина может меняться.

Сколько энергии потребляет один запрос в ChatGPT по сравнению с одним поисковым запросом в Google?

Это, пожалуй, наиболее интересующий вопрос для пользователей. Оценки сильно разнятся, но общепринятое мнение склоняется к тому, что один запрос к ChatGPT потребляет значительно больше энергии, чем один поисковый запрос Google.

Поисковый запрос Google: Требует быстрого поиска по огромному индексу, ранжирования результатов и их отображения. Это высокооптимизированный процесс, занимающий доли секунды. Энергопотребление на один запрос оценивается в очень небольших величинах, возможно, на уровне долей ватт-часа или даже милливатт-часов.

Запрос к ChatGPT: Требует активации большой языковой модели для генерации связного и контекстуально релевантного текста. Этот процесс включает в себя множество операций с плавающей точкой и перемещений данных. Оценки энергопотребления на один запрос могут варьироваться от нескольких ватт-часов до десятков ватт-часов для более сложных запросов или более крупных моделей.

Таким образом, инференс ChatGPT на один запрос может быть в десятки или даже сотни раз более энергоемким, чем стандартный поисковый запрос.

Факторы, усложняющие прямое сравнение (разные задачи, архитектуры и т.д.)

Прямое сравнение осложняется несколькими факторами:

Разные задачи: Поиск — это извлечение информации, а генеративный ИИ — создание новой информации. Это принципиально разные вычислительные процессы.

Разные архитектуры: Модели, лежащие в основе поиска и LLM, имеют различную архитектуру и требования к вычислениям.

Масштаб и оптимизация: Поисковая инфраструктура Google оптимизировалась десятилетиями, достигнув выдающейся эффективности на запрос. Технологии инференса LLM активно развиваются, но еще не достигли такого уровня оптимизации в расчете на единицу полезного действия.

Прозрачность данных: Компании не публикуют детальную разбивку энергопотребления по каждому сервису или типу запроса.

Тем не менее, качественная оценка показывает, что генеративные ИИ-модели, такие как ChatGPT, на данный момент являются более энергоемкими в расчете на одно взаимодействие, чем традиционный веб-поиск.

Перспективы и будущее энергопотребления ИИ

Развитие более энергоэффективных моделей ИИ

Исследования активно ведутся в направлении создания менее ресурсоемких ИИ-моделей. Это включает в себя:

Квантование (Quantization): Снижение точности чисел (например, с 32-битных до 8-битных), используемых в вычислениях, что уменьшает объем данных и вычислительную нагрузку.

Прунинг (Pruning): Удаление


Добавить комментарий