Искусственный интеллект, особенно большие языковые модели (LLM), демонстрирует экспоненциальный рост вычислительных потребностей. Этот рост неизбежно влечет за собой увеличение потребления ресурсов, включая электроэнергию и, что менее очевидно, но не менее важно, воду, используемую преимущественно для охлаждения центров обработки данных (ЦОД).
Популярность ChatGPT и Google: влияние на потребление ресурсов
ChatGPT от OpenAI стал синонимом генеративного ИИ, обрабатывая миллионы запросов ежедневно. Google, гигант поиска и облачных вычислений, оперирует глобальной сетью ЦОДов, поддерживая свои многочисленные сервисы. Масштаб операций обеих компаний ставит вопрос об их экологическом следе, особенно в контексте использования водных ресурсов, на передний план.
Актуальность вопроса потребления воды большими языковыми моделями
По мере того как LLM становятся все более интегрированными в различные приложения, понимание их скрытых затрат, таких как потребление воды, становится критически важным. Вода – ограниченный ресурс, и интенсивное ее использование для охлаждения серверов, особенно в регионах с дефицитом воды, вызывает серьезную обеспокоенность. Оценка и сравнение водопотребления таких систем, как ChatGPT и Google Search, необходимы для разработки более устойчивых ИИ-решений.
Оценка водопотребления ChatGPT
Оценка точного потребления воды конкретной LLM сопряжена со сложностями из-за коммерческой тайны и различий в инфраструктуре. Тем не менее, исследования позволяют сделать некоторые выводы.
Факторы, влияющие на расход воды при обучении и работе ChatGPT
Основное потребление воды связано с двумя этапами жизненного цикла модели:
Обучение: Требует огромных вычислительных мощностей в течение длительного времени, что приводит к значительному выделению тепла и, соответственно, большому расходу воды на охлаждение.
Инференс (Работа): Каждый пользовательский запрос активирует модель, что также требует вычислений и охлаждения, хотя и в меньших масштабах по сравнению с обучением.
Ключевые факторы включают:
Размер и сложность модели: Более крупные модели (с большим количеством параметров) требуют больше вычислений.
Эффективность аппаратного обеспечения: Тип используемых процессоров (GPU, TPU) и их энергоэффективность.
Эффективность системы охлаждения ЦОД: Показатель PUE (Power Usage Effectiveness) и тип используемой системы охлаждения (воздушная, жидкостная, испарительная).
Климатические условия: Температура и влажность окружающей среды в месте расположения ЦОД.
Цифры и оценки: сколько воды тратит ChatGPT на один запрос/токен?
Прямые данные от OpenAI отсутствуют. Однако исследования, например, проведенные в Университете Калифорнии в Риверсайде, дают приблизительные оценки. Согласно одной из таких оценок, сессия взаимодействия с ChatGPT, включающая 10-50 запросов и ответов (в зависимости от сложности и длины), может косвенно потреблять около 500 мл воды. Это вода, используемая для охлаждения ЦОДов Microsoft Azure, где размещается модель.
Важно понимать, что это косвенная оценка, основанная на ряде допущений об инфраструктуре и эффективности охлаждения.
Сравнение водопотребления различных версий ChatGPT (GPT-3, GPT-4 и т.д.)
Точных сравнительных данных нет, но логично предположить, что более крупные и сложные модели, такие как GPT-4, требуют больше вычислительных ресурсов как для обучения, так и для инференса по сравнению с GPT-3 или GPT-3.5. Следовательно, их водопотребление на запрос, вероятно, выше, хотя оптимизации в архитектуре и инфраструктуре могут частично компенсировать этот рост.
Водопотребление Google: масштаб и особенности
Google управляет одной из крупнейших в мире сетей ЦОДов, и ее водопотребление значительно.
Общий объем водопотребления Google: центры обработки данных и охлаждение
Google публикует отчеты об устойчивом развитии, включая данные о водопотреблении. В 2022 году компания сообщила о потреблении 5.6 миллиардов галлонов (примерно 21.2 миллиарда литров) воды, что сопоставимо с годовым потреблением воды несколькими десятками полей для гольфа. Основная часть этого объема идет на охлаждение ЦОДов.
Водопотребление поиска Google: оценка в сравнении с другими сервисами
Выделить долю воды, потребляемую исключительно сервисом Google Search, сложно, так как инфраструктура используется совместно многими продуктами (YouTube, Gmail, Cloud). Однако поиск остается одним из ключевых и наиболее ресурсоемких сервисов. При этом Google десятилетиями оптимизирует инфраструктуру поиска, что может делать его относительно эффективным по сравнению с новыми, менее оптимизированными ИИ-сервисами в пересчете на запрос.
Использование возобновляемых источников энергии и стратегии Google для снижения воздействия на водные ресурсы
Google активно инвестирует в повышение эффективности своих ЦОДов и снижение экологического следа. Ключевые стратегии включают:
Использование передовых систем охлаждения, включая замкнутые циклы и использование непитьевой (например, переработанной или морской) воды там, где это возможно.
Оптимизация расположения ЦОДов с учетом климата и доступности возобновляемых ресурсов.
Инвестиции в возобновляемые источники энергии (Google заявляет о 100% покрытии своего энергопотребления за счет ВИЭ с 2017 года, хотя методология этого расчета вызывает дискуссии).
Цель – достичь работы на безуглеродной энергии 24/7 к 2030 году.
Сравнение: ChatGPT против Google – кто потребляет больше воды?
Прямое сравнение затруднено из-за различий в методологиях, типах операций и недостатка прозрачных данных.
Сопоставление показателей водопотребления в пересчете на одного пользователя/запрос
ChatGPT (оценка): ~500 мл на сессию из 10-50 запросов. Это означает десятки миллилитров на один сложный запрос-ответ.
Google Search (оценка): Точных публичных данных на запрос нет. Учитывая оптимизацию и масштаб, можно предположить, что потребление на один поисковый запрос значительно ниже, чем на один сложный генеративный запрос к ChatGPT. Однако совокупный объем воды, потребляемый Google Search из-за миллиардов запросов в день, огромен.
Таким образом, на один запрос ChatGPT, вероятно, потребляет больше воды, но общий объем водопотребления Google из-за масштаба операций значительно выше, чем у OpenAI (на данный момент).
Факторы, влияющие на различия в потреблении воды: архитектура моделей, инфраструктура и т.д.
Тип задачи: Генерация текста (ChatGPT) вычислительно сложнее, чем поиск и ранжирование информации (Google Search).
Оптимизация: Инфраструктура Google оптимизировалась десятилетиями; LLM – относительно новая область.
Инфраструктура: Google владеет и управляет своими ЦОДами, имея полный контроль над системами охлаждения. OpenAI использует мощности Microsoft Azure, полагаясь на их инфраструктуру и эффективность.
Масштаб: Общее количество запросов к Google на порядки превышает количество запросов к ChatGPT.
Критика методологий оценки водопотребления ИИ
Существующие оценки часто базируются на косвенных данных и допущениях:
Непрозрачность: Компании редко публикуют детальные данные о потреблении ресурсов конкретными моделями или сервисами.
Различия в PUE и WUE (Water Usage Effectiveness): Эффективность ЦОДов сильно варьируется.
Косвенное потребление: Учет воды, используемой для производства электроэнергии (особенно ГЭС и ТЭС), часто опускается.
Требуется разработка стандартизированных методологий и повышение прозрачности со стороны ИИ-компаний.
Пути снижения экологического воздействия больших языковых моделей
Снижение водного и энергетического следа LLM – ключевая задача для устойчивого развития ИИ.
Оптимизация алгоритмов и архитектур для уменьшения потребления ресурсов
Разработка более эффективных моделей (например, через дистилляцию, квантование, использование разреженных архитектур) может значительно сократить вычислительные затраты на инференс.
Использование более эффективных систем охлаждения для серверов
Внедрение жидкостного охлаждения, использование переработанной или морской воды, оптимизация воздушных потоков и повышение общей эффективности (PUE/WUE) ЦОДов.
Переход на возобновляемые источники энергии
Питание ЦОДов от ВИЭ (солнце, ветер) снижает косвенное потребление воды, связанное с генерацией электроэнергии на ТЭС и ГЭС.
Прозрачность и отчетность компаний в отношении экологического следа ИИ
Регулярная публикация отчетов об энерго- и водопотреблении, использование стандартизированных метрик и независимый аудит помогут оценить реальное воздействие и стимулировать прогресс в снижении экологического следа ИИ-индустрии.