ВЗГЛЯД / #7_2023

Климат-контроль заемщиков

Беседовала Ирина ДОРОХОВА / Фото: Unsplash.com
Климатические изменения и вызванные ими катаклизмы наносят прямой ущерб экономике и бизнесу. Старший преподаватель и ассистент-­профессор в «Сколтехе» Алексей Зайцев и его заместитель Александр Булкин рассказали о том, как они создают модель, которая будет учитывать возможность возникновения неблагоприятных событий или климатических процессов при оценке рисков заемщиков.
Александр БУЛКИН
Алексей
ЗАЙЦЕВ
Расскажите, пожалуйста, о том, чем вы занимаетесь.

Алексей Зайцев. Я окончил МФТИ, факультет управления и прикладной математики, с четвертого курса — ​на кафедре, где занимаются машинным обучением и анализом данных. Сейчас в «Сколтехе» руковожу лабораторией автономных робототехнических систем (ЛАРС), специализируюсь на машинном и глубинном обучении нейросетей. Мы строим различные модели и проверяем, насколько они хороши. Работаем с экспертами и постановщиками задач. Последний этап работы — ​использование нашей модели и ее валидация, проверка того, насколько хорошо она работает, то есть решает поставленные задачи.

Часть моих сотрудников занимаются фундаментальными вопросами, например, изучают искусственный интеллект и пытаются его совершенствовать. Другие работают над конкретными проектами и используют искусственный интеллект для решения практических задач.

Александр Булкин. Мой проект называется «Анализ физических и финансовых рисков, создаваемых климатическими изменениями», но фактически мы занимаемся финансовой оценкой климатических рисков.

К­то-то из специалистов-­климатологов с вами сотрудничает?

АБ. Конечно, мы советуемся с коллегами. Например, по вопросам многолетней мерзлоты нам помогает Олег Александрович Анисимов. Это российский климатолог, лауреат Нобелевской премии в области климата, получивший ее в составе межправительственной группы экспертов ООН по изменению климата.

А со стороны финансового сектора?

АЗ. Направление оценки климатических рисков действует в рамках Центра прикладного искусственного интеллекта. Он получил совместный грант от «Газпромнефти», «Сбербанка» и правительства Российской Федерации. Основная цель проекта — ​предложить способы использования искусственного интеллекта для решения проблем ESG. В узком смысле — ​связанных с изменениями окружающей среды.

АБ. Важно понимать, что наша цель — ​не прогноз погоды на несколько дней, нас интересуют изменения климата в течение многих лет. Это важно для банковской оценки риска — ​именно поэтому в проекте участвует «Сбербанк» как функциональный заказчик, который в перспективе будет учитывать данные наших моделей при расчете кредитных ставок.

Приведите, пожалуйста, пример работы такой модели.

АЗ. Представьте себе фермера, желающего взять кредит для развития своего хозяйства. В модель вводятся данные о географическом расположении фермы, и составляется прогноз на несколько лет с учетом исторических данных и динамики изменения климата. Смотрим риски: вероятность засухи или, наоборот, затопления — ​катаклизмов, которые повлияют на способность предпринимателя выплачивать кредит. Исходя из этих данных, будет определяться ставка, по которой фермеру дадут кредит.

Но климатические изменения — ​это многолетний процесс, а кредиты фермерам выдаются на меньший срок — ​вряд ли больше двух десятков лет. Как тогда применять модель?

АБ. Мы не можем учесть все климатические события, поскольку некоторые явления физически сложны. Поэтому рассматриваем исключительно те, которые способны промоделировать. Их можно разделить на две категории. Во-первых, это экстремальные события: растепление, засухи, ураганы, разливы рек и вызванные ими наводнения, таяние вечной мерзлоты; во‑вторых, долгосрочные процессы, например, повышение средней температуры.

Что вы берете в качестве исходных данных? Каков ареал этих данных?

АБ. Все зависит от типа событий. Например, нам надо выяснить, где высока вероятность внезапного сильного ветра. Первый источник данных — ​это метеостанции: порядка 520 станций Росгидромета, где информация собирается в автоматическом режиме, еще примерно 2 тыс. — ​вручную. Для нашей огромной территории этого мало; например, в Краснодарском крае всего семь метеостанций. Кроме того, при ручном сборе информации неизбежно влияние человеческого фактора.

Второй источник — ​это реанализ. Мы берем результаты исследований специализированных институтов. Они берут исторические данные, начиная с 1950‑х годов, и с помощью сложного физического вероятностного моделирования строят дата-сеты, описывающие климатические переменные в той или иной области. Это важные данные, но сильно сглаженные. Например, обратившись к информации с метеостанции ­где-нибудь в Алтайском крае, мы увидим сильный ветер порядка 27 м/с, а в данных реанализа будет не больше 20 м/с.

Третий источник данных — ​это климатические переменные. Они также задаются моделями, но иными. Например, на основе измерений, выполненных по всей планете с помощью моделей, учитывающих различные концентрации выбросов парниковых газов в различных сценариях, строятся прогнозы климатических параметров вплоть до 2100 года.
Где вы берете такие модели?

АБ. Например, их создает ERA5 от Google Earth. Дата-сеты предоставляет их подразделение Сopernicus. Для исследований многолетней мерзлоты мы берем данные из модели, разработанной Global Terrristial Network for Permafrost.

АЗ. Таким данным можно доверять, они многократно валидируются. Эти модели появились несколько лет назад, и они постоянно совершенствуются.

В чем заключается роль вашей команды?

АБ. Климатическая модель — ​разумеется, не наше изобретение, но мы ее сильно уточнили, добавив много параметров и данных.

АЗ. Мы берем все типы данных, реальные и аналитические, в том числе три сценария развития ситуации в зависимости от объемов выбросов СО2 (базовый, оптимистичный и пессимистичный), и строим несколько вариантов собственной модели. Сейчас в моде физически информированное машинное обучение. Суть его в том, чтобы в модель закладывать не только данные, но и критические модели, анализирующие данные, которые можно использовать вместе с исходными. По сути, это модель, вшитая внутрь другой модели.

С помощью нашей модели можно решить, например, такую задачу: посмотреть, как будет развиваться ситуация в строительном секторе с учетом деградации вечной мерзлоты.

Вы проверяете, насколько ваши модели совпадают с реальностью?

АБ. На этот вопрос ответ многосоставный. Чем больше у нас фактических данных, тем точнее модель. Например, в районе Норильска измерения метеостанции показывали, что сезонное протаивание мерзлоты составляет три метра. Но когда чуть в стороне от метеостанции в землю воткнули щуп, он ушел вглубь на шесть метров. В идеале в России надо создать единую систему мониторинга вечной мерзлоты: обвесить всю эту зону датчиками и собирать качественный дата-сет. Это не очень большие вложения, и они быстро окупятся. Исправлять дороже.

Например, при строительстве детского сада в Салехарде, видимо, были допущены ошибки в исследовании почв. В результате часть здания начала проседать, стена треснула, садик пришлось закрыть. Строительная компания вынуждена была поставить на фундамент охладительную систему. А в этом году в том же детском саду провалилась площадка для прогулок.

Поскольку растепление вечной мерзлоты прогрессирует, нашу модель можно было бы использовать для корректировки строительных норм и правил. Если заложить в них динамические параметры растепления, архитекторы будут понимать, на какую глубину вбивать сваи с учетом эксплуатации здания в течение 50 лет. Конечно, с точностью до сантиметра глубину определить не получится, но «красную зону» подсветить можно. Большая часть риска таким образом будет минимизирована.

Еще хуже ситуация с разливами рек. В теории нам нужны точные значения с гидропостов по высоте уровня воды, причем в динамике, а на практике мы можем получить только исторические сведения от МЧС.
Как же вы валидируете свои модели?

АЗ. Делаем «прогноз на вчера». Обучаем модель на данных, скажем, 2015 года и задаем задачу: составить прогноз на 2016 год, а потом смотрим, что на самом деле происходило в 2016 году. Например, мы «предсказали» сильный ветер в районе Японского моря в декабре 2016 года, потом посмотрели тогдашние новости — ​и действительно, там был шторм.

С помощью таких «прогнозов» мы понимаем, насколько модель ошибается, и разрабатываем корректировки. Кроме того, мы единственные в России прогнозируем не только точные значения, но и интервальные, с диапазоном разброса результата. Поскольку часто необходимо бывает выяснить вероятность и силу экстремального события, нужно просто оценить, будет ли, например, протаивание грунта выше или ниже заданного порога.

Можно ли для повышения достоверности предложить региональным властям или МЧС обмерить ­какой-то единичный объект? Например, одну реку в Иркутской области, где часто случаются разливы.

АЗ. Это было бы полезно: если мы построим хорошую модель для небольшого объекта, то и на более крупных объектах она будет точнее работать. Очень важна возможность собирать данные в режиме онлайн.

Высокое качество данных — ​в нефтяной отрасли. Хотя и там есть удивительные случаи: мы ­как-то хотели проанализировать аварии с турбинами, но оказалось, что данные с них собирают в течение двух месяцев, а потом жесткий диск переполняется, и их просто удаляют. Этот пример показывает, что надо повышать культуру работы с данными. Когда повсеместно появится понимание того, что информация — ​это деньги, то, наверное, данные начнут собирать и хранить.

Но работа турбины — ​это дело отдельной компании. А вот ликвидация последствий разливов и эвакуация людей — ​это государственная задача. Вы не обращались, например, к губернаторам?

АБ. Нет, хотя это можно сделать. Мы можем проконсультировать насчет того, где поставить датчики уровня и расхода воды, сколько их нужно и каковы будут затраты. Был в этом смысле интересный пример: одна израильская компания разместила различные датчики, собирающие климатические данные, по всей территории Грузии, потому что в этой стране, благодаря ее рельефу, присутствуют все климатические пояса. Теперь собранный дата-сет используется для нужд израильской армии.

Но я бы начал с создания системы мониторинга многолетней мерзлоты: ею покрыто 65 % России. При этом только на поддержание газотранспортной системы тратится — ​и это по старым данным — ​порядка 150 млрд руб. в год. Наш мониторинг, возможно, позволил бы эту сумму сократить.

АЗ. Однако мы ­все-таки просчитываем вероятность. И пока никто не хочет тратить миллион сейчас, чтобы сэкономить сто миллионов в будущем. Горизонт планирования невысокий, в этом проблема.
Хорошо. Следующий этап задачи — ​перевести прогноз климатической ситуации в деньги. Как это происходит?

АБ. Есть два варианта. Мы получаем на выходе климатической модели пространственно-­временное распределение вероятности некоего события. Дальше в зависимости от риска подключается расчет ущерба. Например, в случае сильного ветра используется шкала Бофорта (условная шкала для визуальной оценки силы/скорости ветра в баллах по его воздействию на наземные предметы или волнению на море. — ​Прим. ред.). Она позволяет рассчитать прямой ущерб (например, если с дома снесет крышу) и косвенный (если из-за сильного ветра будет простаивать башенный кран в порту: работа не выполняется, а зарплату рабочим приходится платить, и это тоже убытки).

Для прогнозирования засухи мы используем индекс Палмера, оценивающий компоненты водного баланса на поверхности почвы. Для расчета вероятности наводнений общепризнанной шкалы не было, мы разработали ее сами, с помощью коллег из Российской школы экономики: они создали классификацию влияния затопления на здания с учетом материалов и этажности. А мы, учитывая поправку credit value adjustment, переводим ущерб от природных катаклизмов в деньги.

Что такое credit value adjustment?

АБ. Это поправка, которую банк закладывает в свою модель оценки рисков. И нашу поправку он тоже может внести, увеличив или уменьшив ставку в зависимости от ситуации.

АЗ. Банки просчитывают, каков риск того, что компания не сможет выплатить кредит с учетом вероятности наступления климатического дефолта.

АБ. На случай любого дефолта банк держит страховой резерв. Поэтому, если с учетом нашей модели риск будет уточнен, страховой резерв также можно будет скорректировать. А если заглянуть дальше, то климатический компонент в оценке рисков может быть учтен и Центробанком при оценке того, какую сумму банк обязан резервировать у себя на счетах.

Каковы особенности вашей модели?

АЗ. Как и все прочие, наши модели учатся на исходных данных. Но, в отличие от многих других, для нас главное — ​не интерпретация, а точное предсказание ­какой-то величины, например, вероятности наводнения в точке икс в следующем году. У нас есть исторические данные, и мы стремимся к тому, чтобы прогноз, построенный с их учетом, был близок к прогнозу модели. Современные методы машинного обучения позволяют практически полностью это автоматизировать.

На каком этапе работы вы находитесь?

АБ. На стадии внедрения модели на территории индустриального партнера. У нас уже есть кредитная модель, она сейчас проходит калибровку. В модель необходимо включать оценку активов компании. Для этого можно использовать данные финансовой отчетности, но реальную стоимость актива так не понять. Мы хотим начать сотрудничество со страховыми компаниями и собрать большой агрегированный дата-сет, чтобы, используя оценки страховщиков, понять стоимость актива.

АЗ. Представьте себе, что вы берете ипотеку и оформляете страховку, цена которой зависит от оценки квартиры. Если квартира дорогая — ​страховка будет больше, если попроще — ​то и страховка дешевле.

АБ. Также мы, возможно, попробуем, сделать разбивку на движимые и недвижимые активы. В итоге наша модель будет откалибрована на реальных рыночных данных. У нас будут точные цифры, соответственно, мы сможем создать модель, более корректно описывающую ущерб от того или иного события.
Но ведь у вас все равно не будет ответа на вопрос, как поведет себя тот или иной актив в экстремальной ситуации. Даже зная его стоимость, вы не знаете, хорошо ли, условно говоря, прикручены болты, упадет ли башенный кран или устоит.

АБ. Но если мы будем знать, что башенный кран есть, мы будем знать, что он точно не выдержит ветра сильнее 18 м/с.

АЗ. Вот модель первого уровня: если мы возьмем завод стоимостью $ 1 млн, то в пределе, если случится наводнение, компания потеряет миллион. А если завод стоит полмиллиона — ​то $ 500 тыс. Но, конечно, модели очень сложны, они опишут процесс далеко не во всех деталях. Главное, если объект попадает в «красную зону», есть основания запустить процесс корректировки кредитных ставок.

Когда, по вашим планам, начнет использоваться ваша модель?

АБ. Надеюсь, что уже до конца этого года.

Вы говорили о том, что ваши модели могут учитываться при корректировке СНиПов, строительных норм и, возможно, политики Центробанка относительно размеров резервирования.

АЗ. Изменение СНиПов — ​это, конечно, долгий процесс. Но банку СНиПы не важны, важно, чтобы они учитывали динамику, например, растепления вечной мерзлоты.

Если ваша модель предскажет высокую вероятность урагана в следующем году в точке икс или наводнения в точке игрек, банк поделится этой информацией, скажем, с МЧС?

АЗ. Насколько мне известно, такое взаимодействие происходит.

АБ. А еще можно делать долгосрочные прогнозы об исчезновении и появлении пахотных площадей в связи с изменениями климата. Мы решали такую задачу совместно с Институтом географии РАН, сделали публикацию. Но, насколько мне известно, дальше эта тема не пошла. Ее развитие — ​вопрос наличия заказчика.

А что будет после завершения внедрения в бизнес-­процесс заказчика?

АБ. Не знаю. Может быть, появится другой индустриальный партнер со своей задачей. На этот проект ушло около двух лет.

В 2021 году было подписано постановление правительства о создании центров искусственного интеллекта. Государство заинтересовано в том, чтобы разработки в области ИИ применялись в реальном бизнесе. Оно финансирует половину стоимости создания таких решений. К­акая-то часть результатов интеллектуальной деятельности принадлежит государству. В рамках нашего решения есть библиотека, где находится основной алгоритм. Права на нее остаются у государственного Центра искусственного интеллекта. А банк получает модель.

АЗ. Климатическое направление — ​одно из нескольких, которые ведет наша лаборатория. Все они важны и для индустриальных заказчиков, и для фундаментальной науки. Например, у меня есть грант на оценку неопределенности модели машинного обучения. Мы пытаемся показать, насколько модель уверена в том, что́ она говорит. Это нерешенная задача для нейронных сетей. Она фундаментальная, но у нее есть и практическое применение.

Типичный пример — ​активное обучение. У нас тяжело и дорого собирать данные, еще сложнее — ​с размеченными данными — ​такими, где специалисты выделяют параметры, при которых некое событие есть, и те, при которых его нет. Например, для того чтобы научить модель определять причину аварии во время бурения скважины, необходимо привлекать экспертов, проводящих разметку данных. И возникает вопрос: как нам максимально эффективно выполнить разметку, чтобы на выходе получилась максимально качественная модель?

Второй пример: есть сложная медицинская система, которая, как и любая система, может ошибаться. Но речь идет о здоровье человека, и, если высока вероятность ошибки, модель будет выдавать рекомендации, но предоставлять право решения человеку. Это нормальный сценарий.
ДРУГИЕ МАТЕРИАЛЫ