Суверенный интеллект

ТЕХНОЛОГИИ / #3_2025
Текст: Наталия АНДРЕЕВА / Фото: Midjourney, Xinhua

Генеративный ИИ и LLM уже скатились с гартнеровского «пика хайпа» и уверенно приближаются к «яме разочарования», поэтому ИИ-вендоры меняют риторику и начинают продавать ИИ не корпорациям, а государствам — ​вполне успешно. Попробуем понять, какие страны и как пытаются выиграть глобальную [ген]ИИ-гонку.

Если 2024 год прошел под хайп-лозунгом «срочно инвестируйте в нашу ИИ-компанию!» (и заодно: «Внедряйте ИИ — ​и будет вам счастье!»), то 2025‑й, похоже, станет годом «ИИ-суверенитета»: основные идеологические и финансовые бои, связанные с искусственным интеллектом, особенно генеративным, сегодня идут на государственных и политических полях.

Причины всеобщего окологосударственного беспокойства понятны: реально претендовать на лидерство в области ИИ, как и в большинстве других критических/перспективных технологий, сейчас могут только США и Китай (на топ‑100 расположенных там компаний приходится 40 % всех денег, которые мир тратит на R&D; в США и Китае расположена половина мировых суперкомпьютерных вычислительных мощностей); все остальные вынуждены, как Алиса, очень быстро бежать, чтобы просто остаться на месте. Глобальное лидерство, впрочем, не мешает ни США, ни Китаю активно вкладываться в ИИ и его развитие.
Количество качественных базовых ИИ-моделей, 2020–2025 гг.
Количество посещений ИИ-сервисов в месяц, млн
Дерегулируй это
США, нынешний глобальный лидер в области ИИ, — ​пока единственная страна с ИИ-амбициями, не принявшая стратегию/пакет инициатив по развитию искусственного интеллекта. Но заявка на дальнейшие победы будет сделана через несколько месяцев: к концу июня 2025 года в США должен быть разработан национальный План развития искусственного интеллекта (Artificial Intelligence Action Plan), который должен гарантировать сохранение ИИ-превосходства штатов, в особенности — ​на фоне успехов Китая.

Несмотря на то что содержание национального Плана по ИИ пока неизвестно, новая администрация уже сделала несколько значимых и симптоматичных ходов в этой части.

Во-первых, президент США Дональд Трамп отменил основополагающий рамочный документ, принятый предыдущей администрацией и определявший принципы государственной политики в области регулирования ИИ, — ​указ «О надежном, безопасном и ответственном развитии ИИ» (Safe, Secure, and Trustworthy AI Development, 2023).

(В свое время к указу было много претензий со стороны крупных вендоров — ​в частности, по поводу излишнего акцента на равенстве, недискриминации, приватности данных, гражданских правах и пр.; указ буквально вынуждал ИИ-компании бороться с расизмом и сексизмом ИИ-моделей, обученных на соответствующем содержимом Интернета. Словом, долго, дорого, неудобно, а биржи и инвесторы не ждут.)

Во-вторых, заявлена инициатива Stargate, в рамках которой OpenAI, SoftBank и Oracle планируют вложить порядка $ 500 млрд в дата-центры для ИИ (до 20 крупных центров к 2029 году; строительство 10 уже начато).

В проекте много белых пятен и неясностей — ​в частности, не очень понятно, для чего конкретно будут использоваться построенные мощности; кто получит к ним доступ и на каких условиях — ​и вообще эта инфраструктурная заявка на победу выглядит как попытка влить деньги в производителя чипов Nvidia на фоне небольшого финансового шторма из-за китайского DeepSeek (свежей ИИ-модели, для которой нужно в разы меньше вычислительных мощностей и электроэнергии), после появления которого стоимость акций Nvidia за один день упала на 18 % ($ 600 млрд).

В-третьих, в январе 2025 года в США были приняты рамочные правила экспортного контроля над ИИ-технологиями, включая ИИ-чипы (в частности, компании, расположенные в США и предоставляющие в аренду вычислительные мощности, должны сохранять в стране не менее 50 % общего объема мощностей; а поставщики чипов должны будут получать разрешения на их продажи в "нейтральные" страны) и ИИ-модели. Помимо собственно экспортного контроля, правила, как ожидается, помогут США сформировать полноценную и безопасную ИИ-экосистему совместно со странами из числа доверенных партнеров.

В-четвертых, вне зависимости от федеральной политики, в США развивается регулирование ИИ на уровне штатов. Сегодня в законодательных органах штатов находится более 550 законопроектов, связанных с применением ИИ в различных сферах, от госуправления до рынка арендной недвижимости. В частности, Виргиния уже приняла закон «О высокорисковых направлениях развития и использования ИИ», который должен предотвращать все формы дискриминации с использованием ИИ/алгоритмов; Техас — ​закон «Об ответственном управлении ИИ», помимо всего прочего, предусматривающий создание «регуляторных песочниц» для тестирования различных ИИ-моделей и сервисов и вложения в переобучение рабочей силы в штате.
Основные направления законодательного регулирования ИИ на уровне штатов, кол-во законопроектов по темам
Судя по уже принятым решениям, политический сдвиг в части ИИ в той или иной форме будет отражать более общие установки новой администрации: переход от надежности, этики и недискриминации — ​к подходу «рынок сам все решит», от демократических ценностей — ​к безопасности и экспортному контролю и от "пэчворк-­регулирования" (тех самых законов на уровне штатов) — ​к общему дерегулированию и поддержке инноваций, включая сомнительные и рискованные ИИ-проекты.

На фоне смены администрации и заявленных планов поддержки развития ИИ (наподобие инициативы Stargate, грядущего общенационального плана и пр.), технологический/IT сектор США начинает активно делить шкуру пока не убитого медведя — ​и разные «партии» предлагают свои версии того, как и почему нужно развивать ИИ в стране.

Насколько новая администрация намерена прислушиваться к мнениям big tech’а, пока не понятно, но накала идеологической борьбы это не снижает; в частности, крупные ИИ-вендоры уже высказались по поводу грядущего национального Плана развития искусственного интеллекта — ​в том духе, что китайские ИИ-компании угрожают национальной безопасности (OpenAI), что ИИ — ​технология двой­ного назначения и потому хорошо бы дополнительно устрожить экспорт приличных ИИ-чипов (Anthropic), и что при этом важно не повредить бизнес-­перспективам приличных компаний (Google).
Война ИИ-повесток в США
1. Повестка прореспубликанских «ястребов» под предводительством Алекса Карпа, СЕО околовоенной ИИ-компании Palantir (программная книга «Технологическая республика», 2025):

1.1. американские корпорации пользуются тем, что́ делает государство, ничего не давая обществу взамен;

1.2. за последние годы мир сильно изменился, и всех ждет череда геополитических и военных конфликтов, поэтому технологическим компаниям, в первую очередь связанным с ИИ, хорошо бы перестать изображать «этичность» и начать открыто и широко работать с военно-­промышленным комплексом;

1.3. Кремниевую долину и американский цифровой big tech пора вернуть к истокам, а именно — ​к решению государственных сверхзадач, связанных с национальной безопасностью и конкурентоспособностью (по аналогии с атомным и космическим проектами);

1.4. США срочно нужен ИИ-аналог Манхэттенского проекта, породившего атомную бомбу, иначе китайские товарищи всех догонят, перегонят и оставят далеко позади.

2. Повестка продемократических «голубей», не успевших вложиться в предвыборную кампанию Д. Трампа, в версии бывшего СЕО Google Эрика Шмидта (программный доклад «Стратегия суперинтеллекта», 2025):

2.1. развитие ИИ-технологий может привести к полному переформатированию вооруженных конфликтов и к появлению так называемых флэш-вой­н — ​сверхкоротких и сверхразрушительных;

2.2. поэтому ИИ необходимо жестко контролировать и регулировать (экспортный контроль всех ИИ-технологий, в первую очередь — ​связанных с микроэлектроникой; поиск и запрет потенциально опасных проектов и пр.), то есть по тем же принципам, по которым контролируется ядерное оружие:


  • сдерживание  ​по принципу «взаимно гарантированного выведения ИИ из строя» (Mutual Assured AI Malfunction), который, помимо всего прочего, подразумевает, что у страны должна быть понятная стратегия ИИ-эскалации (лестница), а также то, что дата-центры для ИИ, например, должны располагаться подальше от больших ­городов;
  • нераспространение — ​по аналогии с нераспространением оружия массового уничтожения: контроль над условной компонентной базой и всеобъемлющий мониторинг соответствующих продаж, поставок, проектов и пр., в первую очередь — ​в части передовых ИИ-чипов и ИИ-моделей (в том числе дата-сетов для обучения и пр.);
  • конкурентоспособность ​в области четырех основных сфер (военные применения ИИ; экономическая составляющая ИИ, в том числе производства чипов и привлечения ИИ-специалистов; регуляторика и законодательство; политическая стабильность).
Больше данных
Развитие ИИ в Китае — ​приоритет отнюдь не новый: национальный план развития искусственного интеллекта до 2030 года был принят еще в 2017 году; базовые регуляторные документы, необходимые для реализации плана, последовательно принимались в 2018−2022 годах (План инновационного развития ИИ для учреждений высшего образования, 2018; Основные принципы управления развитием ИИ, 2019; Принципы развития системы стандартов для ИИ, 2020, и др.).

К 2025 году общий подход Китая к развитию ИИ несколько поменялся: в 2023−2024 годах были приняты документы, регулирующие развитие генеративного ИИ и сервисов на его основе (обязательное маркирование ИИ-контента и пр.); основными направлениями государственной и корпоративной политики стали развитие экосистемы для данных и поддержка open source моделей.

Произошло все это не случайно и не внезапно.

В 2020 году «данные» были объявлены одним из средств производства (наравне с землей, трудом, капиталом и технологиями; соответствующий гайдлайн был выпущен ЦК КПК); в самом конце 2023 года в КНР была создана Национальная администрация (бюро) по данным, ответственная за экономическое развитие, основанное на данных, а в прошлом году 17 министерств и ведомств согласовали и утвердили трехлетний План обеспечения [социально-­экономического] развития, основанного на данных (он же — ​Data Element X).

К 2026 году план должен обеспечить:
  • использование данных как средства производства в 12 приоритетных отраслях (промышленное производство, сельское хозяйство, транспорт, финансы и пр.);
  • создание 300+ типовых (демонстрационных) сценариев использования и/или юз-кейсов для данных и дата-сетов в приоритетных отраслях;
  • появление дата-провайдеров и компаний, предоставляющих сервисы на основе данных, которые, как предполагается, обеспечат рост дата-индустрии на 20 % в год (с $ 12,7 млрд в 2022 году).
Помимо собственно плана, подход «данные — ​это средство производства» уже поддержан инфраструктурно и регуляторно:
  • С 2022 года реализуется масштабный инфраструктурный проект East Data, West Computing, в рамках которого к 2024 году было создано 10 национальных вычислительных кластеров; как ожидается, к концу 2025 года их мощность составит порядка 60 % от всех вычислительных ­мощностей в стране (что отдельно интересно, 80 % потребляемой ими электроэнергии будет относиться к "зеленой" ­энергетике).
  • В Китае работают 40+ бирж данных — ​специализированных организаций, помимо всего прочего, обеспечивающих юридическую составляющую обмена данными и/или их покупки, причем первая биржа появилась еще в 2015 году; а крупнейшая из них — ​биржа в Шэньчжэне (Shenzhen Data Exchange) — ​уже выступает посредником между ИИ-компаниями, нуждающимися в нормальных дата-сетах для обучения моделей, и владельцами данных. В 2024 году объем транзакций на Шэньчжэньской бирже данных превысил 10 млрд юаней ($ 1,5 млрд); для покупки были доступны 2,3 тыс. дата-сетов по 70+ отраслям и 265 «сценариям использования», в том числе для промышленного производства.
  • В 2023 году министерство финансов КНР утвердило Рамочные правила учета данных предприятий (рассматривающие данные как один из видов нематериальных активов и облегчающие их оборот, продажу и пр.); на основании этих правил в 2024 году некоторые китайские банки начали предлагать корпоративным клиентам кредитные продукты, в которых в качестве обеспечения могут выступать данные/дата-сеты.
Ставка на open source была заявлена еще раньше, чем ставка на данные: План развития искусственного интеллекта до 2030 года, принятый в 2017 году, предполагал (и предполагает) поддержку открытых решений, в том числе в залоге обеспечения сотрудничества между коммерческим сектором и академическими исследованиями.

Понятно, что подход «давайте всё откроем и дадим людям/компаниям самостоятельно обучать и дорабатывать модели» был принят не из желания облагодетельствовать человечество. После ужесточения экспортного контроля китайские компании [предположительно] потеряли или почти потеряли возможность использовать самые передовые ИИ-чипы от Nvidia и были вынуждены работать на менее мощных отечественных аналогах. Соответственно, конкурировать с западными ИИ-компаниями/моделями можно только в части технологий обучения и ТТХ моделей, доработку и кастомизацию которых гораздо проще осуществить чужими руками, открыв веса моделей и пустив пользователей в условную «песочницу». По этому пути и двинулись Baidu, Alibaba, Tencent и DeepSeek.

Как долго продлится все это open-source счастье, не очень ясно: есть вероятность, что китайские компании перестанут нуждаться в огромных вычислительных мощностях (или заместят чипы Nvidia отечественными аналогами, как это уже сделала Alibaba Group, обучившая свою модель Ant почти исключительно на чипах от Huawei, в том числе Ascend 910B) и смогут позволить себе нормальную доработку и обучение моделей инхауз, после чего как модели, так и продукты резко станут проприетарными.

Но пока китайская ставка на открытость выглядит как заявка на новый глобальный стандарт ИИ-моделей — ​просто за счет того, что китайские модели будут использовать все, кто по каким-то причинам не может (или не хочет) позволить себе ChatGPT (от OpenAI) или даже условно-­открытую Llama (от запрещенной в России Meta). Судя по всему, западные коллеги и конкуренты DeepSeek’а и прочих китайских компаний, открывающих веса, методики обучения и дата-сеты, тоже рассматривают открытость как претензию на глобальное лидерство: OpenAI [скрепя сердце и скрипя зубами] в конце марта 2025 года объявила о планах выпуска open source-­модели, первой со времен GPT‑2, и открыто пытается дискредитировать модели/продукты от DeepSeek под лозунгом борьбы за национальную безопасность.
Бежать со всех ног
Самое заметное начинание 2025 года по развитию ИИ в ЕС — ​это торжественно заявленная в феврале инициатива Еврокомиссии InvestAI, под которую планируется [каким-то магическим образом] привлечь порядка € 200 млрд, в том числе € 20 млрд на создание дата-центров (так называемых гигафабрик ИИ — ​AI gigafactories), необходимых для нормального обучения и работы больших ИИ-моделей.

Внимание к ИИ-инфраструктуре, конечно же, не случайно: на фоне грандиозных (на $ 500 млрд) инфраструктурных планов США — ​страны, и без того лидирующей в ИИ, — ​перспективы ЕС выглядят достаточно бледно. Первые семь проектов ИИ-гигафабрик, которые должны работать на несколько стран ЕС каждый (в рамках «консорциумов»), были отобраны в конце 2024 года, но общий объем инвестиций в них — ​только порядка € 1,5 млрд, и даже еще шесть гигафабрик (в Австрии, Болгарии, Франции и пр.), о которых на волне геополитических волнений ЕС заявил в марте 2025 года, принципиально ситуацию, конечно, не поменяют.

Помимо вопиющего разрыва в вычислительных мощностях между ЕС и США/Китаем, есть куда более болезненный момент: какие именно ИИ-модели европейские компании будут развивать на этих мощностях, пока не очевидно, поскольку единственный сколько-­нибудь заметный на глобальном уровне ИИ-сервис с пропиской в ЕС — ​это онлайн-­переводчик Deepl (Германия) с 90 млн посещений в месяц (ср.: на американский ChatGPT приходится 4,7 млрд посещений, на китайский DeepSeek — ​268 млн).

Теоретически на решение этой проблемы был направлен так называемый «Пакет мер для поддержки инноваций в ИИ» (AI innovation package), принятый в 2024 году и [опять же, теоретически] решавший три задачи:
  • обеспечение доступа к вычислительным мощностям ИИ-гигафабрик для обучения больших ИИ-моделей «общего назначения» (Large General Purpose AI Models), в том числе доступ для стартапов и малого/среднего бизнеса;
  • создание «одного окна» для стартапов, исследовательских команд и пр. — ​в части доступа к исследовательским инфраструктурам, необходимым для разработки, тестирования, оценки и валидации больших ИИ-моделей;
  • поддержка создания сервисов на основе больших ИИ-моделей в рамках специальной инициативы GenAI4EU, предполагавшей развитие новых сервисов/применений генИИ в 14 индустриях (робототехника, здравоохранение, биотехнологии, производственные технологии и пр.).

Но, как это принято в ЕС, «инновационный» пакет не предполагал никакого финансирования — ​и, судя по всему, пока закончился ничем, как и остальные «поддерживающие» инициативы.
Что касается реальных денег, финансирование ИИ и ИИ-сервисов в ЕС осуществляется в рамках программ Horizon Europe (исследования и разработки, стартапы) и Digital Europe, в которую добровольно-­принудительно вписали поддержку развития генеративного ИИ и больших ИИ-моделей — ​вдобавок к имевшимся там микроэлектронике, кибербезопасности, суперкомпьютерным вычислениям и пр.

То есть самый заметный эффект от ИИ-инициатив в ЕС — ​то, что искусственный интеллект «каннибализирует» другие технологические направления; в частности, фонд InvestAI, из которого должно финансироваться строительство дата-центров, будет собран с миру по нитке (из денег программ Digital Europe, Horizon Europe и средств общеевропейского фонда InvestEU).

Все остальные страны — ​за исключением, разве что, Великобритании, Республики Корея, ОАЭ и еще нескольких мало заметных претендентов на цифровое чемпионство — ​вынуждены делать ИИ так и тогда, когда получается. Глобальные ИИ-вендоры это давно заметили и активно продают государствам и корпорациям «ИИ-суверенитет».
Суверенность на продажу
Больше всех в части продажи суверенитета [предсказуемо] отличилась корпорация Nvidia. За последние пять лет под лейблом AI Nations компания продала «ИИ-суверенитет» нескольким странам, в основном в формате больших дата-центров.

Италия: проект создания суперкомпьютера на базе чипов Nvidia и специализированного ПО от нее же (NVIDIA AI Enterprise) для обучения первой «национальной» LLM на италоязычных дата-сетах (интересно, что реализует проект Swisscom Group). Предполагается, что по итогам проекта стартапы, частные компании, органы госвласти и пр. смогут разрабатывать на базе этой LLM генИИ-сервисы для любых отраслей.

Индия: проект Tata Group по созданию масштабной ИИ-инфраструктуры на базе чипов GH200 Grace Hopper Superchip, параллельно с проектом Reliance Industries по разработке базовой LLM, которая будет работать с несколькими языками (аутентичными для Индии); совместные проекты с несколькими индийскими университетами.

Япония: портфель проектов по поддержке разработки национальной LLM, подготовке и переподготовке ИИ-специалистов и отдельным применениям ИИ (в том числе для систем реагирования на природные катастрофы), включая проекты в формате ГЧП — ​например, совместный проект с SoftBank Corp по созданию специальной генИИ-платформы под 5G и 6G и распределенной сети «ИИ-фабрик» (дата-центров).

В той же логике пытается продавать «ИИ-суверенитет» корпорация Oracle, но ее предложение выглядит менее убедительным, поскольку лозунг «купите у нас облачные мощности» противоречит самой идее «суверенитета», который предполагающей, что, как минимум, сервера расположены в пределах границ суверенного государства.
Меньше пены
Надо сказать, что окологосударственный энтузиазм вендоров во многом связан с сомнительными успехами генИИ на частных/корпоративных поприщах: руководители бизнесов уже два года ждут обещанного светлого ИИ-будущего и считают деньги. Поэтому корпоративные реалии, связанные с внедрением ИИ, сильно отличаются от медийного шума.

Во-первых, ИИ как таковой не является «корпоративным приоритетом»; он существует в непростом экономическом и политическом контексте и, по идее, должен работать на общие цели компаний, главные из которых — ​разработка новых продуктов и создание новых бизнесов (что характерно, в этом смысле ничего не меняется уже лет пять-семь).

Именно здесь возникают основные корпоративные проблемы/задачи: экономическая и геополитическая тахикардия вынуждает компании активно вкладываться в новые продукты/технологии и выходить на новые рынки; при этом, несмотря на существенные инвестиции, прибыли от новых бизнесов/продуктов в последние годы оставляют желать лучшего (без малого 80 % прибыли по-прежнему приходится на базовые бизнесы компаний).
Основные действия компаний, направленные на улучшение рыночного положения, последние 5 лет, %
Источники прибыли компаний, %
Одно из самых узких мест — ​качество принятия решений на всем «инновационном цикле», от продуктовых/бизнес-идей до масштабирования получившихся продуктов и внедрения новых технологий для оптимизации бизнес-­процессов. В среднем корпоративные решения, связанные с "инновациями", оказываются неудачными в 2,5 раза чаще, чем любые другие, а результаты относительно удачных решений (проектов, инициатив и пр.) в половине случаев не оправдывают ожиданий.

Проблема всех «ИИ-обещаний», которые активно раздают вендоры и консультанты, в том, что никакой ИИ, ни генеративный, ни прикладной, [пока] не помогает решить проблему новых продуктов, новых бизнесов и внедрения инноваций всех родов и видов.

Больше всего светлых надежд, как обычно, возлагают на использование генИИ в new product development (NPD), но, несмотря на победные настроения ИИ-евангелистов, побед там не так уж много.

Конечно, формально говоря, степень проникновения генИИ в разработку продуктов не так мала: о масштабированном и регулируемом использовании генИИ в NPD говорят 17 % компаний (из числа принимающих участие в консалтерских опросах), еще 33 % пробуют разные юз-кейсы, 35 % рассматривают такую возможность в принципе.
Состояние юз-кейсов генИИ в различных бизнес-функциях, % компаний
При этом для того, чтобы хоть что-то сделать с продуктами (и, шире, с продуктовым портфолио), применяя генИИ, нужны качественные данные, начиная с цифровых моделей и заканчивая постпродажным обслуживанием; даже самые оптимистичные любители генИИ, типа консультационной компании McKinsey, говорят о том, что для успеха нужны, как минимум, трехлетние ряды структурированной информации о продажах и производстве, причем собранных в одном месте и с нормальной разметкой.

Именно поэтому самые известные и успешные примеры использования генИИ для, скажем, оптимизации продуктов приходятся на индустрии, работающие с потребительскими рынками и вполне этими самыми данными обеспеченные: например, компания PepsiCo оптимизировала форму и вкус чипсов Cheetos, используя ИИ и массив данных об отзывах пользователей, — ​и в результате повысила степень проникновения Cheetos на рынок на 15 %.

Иными словами, есть массив данных и CRM — ​есть счастье; нет CRM — ​нет счастья.

А в инженерно-­интенсивных отраслях, работающих со сверхсложными высокотехнологичными продуктами, генИИ и вовсе применяется только точечно.

Конечно, больше половины компаний в инженерно-­интенсивных отраслях (автомобилестроении, авиастроении и пр.) так или иначе «щупают» возможности ИИ и генИИ для оптимизации цифрового проектирования/моделирования, но в сколько-­нибудь значимом масштабе в свою инженерную/разработческую практику ИИ внедрила только каждая 20‑я компания, а каждая третья вообще не планирует заниматься всеми этими глупостями, продолжая использовать традиционные — ​и традиционно надежные — ​методы моделирования (по данным McKinsey).
Использование ИИ/МО в инженерно насыщенных индустриях, % компаний
Есть и более широкие нюансы, создающие проблемы для внедрения [ген]ИИ в компаниях, в первую очередь — ​организационные.

Практически все ИИ (и генИИ) стратегии страдают от той же родовой травмы, что и инновационные стратегии компаний: несмотря на растущее вовлечение CDO и, шире, информационных/data-подразделений в обсуждение и реализацию общих корпоративных бизнес-­стратегий (89 % в 2024 году), только 40 % генИИ-инициатив в компаниях разрабатываются и реализуются с участием «бизнесовых» подразделений; у 56 % компаний, не относящихся к числу ИИ-лидеров, у ИИ-проектов нет «хозяев" — ​топ-менеджеров, контролирующих и отстаивающих их реализацию.

(Строго говоря, с инновационными стратегиями дело обстоит еще хуже: в 2024 году, по данным опроса BCG, только 48 % компаний хоть как-то привязывали «инновации» к своим бизнес-­целям, а общий уровень «готовности компаний к инновациям» снизился с 19 % в 2023 году до 3 % в 2024‑м).

И, как показывают все те же опросы, отсутствие связи с реальными бизнес-­целями компаний — ​основная причина отмены/прекращения ИИ-проектов в компаниях.
Топ‑5 причин отмены ИИ-проектов в компаниях, % проектов, отмененных по какой-либо причине, в общем числе отмененных ИИ-проектов, 2024
В результате ИИ-зация в крупных корпорациях постепенно исчезает из поля зрения/внимания руководителей: если в I квартале 2024 года, по данным Deloitte, генИИ интересовались две трети членов советов директоров и больше 70 % СЕО/топ-менеджеров, то к концу года о нем думали меньше половины директоров и только 59 % СЕО и примкнувших к ним топов (в отличие от ответственных за ИИзацию технологических управленцев).
Доля сотрудников разного уровня, заявлявших о высоком интересе к теме генИИ, %
Кроме того, в 2024 году две трети компаний «спустили» реализацию ИИ-стратегий на CIO (chief information officers), хотя еще в 2023‑м без малого в половине корпораций ИИ занимались лично генеральные директора (в 2024‑м — ​только в 17 % компаний). И, что характерно, в тех компаниях, где ИИ-инициативы проваливаются, руководят ими именно СЕО (81 % случаев).
Суверенные проблемы
С формальной точки зрения, развитие ИИ в России вполне обеспечено документами стратегического планирования и институциями, ответственными за это развитие.

В стране принята (и в 2024 году значительно обновлена) национальная стратегия развития искусственного интеллекта до 2030 года; под развитие ИИ отведен один из федеральных проектов нацпроекта «Экономика данных», и на решения в части ИИ для госуправления в ближайшие годы, по данным «Коммерсанта», планируется потратить 65 млрд руб., что в нынешних условиях не так уж мало. В России есть собственные LLM (GigaChat, Яндекс GPT, Cotype и пр.) и сервисы на основе ИИ; с нормальным (прикладным/"тяжелым") коммерческим ИИ похуже, но и тут есть решения и варианты.

Проблемы вроде бы тоже понятны, зафиксированы и должны решаться. В первую очередь, это проблема нехватки вычислительных мощностей («недостаточное развитие отечественных решений в области искусственного интеллекта, включая программно-­аппаратные комплексы и электронную компонентную базу»), которая год от года становится все критичнее, потому что Nvidia уже не продают в Китай самые передовые чипы, а эффективность китайских аналогов (чипы от Huawei) все-таки пока ниже, чем у американских товарищей.

Но есть чисто технический нюанс, который раз за разом каким-то магическим образом выпадает из поля [российского] внимания и из поля стратегирования.
Речь, конечно же, о проблеме доступности нормальных данных — над ней во всем мире бьются корпорации (у которых треть проектов ИИзации проваливается именно из-за проблем с данными) и государства.

Нагляднее всего эта проблема видна на примере доступности открытых наборов данных для обучения ИИ: больше половины всего общемирового массива — англоязычные наборы; для всех остальных языков, включая русский и даже китайский, дата-сетов на порядок меньше. Понятно, что крупные ИИ-вендоры решают эту проблему за счет встроенного перевода (привет сервису Google Translate), но для небольших игроков, ориентирующихся на национальные рынки, это не самый эргономичный и экономически приемлемый вариант.
Распределение открытых дата-сетов, подходящих для обучения ИИ, по языкам, %
Отчасти замалчивание проблемы данных в России связано с тем, что для многих организаций, решившихся на внедрение ИИ, куда более актуальна проблема кадров: по данным опросов ИСИЭЗ НИУ ВШЭ, с нехваткой квалифицированных ИИ-специалистов всех родов и видов в 2024 году сталкивались две трети компаний, а с проблемой некачественных/недостаточных данных — ​только половина. Но это не делает проблему менее значимой, и высока вероятность, что через пару лет ситуация в российских компаниях сравняется с общемировой: по данным опросов McKinsey, в 2024 году 70 % организаций, внедрявших ИИ, считали проблемой номер один именно данные.

Можно было бы, конечно, посмотреть на дата-сеты на китайском и вздохнуть с облегчением: страна с 1+ млрд населения, всерьез претендующая на глобальное ИИ-лидерство, дала миру всего 5 % нормальных открытых дата-сетов.

Но вздохнуть не получится: как уже было сказано, проблему с данными Китай решает, и делает это очень последовательно, начиная с Национального плана развития ИИ (2017): в Плане была зафиксирована проблема данных; мероприятия по созданию дата-сетов — ​"открытых данных о поисковых запросах, электронной торговле и социальной сфере" — ​были предусмотрены планом на 14‑ю пятилетку, в 2020 году. И реализовывались по нескольким направлениям, три из которых не имели отношения к [нашим любимым] вычислительным мощностям.

  • Создание/поддержка платформ, собирающих данные: e-commerce (включая логистический компонент и трансграничный обмен данными), геномика (правила регулирования «генетических ресурсов» 2022 года, которые, в числе прочего, предусматривают создание дата-сетов и баз данных генетической информации), финтех (на базе решений от Народного банка Китая), платформы автономного движения и пр.
  • Официальное превращение данных в актив. Как уже было сказано, в Китае работают 40+ бирж данных; на трех крупнейших (Шэньчжэньской, Шанхайской, Пекинской) продается порядка 7 тыс. высококачественных дата-сетов и сценариев их применения для различных индустрий; еще около 300 тыс. открытых, публичных дата-сетов сформировали локальные администрации. Торговля данными поддерживается регуляторно: с 2024 года они считаются видом нематериальных активов, вплоть до того, что принимаются на баланс и могут использоваться как залог для получения кредитов.
  • Регулирование обращения данных в логике data-суверенитета (запреты на передачу персональных данных за рубеж и пр.).

На самом деле проблема данных в Китае имеет еще одно решение, не зафиксированное в официальных «стратегических» документах и планах: китайские технологические гиганты, от маркетплейсов (Alibaba) до производителей электроники (Huawei), работают на глобальных пользовательских рынках и за четверть века собрали огромные массивы информации, как минимум, о поведении потребителей, причем не только китайских. Сценарии с malware, закладками в ПО и шпионажем, о которых любят рассказывать наши американские партнеры и конкуренты, всерьез лучше не рассматривать, но тем не менее.

Поэтому «проблема данных" — ​это, строго говоря, для Китая уже не совсем проблема. Но это не мешает китайским коллегам ее решать.

В России дефицит данных косвенно учитывается в ФП «Искусственный интеллект»: один из проектов в его контуре — ​создание единой доверенной государственной платформы для обмена данными и их анализа, в том числе данными, предназначенными для использования в госуправлении и "коммерческом обороте".

Кроме того, российский Альянс в сфере искусственного интеллекта (Сбер, Яндекс и еще 12 крупных компаний) вроде бы планирует создание маркетплейса размеченных данных для ИИ. Но — ​с учетом состава участников этой ассоциации — ​сложно ожидать, что на маркетплейсе появится что-то реально полезное для, скажем, ИИ-стартапов и прочих потенциальных конкурентов/дизрапторов.

Как в таких условиях реализовывать принципы развития и использования ИИ, заявленные в национальной стратегии развития искусственного интеллекта, вроде поддержки конкуренции, открытости и доступности, непонятно.

Потом, конечно же, возникнет еще более неудобный вопрос — ​об окупаемости инвестиций в суверенный ИИ (в условиях санкций и недоступности самых денежных рынков). Но деньги мы будем считать в следующей серии.
ДРУГИЕ МАТЕРИАЛЫ