В Императорском зале Казанского университета шел разговор о том, как превратить Татарстан в передовой центр в сфере искусственного интеллекта В Императорском зале Казанского университета шел разговор о том, как превратить Татарстан в передовой центр в сфере искусственного интеллекта Фото: rais.tatarstan.ru

«Цель — стать передовым российским центром в сфере ИИ»

Первое в 2025 году заседание ассоциации содействия цифровому развитию выдалось одновременно и самым масштабным за всю историю организации. В Императорском зале Казанского университета под насмешливое одобрение Александра I с монументального портрета во всю стену и внимательные взгляды доброй половины татарстанского правительства и членов IT-комитета Госдумы шел разговор о том, как превратить Татарстан в передовой центр в сфере искусственного интеллекта.

Заделы тому есть — многие были выставлены уже в коридоре на подходе к залу. Артем Лопатин из «Сотки Высоток» демонстрировал доверенную среду «Акыллы», которая содержит в себе все данные об организации и с помощью ИИ предоставляет точные ответы на основе реальных документов и отчетов. Например, какой должен быть уровень ДТП в Москве в 2024 году согласно БКАД (национальному проекту «Безопасные качественные дороги»)?

По соседству Виктор Классен в амплуа предправления ООО «ФтизисБиоМед» рассказывал об обработке с помощью ИИ медизображений. «Получено регудостоверение, все необходимые патенты. Работает система качественно, объемные медицинские испытания проведены. 13 типов патологии обнаруживает ИИ в легких, мы это все демонстрировали перед выборами Владимиру Владимировичу на Петровке. Естественно, это широко внедряется, в 30 субъектах уже активно применяется», — говорил он делегации высоких гостей во главе с раисом РТ Рустамом Миннихановым.

Ректор Университета Иннополис Александр Гасников рассказывал о программе «Математические основы искусственного интеллекта» Ректор Университета Иннополис Александр Гасников рассказывал о программе «Математические основы искусственного интеллекта» Фото: antat.ru

Ректор Университета Иннополис Александр Гасников рассказывал о программе «Математические основы искусственного интеллекта». Но это было предсказуемо. А вот ICL представила в качестве главного IT-продукта многофункциональную систему анализа текста, которая может анализировать общественное мнение, бороться с дезинформацией, помогать с персонализацией ответов, а для коммерческих организаций — выявлять утечки информации, предотвращать нарушения прав клиентов, оценивать потенциально недобросовестных плательщиков и проверять контрагентов. Актуальный проект — систему антиплагиата на татарском языке — представил КФУ. Она оснащена даже поиском перефразирования текста. Свой стенд был и у «Атома», который презентовал продвинутые системы помощи водителю.

Рустам Минниханов: «Разработки в области искусственного интеллекта — необходимое условие для развития научного и технологического суверенитета нашей страны» Рустам Минниханов: «Разработки в области искусственного интеллекта — необходимое условие для развития научного и технологического суверенитета нашей страны» Фото: rais.tatarstan.ru

«От внедрения технологий во многом зависит наше будущее, — давал установку Минниханов. — Как отметил президент страны Владимир Владимирович Путин, разработки в области искусственного интеллекта — необходимое условие для развития научного и технологического суверенитета нашей страны. Данные инструменты должны использоваться во всех отраслях экономики и социальной сферы, включая госуправление».

Рифкат Минниханов с удовлетворением сообщил, что 93% протокольных поручений по итогам прошлых заседаний исполнены Рифкат Минниханов с удовлетворением сообщил, что 93% протокольных поручений по итогам прошлых заседаний исполнены Фото: rais.tatarstan.ru

«Наша цель — стать передовым российским центром в сфере ИИ. Министерству цифрового развития совместно с ассоциацией содействия цифровому развитию, Академией наук необходимо генерировать предложения и координировать работу», — добавил раис РТ.

Президент Академии наук РТ – председатель совета ассоциации содействия цифровому развитию Рифкат Минниханов с удовлетворением сообщил, что 93% протокольных поручений по итогам прошлых заседаний исполнены.

И чтобы дать представление присутствующим, обозначил ключевые тренды развития ИИ к 2030 году. Так, мировой рынок ИИ достигнет $830 млрд с темпом роста более 28% в год, что повысит глобальный ВВП на $15,7 триллиона. В России внедрение ИИ добавит к ВВП 11 трлн рублей. «Вероятность создания общего искусственного интеллекта к 2030 году оценивается в 25 процентов — системы смогут решать задачи без обучения на узких данных. Сильный ИИ, понимающий эмоции и мысли человека, станет основой для человекоцентричных технологий. Они будут персонализировать обучение и автоматизировать создание контента. Ключевые отрасли внедрения — ретейл, здравоохранение, транспорт, цифровые двойники. В то же время основные угрозы связаны с криминальным использованием ИИ, такие как фейки и манипуляции, и, конечно, нарушением приватности», — широкими мазками нарисовал он ИИ-будущее. И анонсировал основные доклады, предупредив, что они будут носить «просветительски-образовательный характер». Так и было, причем почти все докладчики, не сговариваясь, демонстрировали ролики последних выступлений главы Nvidia Дженсена Хуанга, так что было полное ощущение, что он полноправный спикер.

Айрат Нурутдинов сосредоточился на основных свойствах существующих вариаций ИИ и принципах их работы, поэтому сумел за какие-то 20 минут провести ликбез для слушателей — с чем неизбежно в ближайшем будущем все будут иметь дело Айрат Нурутдинов сосредоточился на основных свойствах существующих вариаций ИИ и принципах их работы, поэтому сумел за какие-то 20 минут провести ликбез для слушателей — с чем неизбежно в ближайшем будущем все будут иметь дело Фото: rais.tatarstan.ru

Как и куда развивается искусственный интеллект?

Наиболее развернутый доклад был у гендиректора «Таттелекома» Айрата Нурутдинова. Он сосредоточился на основных свойствах существующих вариаций ИИ и принципах их работы, поэтому сумел за какие-то 20 минут провести ликбез для слушателей — с чем неизбежно в ближайшем будущем все будут иметь дело. Выбор спикера неслучаен: «Таттелеком» во многом благодаря ИИ стал самым экономически успешным оператором с самыми низкими тарифами на интернет. В компании научились обрабатывать 60% цифровых данных, генерировать больше 500 рекламных макетов в год, а каждый 10-й сотрудник работает с большими языковыми моделями. В общем, Нурутдинову явно было чем поделиться.

Тезисно доклад выглядел так:

Физический ИИ изменит все. Судя по исследованиям корпорации Nvidia, которая изготавливает 90% аппаратных решений для ИИ, хронология выстраивается четкая. В 2012 году начался этап распознавания — изображений, звука, текста, всего подряд. Но он оказал почти несущественное влияние на экономику, которое Нурутдинов оценил в 3%. 2017-й ознаменован рождением генеративного ИИ, а также больших языковых моделей, которые позволяют генерировать текст и знания. И все равно примерное влияние на экономику получилось не более 5–7%. В 2022 году появляется агентный ИИ, и тут рост экономики оценивается максимум в 10–20%. Наконец, к 2030-му, верит Хуанг, появится physical AI, физический искусственный интеллект, который приведет к непосредственной замене рабочих рук и кратному приросту экономики — 100%.

ИИ уже сейчас повышает производительность программистов в 2–3 раза. Модели ИИ генерируют ответы на вопросы и составляют текст, предсказывая каждое следующее слово. Качество генерации оценивается через бенчмарки, результаты которых впечатляют. Так, точность ответов на 16 тыс. вопросов по 57 академическим предметам у моделей доходит до 91% (О1 от OpenAI). Правильность ответов на 448 сложнейших экспертных вопросов в области биологии, физики и химии — до 67% (причем 65% уже показатель доктора наук). Задачи на уровне средней школы О1 решает на 85 баллов из 100, а точность генерации кода на основе текста достигает 95%.

ИИ не признается, если чего-то не знает. Проблему галлюцинаций больших языковых моделей Нурутдинов наглядно продемонстрировал на фактологическом тесте SimpleQA. Так, GPT-4o Mini в 90% случаев неверно отвечает на конкретный вопрос (какой голландский игрок забил гол в матче Нидерланды – Аргентина в 2022 году на ЧМ среди мужчин), но не признается, что не знает ответа. Топовая модель о1 дала правильный ответ в 40% случаев, ошиблась в 49% и только в 11% сообщила, что не может ответить. «Если у моделей нет каких-то знаний, они соединяют то, что знают, и отвечают неверно. Это создает очень большую проблему, усложняет задачу, поэтому фактчекинг крайне важен», — обратил внимание спикер.

ИИ понятия не имеет о реальном содержании нашей жизни. Еще одна интересная статистика: из всего объема информации, которая нас окружает, 10% — общие знания, а 60% — локальные знания, которые составляют главное содержание нашей деятельности. И если в общих знаниях ИИ неплохо ориентируется, то локальными знаниями — кто тебя окружает, где и как ты живешь, что у тебя происходит на работе — языковые модели не обладают. А у людей все наоборот: человек может иметь чуть меньше общих знаний, но локальными обладают все без исключения. И в этом принципиальное отличие. Есть еще 30% неявных знаний, но это уже из области physical AI.

«Мозг» модели сложнее мозга мухи, но нерешительнее. Большие языковые модели отличаются количеством параметров, которые могут обрабатывать, и контекстным окном. Так, у модели Llama, которая умеет анализировать и генерировать текстовую информацию, но не принимает решения, — 70 млрд параметров, а в мозгу мухи-дрозофилы, которая управляет процессами анализа сенсорных данных и принимает решения, — всего 50 млн синаптических связей. «Слава богу, что у нас такого нет, иначе все дроны станут осмысленными. Но теоретически это возможно», — предупредил Нурутдинов.

Есть три типа или три этапа развития агентного ИИ в организациях. Первый — подписка. ChatGPT, Perplexity, OpenAI — все эти решения доступны, дают широкие возможности, но у них малый размер RAG и есть опасность утечки информации — данные-то отправляются на сторону. Собственные решения безопасные, но имеют более ограниченные возможности или требуют очень дорогого оборудования и высоких требований к квалификации специалистов.

Ильдар Нургалиев напомнил, что «Таттелеком» запустил строительство собственного ЦОДа Ильдар Нургалеев напомнил, что «Таттелеком» запустил строительство собственного ЦОДа Фото: rais.tatarstan.ru

Стоимость флагманского ускорителя — 3,5 млн рублей: зачем и на чем обучать ИИ

Вадим Яковлев, директор департамента анализа коммерческой деятельности ПАО «Таттелеком», привел более прикладные кейсы. Он предупредил, что сегодня легко выдавать за ценное то, что уже есть в открытом доступе. Так, сайт Ollama.com предлагает скачать более 160 моделей, а на Github лежит более сотни оболочек чата. Так, можно скачать сами языковые модели, поднять виртуальный сервер и… все это открывает голубой океан для псевдоэкспертов. Отсюда и размножившиеся ChatGPT в соцсетях за три копейки.

Важно вот что. Для того чтобы большая языковая модель была по-настоящему эффективна на предприятиях, ее нужно адаптировать под локальные знания. Иначе ИИ будет галлюцинировать: без дообучения модель придумает несуществующую должность Яковлеву в несуществующей компании. В самом «Таттелекоме», по словам спикера, с помощью ИИ реализована метапоисковая система, система проверки паспорта клиентов и т. д. «У нас 2 тысячи рабочих писем были загружены в систему, и теперь, когда мы задаем вопрос, какие письма направлялись в ту или иную организацию, мы получаем краткую сводку этих писем», — привел пример он. Но данные необходимо правильно подготовить, это требует глубокого изучения и больших вычислительных ресурсов.

Масштаб требуемых ресурсов как раз проиллюстрировал Ильдар Нургалеев, замгендиректора «Таттелекома». «В Татарстане в 2019 году был открыт первый суперкомпьютер, занимается обработкой больших данных на GPU V100 (ускоритель Nvidia, разработанный в 2017 году,прим. ред.). Мы именно на этом суперкомпьютере создавали свои первые решения. А сегодня флагман — карта H100 (в 3 раза больше Cuda ядер, в 4 раза выше скорость инференса, то есть применения обученных моделей для предсказаний или выводов). Ее стоимость — 3,5 миллиона рублей, и при этом ее не очень просто найти, Рустам Нургалиевич», — передал Нургалеев ускоритель раису. Для понимания: представленная в конце февраля Илоном Маском модель Grok3 была разработана на суперкомпьютере Colossus, который содержит 200 тыс. таких ускорителей Н100. «Этот ЦОД строился только под эту модель. Это 150 МВт электрической мощности; чтобы его охлаждать, требуется примерно 5 миллионов литров воды. Объем инвестиций оценивается примерно в 8 миллиардов долларов», — подчеркнул спикер.

Нургалеев напомнил, что «Таттелеком» запустил строительство собственного ЦОДа. «Планируем развернуть специальный кластер на ускорителях вычислительной мощности В200 (еще более мощное GPU) для нужд ассоциации и Академии наук РТ в целом», — заключил он.

«Многие из нас в самом начале пути познания вот этих возможностей. И 98 процентов из нас будут пользователями, а не разработчиками. Как мы видим, возможностей у нас много», — подвел итоги услышанному Рустам МиннихановФото: rais.tatarstan.ru

Первая в России роботизированная больница и виртуальный совет экспертов

Были и другие доклады. Евгений Магид, завкафедрой интеллектуальной робототехники КФУ, рассказал, что на базе медсанчасти университета будет создана первая в России роботизированная умная больница. «Чаще всего медработники сталкиваются с нерациональным использованием времени медперсонала, проблемами безопасности, и вследствие последних событий, в том числе ковида, большой проблемой является контакт между пациентами и персоналом. Мы предлагаем как решение делегировать первую часть задач роботам, а задачи безопасности — искусственному интеллекту, который обеспечит контроль доступа в помещения и видеонаблюдение», — говорил он.

Прототип робота уже создан. Он представляет собой всенаправленное устройство, которое может ехать с места в любую сторону и попадать в самые труднодоступные места клиники. А за безопасность будет отвечать система распознавания лиц и роботов, причем уже идут тесты, сможет ли устройство оперативно проехать через распахнувшуюся перед ним дверь до того, как она автоматически закроется. Магид ожидает, что первые роботы появятся в клинике уже в 2027 году. Окончание проекта намечено на 2036-й, а после успешных испытаний можно будет технологию масштабировать на поликлиники и больницы республики.

Второй проект нацелен на безопасность использования промышленных роботов. «Реальные промышленные роботы представляют для человека большую опасность. Чтобы нивелировать эту проблему, мы их запираем в клетки безопасности, куда человек не входит, и роботы работают самостоятельно. Понятно, что в идеале мы хотели бы, чтобы на заводах не было никаких людей, но, к сожалению, на текущем уровне развития технологий это невозможно», — рассуждал он.

Вывод — создавать коботов, коллаборативных роботов, работающих вместе с человеком. Магид с командой протестировал систему, в которой человек жестами управляет роботом и они вдвоем собирают маленького робота. На следующем этапе робот, управляемый движениями пальцев, совместно с человеком собирал спиннер. Почему нельзя автоматизировать этот процесс, ученый не раскрыл; видимо, подразумевается, что такой алгоритм будет использоваться на более сложных производственных процессах, полная автоматизация которых невозможна.

Поделилась своими разработками и «Татнефть». Константин Кучукбаев, руководитель центра компетенций искусственного интеллекта ПАО «Татнефть», рассказал об охвате ИИ внутренних процессов компании. «Инвестиции „Татнефти“ в аппаратное обеспечение искусственного интеллекта обоснованы. Мы ориентируемся на передовые тренды, учитываем зрелость технологий, возможности максимальной оптимизации алгоритмов и уровень подготовки наших специалистов. Наш рискориентированный подход направлен на обеспечение устойчивого развития и предотвращение финансовых потерь», — подчеркивал он, демонстрируя слайд со всем необходимым железом.

Пока один из флагманских проектов — мультиагентное насыщение виртуального совета экспертов. Т. е. с пользователем говорит не абстрактная модель, а множество экспертов — по IT, химии, физике, истории компании, разработке и добыче, охране труда и даже поиску в интернете. Если один агент не сможет ответить, он переадресует вопрос своему «коллеге», который даст правильный ответ. И никаких галлюцинаций! Это только один пример, а продуктовый портфель за год пополнился 13 решениями, некоторые из которых могут быть интересны и сторонним компаниям.

«Многие из нас в самом начале пути познания вот этих возможностей. И 98 процентов из нас будут пользователями, а не разработчиками. Мы должны быть вашими клиентами, но, прежде чем быть вашими клиентами, мы должны понимать, какие у нас есть возможности. Как мы видим, возможностей у нас много, — подвел итоги услышанному Рустам Минниханов. — Айрат (Хайруллин, министр цифрового развития РТ,прим. ред.) нам показывал, как можно тексты готовить, как анализировать, уже наши многие госслужащие этим пользуются. Но это только начало пути. Я считаю, что нам надо консолидировать все. Мощная работа идет в „Таттелекоме“, в компании „Татнефть“, в ICL, и много таких. Нам надо консолидировать наши усилия, чтобы друг друга дополнять и не тратить деньги. Ну и перенимать лучшие практики».