05.04.2026 21:54
Новости.
Просмотров всего: 3372; сегодня: 181.

UDV Group: AI Security — безопасность искусственного интеллекта

Юрий Чернышов, к.ф.-м.н., доцент УНЦ «Искусственный интеллект» УрФУ, руководитель исследовательского центра UDV Group рассказал о сложностях обнаружения причины изменения поведения модели, о методах, которые подходят для анализа безопасности и о том, как оценивается устойчивость модели в условиях реального применения.

Какие индикаторы помогают заметить ранние признаки отравления данных на этапе подготовки датасета?

Почти все, кто имеет практический опыт внедрения и использования проектов, включающих анализ данных и машинное обучение, уже в курсе, что подобные системы очень неустойчивы, чувствительны к внешним помехам. Причина этого не в том, что у разработчиков недостаточная экспертиза (хотя встречаются и такие случаи), а в том, что при обучении модели применяются наборы данных, которые не могут содержать все возможные ситуации при будущей эксплуатации. Да это и невозможно, поскольку всегда на практике имеет место так называемый «сдвиг в данных» (data shift) из-за меняющейся инфраструктуры, условий эксплуатации, поведения пользователей и пр. Поэтому очень сложно при обнаружении изменения поведения модели понять - что же является истинной причиной: сдвиг в данных, сбой датчика, помехи в сети передачи данных, некачественная модель ML, незначительная перегрузка инфраструктуры или это просто «шум» в рамках статистической погрешности. И за этими вариантами всегда сложно разглядеть атаку через отравление данных. Индикаторы для диагностики изменения традиционные: всесторонний статистический анализ характеристик данных, как по параметрам получения и обработки, так и по семантике. Но для принятия мер при обнаружении отклонения в поведении модели на основе данных необходима комплексная инфраструктура, включающая мониторинг оборудования, параметров данных и модели, метрик инференса (промышленного использования).

Какие методы анализа позволяют выявлять бэкдор-активность в уже обученной модели?

Для анализа безопасности модели ИИ подходят все те же методы, применяемые при тестировании безопасности программного обеспечения: мониторинг, фаззинг, анализ взаимодействия с внешними компонентами. Сложность заключается в том, что невозможно понять логику работы модели, как это делается при анализе кода программного обеспечения, поскольку эта логика модели ИИ распределена по миллионам (как в случае с глубоким машинным обучением) или по миллиардам (как в случае с LLM) параметров. Поэтому применяется анализ модели ИИ как «черного ящика», анализируя вход и выход, оценивая параметры работы и потребление ресурсов. Исторический анализ параметров работы модели позволяет сформировать паттерны нормального поведения и анализировать в будущем отклонения от этих паттернов.

Как оценивается устойчивость модели к adversarial-примерам в условиях реального применения?

Самый лучший способ для подобного анализа это red teaming, в том числе и с применением автоматизированных средств проверки: фаззинг, подбор проверяющих сэмплов, создание для модели критических условий для функционирования (ddos атака). Если есть возможность оценивать устойчивость в лабораторных условиях, то эффективным является схема генеративных состязательных сетей (GAN), в которых есть генератор, создающий сэмплы, и дискриминатор, пытающийся различить настоящие сэмплы и созданные генератором. При этом генератор и дискриминатор постоянно конкурируют друг с другом, генератор учится все лучше «обманывать», а дискриминатор – все лучше выявлять факт подделки.

Какие техники усложняют попытки извлечения модели через API (model extraction)?

Для любого интерфейса взаимодействия, и API в том числе, важно настроить как можно более строгие правила доступа к ресурсу: авторизацию, аутентификацию и контроль за ресурсами. При этом необходимо проектировать API таким образом, чтобы минимизировать возможности взаимодействующей стороны, оставлять доступ только к той информации, которая ей предназначена, ограничивать разумными уровнями потребления ресурса, исходящими из технического задания и архитектуры проекта. Например, можно запретить длительные сессии взаимодействия, если проект этого не предполагает. Или ограничить количество запросов к ресурсу от одного источника таким уровнем, который достаточен для нормальной работы, все что аномально выше этого уровня – скорее всего свидетельствует о попытке автоматизированного сканирования или парсинга.

Какие меры повышают защищенность датасетов от подмены, injection-атак и несанкционированных правок?

Наличие защищенных наборов данных - серьезная задача, без которой невозможно создавать качественные, надежные и полезные системы ИИ. Зачастую набор данных ценится даже больше, чем модель, обученная на его основе. Поэтому компании-разработчики систем ИИ так ценят свои наборы данных, защищают их наравне с программным кодом. Меры, защищающие наборы данных (датасеты) от злонамеренного искажения, такие же, как и при защите программного кода: требуется контролировать версионирование и доступ к изменениям, проводить тестирование и анализ характеристик после изменений.

Какие механизмы мониторинга лучше всего подходят для отслеживания аномалий в поведении ИИ-модели?

Существует множество способов мониторить работу сложного устройства или системы, какой из них наиболее эффективен – сильно зависит от самой системы. Можно анализировать низкоуровневые параметры (трафик, потребление ресурсов оборудования), можно анализировать вход и выход модели ИИ (текст промпта и сгенерированный ответ), потребление токенов. Но на мой взгляд наиболее эффективно анализировать влияние применения модели на бизнес-процесс – если в бизнес-процессе появились отклонения (изменилась продолжительность звонков, частота отправки писем, поменялась бизнес-логика процесса, перестал компилироваться код и пр.), то скорее всего случился сбой в работе ИИ-модели и необходимо проводить расследование, в том числе с применением анализа низкоуровневых событий в инфраструктуре и ПО.

Тематические сайты: Безопасность, Информтехнологии, связь, Интернет, Инфраструктура, Искусственный интеллект
Сайты субъектов РФ: Москва, Московская область
Сайты федеральных округов РФ: Центральный федеральный округ
Сайты стран: Россия
Сайты объединений стран: БРИКС (BRICS)

Ньюсмейкер: UDV Group — 57 публикаций
Сайт: udv.group

Интересно:

10.04.2026 23:36 Новости
Выбраны лучшие бренды для подработки в ритейле
Цифровая платформа гибкой занятости Ventra Go! раскрыла результаты премии Ventra Go! Retail Awards. Сервис публикует рейтинг уже второй год подряд. Награда отмечает достижения ритейл-брендов в построении эффективной и уважительной культуры работы с гибким персоналом. Как были выявлены победители премии На платформе Ventra Go! зарегистрировано 2 млн+ исполнителей, которые каждый день выходят на подработку в 300+ брендов.  После завершения каждого задания исполнители могут поставить «звезды» – оценки и написать комментарий. В рамках Премии 2026 были проанализированы 610 000 оценок и 397 000+ отзывов и комментариев исполнителей, что втрое больше, чем в 2025 году. Были изучены отзывы исполнителей, которые ежедневно берут подработку в 25 000+ торговых точках. Лидеры были отфильтрованы по рейтингу — так появился шорт-лист из 12 брендов, чьи сильные стороны высоко оценили временные...
Punkt E примет участие в Natmall Expo 2026
09.04.2026 18:15 Мероприятия
Punkt E примет участие в Natmall Expo 2026
14–16 апреля 2026 года крупнейшая частная сеть зарядных станций для электромобилей в России Punkt E примет участие в 22-й выставке по развитию коммерческой недвижимости и масштабированию ритейла, точек питания, индустрии развлечений и сферы услуг Natmall Expo 2026, которая пройдет в «Крокус Экспо», Москва. Форум традиционно собирает экспертов отрасли для обсуждения актуальных тенденций, перспектив развития и внедрения новых технологий в сегменте коммерческой недвижимости. Участники смогут обменяться опытом и найти оптимальные решения для повышения эффективности своих объектов. На стенде Punkt E (B19) будут представлены решения по зарядной инфраструктуре, позволяющие повысить уровень комфорта клиентов и привлечь дополнительный трафик для ресторанов, торговых и офисных центров, а также других объектов коммерческой недвижимости. 14 апреля в 16:30 пройдет выступление...
Женская мода от Елены Мишаковой: полоска плюс горох
05.04.2026 19:24 Интервью, мнения
Женская мода от Елены Мишаковой: полоска плюс горох
Новая коллекция Misha’Le «Манифест свободы»: Полоска, горох и монохром в смелом оверсайз-виде Елены Мишаковой. В мире моды, где тренды мелькают как летние бабочки, Елена Мишакова, основательница бренда Misha’Le, всегда выбирает путь не просто следования, а переосмысления. Её новая коллекция «Манифест свободы» — это манифест свободы и смелости: оверсайз-силуэты, где классические принты полоска и горох оживают в креативных двухцветных сочетаниях светлых и тёмных оттенков, а монохром добавляет глубины и элегантности. “Раньше я любила осень в белом, чёрном и красном, — делится Елена. — Но весна требует свежести, и я решила поиграть с контрастами, чтобы каждая модель стала холстом для ярких образов”. Креативность полоски: от морской униформы к модному бунту. Полоска в одежде — это не просто узор, а история бунта и элегантности. Её путь начался в XVII веке во Франции, когда полосатые...
О том, как развивались и менялись театры, рассказали в Музее Москвы
04.04.2026 11:19 Аналитика
О том, как развивались и менялись театры, рассказали в Музее Москвы
Москва — город, подаривший миру понятие психологического театра. От первых общедоступных представлений до современного фестиваля «Театральный бульвар» традиция не прерывала развития ни в годы революций и потрясений, ни в эпоху электронных сервисов, киноплатформ и переизбытка развлечений.  «Комедиальная храмина» на Красной площади С чего начинался московский театр? С балаганных представлений на больших ярмарках и рыночных площадях. В 1702 году по велению Петра I на Красной площади, вдоль Кремлевской стены между Спасскими и Никольскими воротами, возвели «Комедиальную храмину» — первый государственный общедоступный театр. Играть в нем доверили немецкой труппе Иоганна Христиана Кунста, который был одновременно и режиссером, и художником, и артистом. «Стоили ярлыки (так назывались первые билеты) 10, шесть, пять и три копейки — дороговато для простого люда. Петр I приказал городские...
«Выберу.ру»: рейтинг лучших накопительных счетов за март 2026 года
01.04.2026 17:07 Аналитика
«Выберу.ру»: рейтинг лучших накопительных счетов за март 2026 года
К началу апреля проценты депозитов стремительно «тают», но по накопительным счетам в лучших предложениях они остаются выше — 15%-17%. Поэтому «Выберу.ру» составил рейтинг банков с наиболее выгодными для вкладчиков сберегательными продуктами по максимальным ставкам. Топ-подборка поможет людям в апреле получать доход выше, чем по вкладам. Аналитики финансового маркетплейса «Выберу.ру» изучили текущие параметры продуктов ТОП-100 российских банков по активам на 01.02.26 года. В ходе исследования и расчётов был подготовлен рейтинг «Лучшие накопительные счета в марте 2026 года». Методика исследования, использованная «Выберу.ру», позволила ранжировать накопительные счета не только по размерам процентных ставок. В качестве значимого критерия рассматривалась сумма дохода, полученная клиентом. В расчёты включались коэффициенты, отражающие механизм начисления процентов (на минимальный, средний...