Рабочий
2025 / 2026

2390 Использование кодовых конструкций для k-анонимизации
Старт
02.12.2025
Представление
26.01.2026 – 06.02.2026
Постерная сессия
06.04.2026 – 17.04.2026
Защита
08.06.2026 – 19.06.2026
Паспорт проекта
Аннотация
Проект нацелен на разработку алгоритма кластеризации данных на основе кодовых конструкций, с применением метрик L0 и L1 (или их комбинаций). На основе выполненной кластеризации производится приведение данных к целевым значениям метрик анонимизации данных, таких как k-анонимность. Данное решение позволит обезопасить субъектов, упоминаемых в данных, и выполнить один из необходимых шагов подготовки данных, используемых для обучения ML-моделей.
Проект мастерской безопасной разработки и...
Отрасль
Информационная безопасность
Теги
Машинное обучение
Безопасность
ML
Цель
Исследование и разработка методов анонимизации, основанных на помехоустойчивых кодах, для задач искусственного интеллекта
Ожидаемые результаты
- Программная реализация алгоритма, поддерживающая наборы данных с качественными и количественными признаками
- Выполнение сравнительного анализа качества и производительности разработанного алгоритма с существующими альтернативами (1-2 метода)
- Оценка влияния анонимизации на качество работы ML моделей, оценка качества анонимизации (использовать соответствующие метрики)
Форма и способы промежуточного контроля
Планирование по SCRUM методологии. Онлайн встречи с руководителем каждую неделю. Очные и онлайн встречи с куратором из VK минимум раз в месяц.
Форма представления результатов
Подготовка итогового отчета о проведенных исследованиях, исходные коды, загруженные в репозиторий проекта, программная документация.
Ресурсное обеспечение
ПК с установленным интерпретатором Python 3.8 и выше
Имеющийся задел
Предварительное исследование применимости помехоустойчивых кодов к задаче анонимизации, проведенное руководителем проекта.
Исследования алгоритмов анонимизации в рамках бакалаврской ВКР.
Заказчик
Организация / VK