Логотип МИЭМ НИУ ВШЭ
Завершен
Логотип типа проекта Научно-исследовательская работа
Научно-исследовательская работа
2024 / 2025
Логотип проекта Анонимизация индустриальных данных методами машинного обучения

    1946 Анонимизация индустриальных данных методами машинного обучения

    Старт
    11.10.2024
    Представление
    05.11.2024 – 15.11.2024
    Постерная сессия
    27.01.2025 – 07.02.2025
    Защита
    14.04.2025 – 25.04.2025

    Паспорт проекта

    Аннотация

    Алгоритмы машинного обучения работают на основании наборов входных данных, которые снимаются непосредственно в исследуемой системе или симулируются с помощью модели этой системы. При этом качество предложенного алгоритма напрямую зависит от репрезентативности выборки. Эта выборка должна собираться в условиях, близких к рабочим условиям системы, а количество элементов выборки должно быть достаточно для понимания существенных характеристик данных. Таким образом, наиболее эффективным будет...

    Отрасль

    Информатика

    Теги

    Информатика

    Цель

    Цель работы - проверка применения алгоритмов машинного обучения для анонимизации данных, а также разработка новых методов, мотивированных первичных исследованием. В данном случае, под анонимизацией подразумевается возможность получения выборок, имеющих одинаковые распределения с реальными данными, но не содержащими события, собиранные в системе. В ходе работы должны быть проверены разные типы данных, от изображений до временных рядов, полученные алгоритмы должны позволять обучать решения...

    Ожидаемые результаты

    • 1. Оценка качества использования генеративных моделей на разных типах данных.
      • 2. Определение снижение качества решений задач регрессии и классификации при использовании синтетических данных выделенных типов.
        • 3. Проведение исследования по повышению качества полученных решений с помощью изменений функций потерь (например, на основании слабых решений).
          • Написание библиотеки для тестирования решений генеративного моделирования.

            Форма и способы промежуточного контроля

            Презентация

            Форма представления результатов

            Презентация и финальный отчёт

            Ресурсное обеспечение

            Кластер Харизма, открытые наборы данных.

            Имеющийся задел

            Группа имеет опыт выполнения индустриальных проектов по анонимизации данных, первичная проработка задачи была проведена в прошлом году.

            Заказчик

            НИУ ВШЭ / Заполнено автоматически