Корпорации часто сталкиваются с дилеммой: для качественного обучения ИИ необходимы реальные сведения, но их использование ограничено строгими требованиями конфиденциальности. Новый сервис от факультета компьютерных наук ВШЭ автоматизирует процесс очистки данных, превращая чувствительные записи в безопасные для обработки наборы. Система сканирует таблицы, выявляет персональную информацию и применяет алгоритмы замены согласно заданным правилам.
Ключевое отличие разработки — строгая воспроизводимость результатов. Для идентичных входящих файлов система всегда генерирует одинаковый обезличенный вариант. Это дает инженерам возможность повторять эксперименты и проводить аудиты, не обращаясь к исходникам. Архитектура решения предусматривает раздельное хранение данных, реестр замен и жесткий контроль доступа, что делает его пригодным для использования в медицине, финансовом секторе и государственных структурах.
«Для ИИ-проектов недостаточно просто иметь доступ к данным. Необходимо уметь безопасно готовить их так, чтобы они сохраняли аналитическую ценность, но не раскрывали персональные сведения. Наш сервис встраивает обезличивание в управляемый процесс подготовки данных для ИИ», — пояснил руководитель проекта Салех Хади.
Комментарии (0)
Пока нет комментариев. Будьте первым!