Как учёным из МФТИ удалось оптимизировать работу с данными для искусственного интеллекта

Как учёным из МФТИ удалось оптимизировать работу с данными для искусственного интеллекта

Специалисты из МФТИ нашли способ определить идеальный объём данных для машинного обучения. Они разработали два метода, которые помогают понять, когда модель становится достаточно уверенной в своих выводах. Для этого используются математические критерии: KL-дивергенция и s-score. Эти подходы основаны на анализе изменений в параметрах модели при добавлении или удалении данных. При нормальном распределении KL-дивергенция стремится к нулю, а s-score — к единице, что говорит о стабильности модели. Эксперименты с синтетическими и реальными данными подтвердили эффективность этих методов. Такой подход позволяет сэкономить ресурсы на этапе сбора данных и оптимизировать процесс обучения моделей.

Топ

Лента новостей