Расходы на обновление рекомендательных систем в крупных сервисах можно сократить в восемь раз с помощью нового метода работы с Semantic ID. Исследователи из AI VK и ИТМО разработали технологию выравнивания идентификаторов, которая позволяет учитывать смену интересов пользователей без остановки и полного переобучения нейросетей.
Проблема традиционного подхода заключается в быстром устаревании Semantic ID — внутренних кодов, описывающих поведение пользователей и свойства контента. Раньше инженерам приходилось выбирать между поверхностным дообучением и полным пересчетом базы, который часто нарушал логику работы уже запущенных сервисов. Новый алгоритм предлагает компромисс: система сначала обновляет идентификаторы на свежих данных, а затем принудительно выравнивает их со старой версией для сохранения стабильности.Ведущий исследователь AI VK Владимир Байкалов пояснил, что этот метод позволяет избежать деградации рекомендаций при резкой смене трендов. Главное преимущество заключается в экономии ресурсов — затраты на поддержку актуальности модели снижаются в восемь раз. Это упрощает внедрение генеративного поиска в крупные платформы, где объемы данных и скорость смены интересов аудитории не позволяют проводить регулярное переобучение всей архитектуры с нуля.

Комментарии (0)
Пока нет комментариев. Будьте первым!