Journal article
Підхід до використання фільтра блума для багатокласової класифікації текстових даних в режимі реального часу.
Year:
2019Published in:
Technology Center PCаналіз потокових даних
фільтр Блума
аналіз текстових даних
класифікація текстів
У даній роботі розглянуто фільтр Блума, який вирішує задачу фільтрації потоків, та було запропоновано новий підхід використання цього фільтру для класифікації текстових даних. В якості вхідних даних було обрано текстові дані, які надходять у реальному часі. Розглянуто модель з точки зору точності класифікації, швидкості навчання моделі, кількості використаної пам’яті та швидкістю видачі результату класифікації. Представлено метод донавчання моделі та критерій відбору слів для покращення навчання моделі. Показано процес навчання моделі для багатокласової класифікації. Виявлені проблеми даного підходу та запропоновані проблеми їх вирішення.