Данный исследовательский проект посвящен изучению и практическому применению алгоритма шинглов для решения задачи обнаружения текстового плагиата в учебных работах. Проект направлен на всесторонний анализ эффективности алгоритма, его преимуществ и недостатков, а также на разработку рекомендаций по его оптимизации для использования в образовательных целях. Будут рассмотрены различные подходы к реализации алгоритма, включая выбор размера шинглов, методы хеширования и способы сравнения текстов для выявления сходства. Особое внимание будет уделено учету специфики учебных работ, таких как наличие цитат, ссылок и различных видов форматирования. В рамках проекта планируется провести эксперименты на наборе текстов, включающем работы различной тематики и объема, с использованием различных параметров алгоритма шинглов. Полученные результаты будут проанализированы для оценки точности, полноты и скорости работы алгоритма. Результаты исследования могут быть полезны для преподавателей, студентов и разработчиков систем обнаружения плагиата.