Данный исследовательский проект направлен на разработку интерактивного учебного комплекса, посвященного выделению текста из различных источников, таких как изображения, сканы документов и веб-страницы. Проект предполагает создание обучающей платформы, которая позволит студентам и школьникам углубить свои знания в области обработки естественного языка и компьютерного зрения. Основной акцент делается на практическом применении алгоритмов машинного обучения для решения задачи выделения текста. В рамках проекта будут изучены различные методы предобработки данных, такие как удаление шума, повышение контрастности и нормализация текста. Также будут рассмотрены современные подходы к обучению моделей, включая глубокое обучение и трансформеры. Интерактивность платформы будет обеспечиваться за счет визуализации результатов работы алгоритмов, предоставления инструментов для настройки параметров и возможности самостоятельного тестирования разработанных моделей. Предполагается, что проект будет способствовать развитию навыков работы с данными, программирования на Python и понимания принципов работы алгоритмов машинного обучения. Учебный комплекс будет полезен как для начинающих, так и для опытных пользователей, желающих расширить свои знания в области обработки текста.