Данный исследовательский проект направлен на разработку и реализацию нейросетевой модели, способной преобразовывать голосовые сообщения в текстовую форму. Проект охватывает теоретические основы обработки естественного языка, архитектуры нейронных сетей, используемых для распознавания речи, а также практические аспекты обучения и оптимизации модели. В процессе работы будет проведен анализ существующих подходов и технологий в области автоматической транскрипции речи, таких как скрытые марковские модели, энкодер-декодеры на основе трансформаторов и современные методы глубокого обучения. Особое внимание будет уделено адаптации модели к различным типам голосовых сообщений, включая шумные записи, разные акценты и скорости речи. В рамках проекта планируется разработка эффективного алгоритма предобработки аудиоданных, а также подбор оптимальной архитектуры нейронной сети для достижения высокой точности транскрипции. Результаты работы будут включать в себя обученную модель, способную транскрибировать голосовые сообщения, и набор инструментов для оценки ее производительности. Проект предполагает проведение экспериментов с различными гиперпараметрами и архитектурами, а также сравнение полученных результатов с существующими решениями в области автоматической транскрипции речи.