Содержание
- Введение 1
- Основы обработки естественного языка и типы NLP-моделей 2
- - Предобработка текста и базовые NLP задачи 2.1
- - Статистические модели и их недостатки 2.2
- - Введение в нейронные сети и архитектуры для NLP 2.3
- Типы атак на NLP-системы: adversarial, poisoning и другие 3
- - Adversarial атаки: методы генерации и влияние на модели 3.1
- - Poisoning атаки: типы и техники внедрения вредоносных данных 3.2
- - Evasion атаки: подходы к обходу систем защиты 3.3
- Методы защиты NLP-систем 4
- - Adversarial training и методы повышения устойчивости 4.1
- - Detection-based методы и обнаружение атак 4.2
- - Этические аспекты и подходы к обеспечению безопасности 4.3
- Практические примеры и кейс-стади 5
- - Примеры атак на системы классификации текста 5.1
- - Уязвимости и защита чат-ботов 5.2
- - Атаки на системы машинного перевода 5.3
- Заключение 6
- Список литературы 7