Содержание
- Введение 1
- Теоретические основы работы с большими данными 2
- - Концепция и характеристики больших данных 2.1
- - Технологии хранения и обработки больших данных 2.2
- - Методы анализа больших данных 2.3
- Инструменты и платформы для обработки больших данных 3
- - Обзор Apache Hadoop и экосистемы 3.1
- - Обзор Apache Spark и его применение 3.2
- - Облачные платформы для больших данных (AWS, GCP) 3.3
- Практическое применение инструментов для анализа данных 4
- - Анализ данных о продажах с использованием Spark 4.1
- - Прогнозирование оттока клиентов с использованием машинного обучения 4.2
- - Анализ данных социальных сетей с использованием облачных платформ 4.3
- Оценка эффективности и сравнение инструментов 5
- - Сравнительный анализ Apache Spark и Hadoop 5.1
- - Сравнение облачных платформ (AWS vs. GCP) 5.2
- - Рекомендации по выбору инструментов 5.3
- Заключение 6
- Список литературы 7