Содержание
- Введение 1
- Архитектура и компоненты Hadoop 2
- - HDFS: распределенное хранилище данных 2.1
- - MapReduce: парадигма обработки данных 2.2
- - YARN: управление ресурсами в Hadoop 2.3
- Архитектура и компоненты Spark 3
- - Spark Core: основы и архитектура 3.1
- - Spark SQL и DataFrames 3.2
- - Spark Streaming, MLlib, и GraphX 3.3
- Сравнительный анализ Hadoop и Spark 4
- - Производительность и масштабируемость 4.1
- - Функциональность и применение 4.2
- - Экосистемы и инструменты 4.3
- Практическое применение: примеры и кейсы 5
- - Анализ данных в Hadoop 5.1
- - Обработка потоков данных в Spark Streaming 5.2
- - Применение MLlib для машинного обучения 5.3
- Заключение 6
- Список литературы 7