Базы данных в высокопроизводительных информационных системах
книга

Базы данных в высокопроизводительных информационных системах

Форматы: PDF

Издательство: Северо-Кавказский Федеральный университет (СКФУ)

Год: 2016

Место издания: Ставрополь

Страниц: 163

Артикул: 20502

Электронная книга
326

Краткая аннотация книги "Базы данных в высокопроизводительных информационных системах"

Пособие составлено в соответствии с требованиями Федерального государственного образовательного стандарта, программой и учебным планом дисциплины. Содержит теоретические аспекты проектирования и разработки приложений для высокопроизводительных вычислительных систем, в основе функционирования которых лежат базы данных. Основные технологии, рассматриваемые в пособии, – Hadoop, NoSQL.
Предназначено для студентов направления подготовки 09.04.02 – Информационные системы и технологии, обладающих теоретическими знаниями в области проектирования высокопроизводительных приложений и практическими навыками программирования (предпочтительно языки Java, SQL, Python).

Содержание книги "Базы данных в высокопроизводительных информационных системах"


Предисловие
Раздел 1. Основы BIG DATA
Раздел 2. Модели и концепции BIG DATA
Раздел 3. Основы NOSQL
Раздел 4. Фреймворк распределенного программирования
Раздел 5. YARN
Раздел 6. Паттерны MAPREDUCE и BIG DATA
Раздел 7. MONGODB
Заключение
Литература

Все отзывы о книге Базы данных в высокопроизводительных информационных системах

Чтобы оставить отзыв, зарегистрируйтесь или войдите

Отрывок из книги Базы данных в высокопроизводительных информационных системах

103YARNРаздел V2. HDFS остался неизменным при переходе на новую версию.3. Hadoop 2 поддерживает любые модели выполнения, включая портирование MapReduce который в новой версии называется YARN.4. Все механизмы исполнения в Hadoop 2 реализованы как YARN-приложения.5. Фреймворк YARN обеспечивает распределение работ и нечув-ствителен к характеру выполняемых заданий.MapReduce – мощная распределенная платформа и модель про-граммирования, которая функционирует на основе пакетного распа-раллеливания задач на кластере. Несмотря на то, что технология доста-точно эффективна, MapReduce имеет некоторые недостатки; главным образом связанные с пакетной обработкой, в результате чего она не подходит для обработки данных в реальном времени. Фактически, YARN представляет собой распределенный планировщик задач, кото-рый отвечает за два действия:1) отвечает на запросы клиентов для создания контейнеров. Кон-тейнер – это, фактически, процесс приложения;2) осуществляет наблюдение за контейнерами, которые запущены; останавливает их выполнение при необходимости. Выполнение кон-тейнера может быть остановлено если планировщику YARN требуется освободить ресурсы.В табл. 5.1 сравниваются MapReduce 1, чтобы продемонстрировать революционность новой технологии.Харак-теристикаMapReduce 1YARNМодель выполненияТолько MapReduce-прило-жения поддерживаются в Hadoop 1, могут исполняться ограниченный набор типов приложений, соответствую-щих пакетной модели обра-ботки данных MapReduce.YARN не накладывает никаких ограничений на тип работы, которая может выполняться в Hadoop; разработчик выбирает механизм исполнения (будь то обработка в реальном времени на Spark, обработки графов в Giraph, или пакетная обработка MapReduce).Таблица 5.1Сравнение MapReduce 1 и YARN