Базы данных в высокопроизводительных информационных системах
Форматы: PDF
Издательство: Северо-Кавказский Федеральный университет (СКФУ)
Год: 2016
Место издания: Ставрополь
Страниц: 163
Артикул: 20502
Краткая аннотация книги "Базы данных в высокопроизводительных информационных системах"
Пособие составлено в соответствии с требованиями Федерального государственного образовательного стандарта, программой и учебным планом дисциплины. Содержит теоретические аспекты проектирования и разработки приложений для высокопроизводительных вычислительных систем, в основе функционирования которых лежат базы данных. Основные технологии, рассматриваемые в пособии, – Hadoop, NoSQL.
Предназначено для студентов направления подготовки 09.04.02 – Информационные системы и технологии, обладающих теоретическими знаниями в области проектирования высокопроизводительных приложений и практическими навыками программирования (предпочтительно языки Java, SQL, Python).
Содержание книги "Базы данных в высокопроизводительных информационных системах"
Предисловие
Раздел 1. Основы BIG DATA
Раздел 2. Модели и концепции BIG DATA
Раздел 3. Основы NOSQL
Раздел 4. Фреймворк распределенного программирования
Раздел 5. YARN
Раздел 6. Паттерны MAPREDUCE и BIG DATA
Раздел 7. MONGODB
Заключение
Литература
Все отзывы о книге Базы данных в высокопроизводительных информационных системах
Отрывок из книги Базы данных в высокопроизводительных информационных системах
103YARNРаздел V2. HDFS остался неизменным при переходе на новую версию.3. Hadoop 2 поддерживает любые модели выполнения, включая портирование MapReduce который в новой версии называется YARN.4. Все механизмы исполнения в Hadoop 2 реализованы как YARN-приложения.5. Фреймворк YARN обеспечивает распределение работ и нечув-ствителен к характеру выполняемых заданий.MapReduce – мощная распределенная платформа и модель про-граммирования, которая функционирует на основе пакетного распа-раллеливания задач на кластере. Несмотря на то, что технология доста-точно эффективна, MapReduce имеет некоторые недостатки; главным образом связанные с пакетной обработкой, в результате чего она не подходит для обработки данных в реальном времени. Фактически, YARN представляет собой распределенный планировщик задач, кото-рый отвечает за два действия:1) отвечает на запросы клиентов для создания контейнеров. Кон-тейнер – это, фактически, процесс приложения;2) осуществляет наблюдение за контейнерами, которые запущены; останавливает их выполнение при необходимости. Выполнение кон-тейнера может быть остановлено если планировщику YARN требуется освободить ресурсы.В табл. 5.1 сравниваются MapReduce 1, чтобы продемонстрировать революционность новой технологии.Харак-теристикаMapReduce 1YARNМодель выполненияТолько MapReduce-прило-жения поддерживаются в Hadoop 1, могут исполняться ограниченный набор типов приложений, соответствую-щих пакетной модели обра-ботки данных MapReduce.YARN не накладывает никаких ограничений на тип работы, которая может выполняться в Hadoop; разработчик выбирает механизм исполнения (будь то обработка в реальном времени на Spark, обработки графов в Giraph, или пакетная обработка MapReduce).Таблица 5.1Сравнение MapReduce 1 и YARN
С книгой "Базы данных в высокопроизводительных информационных системах" читают
Бестселлеры нон-фикшн
Новинки книги нон-фикшн
и мы свяжемся с вами в течение 15 минут
за оставленную заявку