Размер:
A A A
Цвет: C C C
Изображения Вкл.Выкл.
Обычная версия сайта
Demidov Yaroslavl State University

Наш адрес: 150003, г. Ярославль, ул. Советская, д. 14
График работы с посетителями в отделах университета:
пн, вт, ср, чт: 9.00-12.00, 14.00-17.00,
пт: 9.00-12.00, 14.00-16.00.
Приемная комиссия: +7 (4852) 303210
Ректорат: +7 (4852) 797702
Факс: +7 (4852) 255787
e-mail: rectorat@uniyar.ac.ru

Наука о данных и аналитика больших объемов информации (EMCDSA)

Наука о данных и аналитика больших объемов информации (EMCDSA)


  • Базовые знания о больших данных и о применении аналитики на практике
  • Жизненный цикл аналитики данных
  • Большие данные для решения бизнес-задач
  • Представление о базовых и продвинутых аналитических методах, о технологиях и средствах аналитики больших данных, включая MapReduce и Hadoop
  • Необходимые навыки для участия в проектах по аналитике больших данных

Программа курса.

Модуль 1 - Введение в аналитику больших данных
–Специфика больших данных, состояние практической аналитики
–Роль специалиста по анализу больших данных и роль аналитики больших данных в разных сферах бизнеса
Модуль 2 - Жизненный цикл аналитики данных
–Фазы типичного аналитического цикла: раскрытие данных, подготовка данных, проектирование модели, сообщение результатов, операционализация
–Критически важные задачи, которые возникают во время каждой фазы цикла
Модуль 3 – Использование R-программирования при первичном анализе данных
–Введение в R-программирование, первичное изучение, анализ и визуализация данных с помощью R-программирования
–Практические работы для освоения изученных концептов
Модуль 4 - Передовая аналитика и статистическое моделирование больших данных. Теория и методы
–Ключевые методы анализа данных: выбор кандидата на основе наивного байесовского классификатора, категоризация с помощью кластеризации методом k-средних и правил ассоциации
–Предиктивное моделирование на основе дерева решений, линейная и логистическая регрессия, анализ временных рядов и текстовый анализ.
Модуль 5 – Передовая аналитика и статистическое моделирование больших данных. Технологии и средства
–Аналитические средства для обработки неструктурированных данных, включая MapReduce и Hadoop.
–Аналитика базы данных с помощью SQL-расширений и других передовых технологий SQL, а также функций MADlib
Модуль 6 – Завершение и операционализация проекта по аналитике
–Обработка результатов анализа и отчеты для заказчиков
–Выделение ключевых моментов с помощью визуализации