Обработка и анализ больших данных представляет собой новую практическую задачу, требующую навыков работы с современным инструментарием. В настоящее время данные называют «нефтью 21 века», они накапливаются в корпоративных и государственных информационных системах, социальных сетях, веб-блогах и сайтах и потенциально являются ценным ресурсом для извлечения новых знаний, инсайтов для научных исследований, повышения эффективности и конкурентоспособности предприятий. Методы интеллектуального анализа больших данных, таким образом, представляют собой тот необходимый инструмент для высвобождения этого потенциала.
Машинное обучение и большие данные
National Research Nuclear University MEPhIAbout this Course
What you will learn
Основным стандартам и методологиям анализа, обработки, описания и визуализации социально-экономических данных
Математическим и инструментальным методам машинного обучения
Использованию современных информационно-коммуникационных технологий в профессиональной деятельности
Offered by

National Research Nuclear University MEPhI
National Research Nuclear University “MEPhI” is one of the most recognized technical universities in Russia. It is the only research nuclear university in Russia. The aim of the university existence is preparing the specialists for nuclear industry, science, information technology and other high-tech sectors of Russian economy.
Syllabus - What you will learn from this course
Анализ данных
В этом модуле вы познакомитесь с основными понятиями и методами анализа данных. Узнаете, что такое искусственные нейронные сети и для чего они используются. Получите представление об основных целях и задачах машинного обучения, о существующих стандартах в сфере хранения и обработки данных.
Подготовка данных
В рамках наиболее популярного стандарта CRISP мы рассмотрим этап анализа, который называется подготовка данных. На предыдущих шагах мы выяснили потребности бизнеса. Определили, какие данные у нас имеются, их источники и форматы. Данные мы каким-то образом извлекли из источников. И наша текущая задача эти данные подготовить, очистить, преобразовать для того, чтобы можно было дальше заниматься моделированием.
Визуализация данных
Данный модуль посвящен визуализации данных. Эта тема является очень важной для анализа, поскольку визуализация данных используется на разных этапах стандарта CRISP. Визуализация данных позволяет вырабатывать гипотезы, проверять гипотезы и, в целом, оценивать качество моделей, построенных ранее.
Описательные статистики
Этот модуль посвящен систематизации данных и описанию их с помощью различных методов, таких как: расчет статистик; проверка статистических тестов и гипотез; построение диаграмм, ранее рассмотренных с точки зрения визуализации.
Frequently Asked Questions
When will I have access to the lectures and assignments?
What will I get if I purchase the Certificate?
Is financial aid available?
Will I earn university credit for completing the Course?
More questions? Visit the Learner Help Center.