Chevron Left
Back to Прикладные задачи анализа данных

Прикладные задачи анализа данных, Moscow Institute of Physics and Technology

4.4
458 ratings
74 reviews

About this Course

Методы машинного обучения — будь то алгоритмы классификации или регрессии, методы кластеризации или алгоритмы понижения размерности — применяются к подготовленным данным с вычисленными признаками для решения уже сформулированной задачи. Однако специалисты по анализу данных редко оказываются в такой идеальной ситуации. Обычно перед ними ставят задачи, которые нуждаются в уточнении формулировки, выборе метрики качества и протокола тестирования итоговой модели. Данные, с которыми нужно работать, часто представлены в непригодном виде: они зашумлены, содержат ошибки и выбросы, хранятся в неудобном формате и т. д. В этом курсе мы разберем прикладные задачи из различных областей анализа данных: анализ текста и информационный поиск, коллаборативная фильтрация и рекомендательные системы, бизнес-аналитика, прогнозирование временных рядов. На их примере вы узнаете, как извлекать признаки из разнородных данных, какие при этом возникают проблемы и как их решать. Вы научитесь сводить задачу заказчика к формальной постановке задачи машинного обучения и поймёте, как проверять качество построенной модели на исторических данных и в онлайн-эксперименте. На каждой задаче мы изучим плюсы и минусы пройденных алгоритмов машинного обучения. Прослушав этот курс, вы познакомитесь с распространенными типами прикладных задач и будете понимать схемы их решения....

Top reviews

By PK

May 24, 2018

Отличный вводный курс, как и вся специализация. Доступно и понятно изложены все базовые вещи, которые могут потребоваться в повседневной деятельности в качестве data scientist.

By AS

Mar 20, 2017

Наконец-то узнал основы анализа изображений и пощупал руками TensorFlow, прикольно, надеюсь дальше будет только интереснее.)

Filter by:

73 Reviews

By Alexander Prokofyev

Jan 20, 2019

It would be nice to have more practice with neuronets. Anyway it's very interesting course. Thanks!

By YaMolekula

Jan 08, 2019

Совет по курсу: слушать со скоростью 2х

Мое мнение по курсу:

1) Первая неделя интересная, про временные ряды маловато. Хотелось услышать про (G)ARCH и другие методы анализа временных рядо

2) Вторая неделя - мрак, все испортила

By Vadim Kirilchuk

Jan 04, 2019

Один из самых лёгких курсов программы. Понравилась обзорность курса, но вот полезность с точки зрения практики около нулевая. Первая неделя рассказала про прогнозирование временных рядов конкретными моделями, но не рассказано насколько эти модели приближены к реальности, даже с заработной платой оказалось, что прогноз далёк от реальности, не рассказано и про регрессию на основе каких-то базовых показателей типо ВВП, инфляции итд итп. Вторая неделя про компьютерная зрения раскрывает интересную тему, но задания оторваны от лекций, а сами лекции толком ничего не рассказывают, опять таки годится в качестве обзора, но не годится в качестве обучения. Третья неделя выделяется в положительную сторону. Четвертая неделя оставила двоякое впечатление, квиз на 3 задание которого все жалуются, и последнее задание, в котором из-за порядка данных решение не принимается. В последнем задании так же неясна практическая ценность. В общем, хотелось бы, чтобы над этим курсом ещё поработали, он выглядит очень сырым.

By Поздняков Юрий Олегович

Dec 29, 2018

Тесты очень напрягают. Хотелось бы иметь больше примеров задач и разборов решений с цифрами от а до я.

By Рядовиков Антон Васильевич

Nov 09, 2018

побольше бы ссылок на исследования врем рядов (я пока на 1й неделе)

By Любовь Соина

Aug 30, 2018

Очень уж галопом по Европам прошлись по нейросетям - отсюда ценность 2-й недели сомнительна. В остальном - хорошо.

By Somov Oleg

Jul 25, 2018

Самый легкий курс за всю специализацию, самое полезное на мой взгляд - анализ временных рядов

By Pile Ian

Jul 24, 2018

Задача на последней неделе изрядно попила крови - хотелось бы , чтобы формулировка была более четкой

By Павел Сорокин

Jul 23, 2018

В курсе много поверхностных вещей, хотя в целом он полезный

Анализ изображений - очень много болтовни и мало практики, но там хотя бы упражнение полезное и интересное

А вот анализ текстов мне совсем не понравился

Пример и задание поверхностные и не интересные. Вместо того чтобы углубиться в характерные для анализа текстов вещи - лемматизация, стемминг, учет биграмм, стоп-слова, word2vec и т.д., дали оценку обычных классификаторов над какими то признаками, которые, кстати, в этом модуле вообще не обсуждались. А те особенности которые обсуждались - не показаны. В данных примерах почти ничего нового!

За тест по ранжированию в первом модуле недели 4 тоже жирный дизлайк. Там одни и те же ответы переформулированные, при этом все в некотором смысле могут быть правильными. Проблема с этим тестом известна уже более 2х лет судя по форуму, почему бы не переделать?

By Самойлов Александр Сергеевич

Jul 05, 2018

Курс вызвал у меня неоднозначные впечатления. Очень понравилась неделя Евгения с временными рядами. В целом в курсе идет краткий обзор всевозможных практических задач, при этом очень мало разборов задач. Было неплохо по каждой теме рассмотреть детально какой-нибудь реальную задачу, со всеми подводными камнями. Конечно я понимаю, что детально разобрать глубокие нейронные сети в компьютерном зрении, с учетом того, что в специализации по-сути их и не было, нереально, но в рекомендательных системах можно было бы разобрать что-то реальное к kaggle или что-нибудь настоящее. Там нет ни одного примера, а в задании люди вешаются от сложности. Нельзя от людей требовать то, чему вы их не учите. pdf лекции и презентации (за исключением временных рядов) в этом курсе подготовлены слабее, чем в остальных курсах специализации.