Этот курс и более
11 500 других учебников
и курсов будут доступны
при покупке личной
подписки
БАЗОВЫЕ МЕТОДЫ АНАЛИЗА ДАННЫХ
Используют:
173
учебных заведения
160
преподавателей
351
студент
Избранное
3 зачетных единицы
108 академ/часов
6 часов в неделю
Доступно к покупке
Оплаченный доступ к контенту предоставляется только на платформе, а также онлайн и офлайн в мобильном приложении
Оплаченный доступ к контенту
предоставляется только на платформе, а
также онлайн и офлайн в мобильном
приложении
предоставляется только на платформе, а
также онлайн и офлайн в мобильном
приложении
Скачивание контента в
PDF недоступно
PDF недоступно
Скачивание контента в PDF недоступно
Документы о прохождении курсов не выдаются. Преподаватели могут повысить квалификацию:
Документы о прохождении курсов не выдаются. Преподаватели могут повысить квалификацию:
- О курсе
- Авторы
- Программа курса
- Методика
О курсе
Анализ данных предмет, порожденный компьютерной революцией, приведшей к накоплению огромного количества данных о всевозможных совокупностях объектов, таких как страны и регионы, веб-сайты и теннисные турниры, работодатели и работники, товары и их производители. В отличие от классической математической статистики, анализ данных не пытается непосредственно вывести свойства окружающего мира, исходя из специально собранных данных, а ориентирован на отыскание каких-либо паттернов, структур, закономерностей в тех данных, какие есть. Основная цель анализа данных — обогащение теоретических представлений в той области науки или практики, к которой относятся данные (извлечение и порождение знаний). Исходя из того, что теоретическое знание выражается, прежде всего, через понятия и утверждения об их связи, а понятия выражаются признаками, основное внимание уделяется двум базовым задачам анализа данных. Это суммаризация (агрегирование или порождение признаков) и коррелирование (исследование связей между признаками). Изложение содержит большое количество примеров применения рассматриваемых понятий к анализу реальных данных. Учебник предназначен, прежде всего, для использования в обучении студентов бакалавриата и магистратуры инженерно-технических специальностей, однако он может использоваться и как пособие для самостоятельного изучения.
Базовый учебник
Серия
Высшее образование
Тематика/подтематика
Компьютерные и информационные науки / Искусственный интеллект и машинное обучение. Анализ данныхДисциплины
Рекламное дело ,
Анализ данных ,
Основные методы анализа данных ,
Введение в анализ данных и исследование операций ,
Введение в анализ данных исследование операций ,
Анализ данных на ПК ,
Методы анализа данных ,
Методы и алгоритмы анализа данных ,
Теория измерений и анализ данных ,
Введение в анализ данных ,
Технологии анализа данных ,
Технология анализа данных ,
Основы анализа данных ,
Базовые методы анализа данных и работа со статистическими пакетами ,
Введение в анализ данных и машинное обучение ,
Введение в искусственный интеллект и анализ больших данных
Направления подготовки/Специальности/Профессии
Авторы
Лекции
Миркин Борис Григорьевич
доктор технических наук, доцент, старший научный сотрудник
Программа курса
Свернуть все темы
Развернуть все темы
Тема 1. Что такое анализ данных
Время прохождения 632 минуты
- 1.1. Понятие о таблице данных (64мин.)
- 1.2. Преобразование файла данных в таблицу данных (128мин.)
- 1.3. Иллюстративные проблемы анализа данных (213мин.)
- 1.4. Комментарии к истории науки о данных (107мин.)
- Кстати говоря (107мин.)
- Тест: Что такое анализ данных (14мин.)
Свернуть
Развернуть тему
Тема 2. Одномерный анализ
Время прохождения 975 минут
- 2.1. Две математические модели для понятия "признак" (43мин.)
- 2.2. Понятие гистограммы для количественного признака (64мин.)
- Ф2.3. Гистограмма и плотность распределения (43мин.)
- В2.4. Вычисление гистограммы (21мин.)
- 2.5. Дальнейшая суммаризация: центр и рассеяние (85мин.)
- Ф2.6. Центр и рассеяние: формулировки (149мин.)
- В2.7. Центр и рассеяние: вычисления (21мин.)
- 2.8. Бинарные и категоризованные признаки (171мин.)
- 2.9. Более продвинутые понятия (277мин.)
- Кстати говоря (43мин.)
- Тест: Одномерный анализ (58мин.)
Свернуть
Развернуть тему
Тема 3. Двумерный анализ: суммаризация и корреляция двух признаков
Время прохождения 1555 минут
- 3.1. Введение (21мин.)
- 3.2. Два количественных признака: линейная регрессия и вокруг (256мин.)
- Ф3.3. Линейная регрессия: Формулировки (448мин.)
-
- Ф3.3.1. Аппроксимационная перспектива: Линейная регрессия и коэффициент корреляции (43мин.)
- Ф3.2.2. Вероятностная перспектива: двумерное Гауссово распределение и линейная регрессия (43мин.)
- Ф3.3.3. Ложная корреляция: влияние выбросов и неоднородности (85мин.)
- Ф3.3.4. Метод линеаризации для оценки нелинейной регрессии (21мин.)
- Проект 3.1. Линейная регрессия и бутстрэп (128мин.)
- Проект 3.2. Нелинейная и линеаризованная регрессии: инспирированный природой алгоритм (128мин.)
- 3.4. Случай смешанных шкал: номинальный и количественный признаки (298мин.)
- 3.5. Случай двух номинальных признаков: таблица сопряженности (469мин.)
- Кстати говоря (43мин.)
- Тест: Двумерный анализ: суммаризация и корреляция двух признаков (20мин.)
Свернуть
Развернуть тему
Тема 4. Корреляция в многомерных данных
Время прохождения 767 минут
- 4.1. Введение: трудности коррелирования данных (107мин.)
- 4.2. Бейесовский подход к распознаванию (171мин.)
- 4.3 Меры качества классификатора (107мин.)
- 4.4. Нейронные сети для представления отображения "вход-выход" (298мин.)
- Кстати говоря (43мин.)
- Тест: Корреляция в многомерных данных (42мин.)
Свернуть
Развернуть тему
Тема 5. Суммаризация данных
Время прохождения 1467 минут
- 5.1. Метод главных компонент (512мин.)
- 5.2. Модель и метод K-средних для кластерного анализа (405мин.)
- 5.3. Пифагорово разложение и аномальные кластеры (469мин.)
-
- 5.3.1. Пифагорово разложение разброса данных и дополнительный критерий (43мин.)
- 5.3.2. Общность моделей МГК и метода K-средних (43мин.)
- 5.3.3. Аномальные кластеры (107мин.)
- 5.3.4. Интеллектуальная версия метода K-средних (107мин.)
- Проект 5.1. Действительно ли метод главных компонент очищает структуру данных? (64мин.)
- 5.3.5. Правила интерпретации кластеров через их центры (107мин.)
- Кстати говоря (43мин.)
- Тест: Суммаризация данных (18мин.)
Свернуть
Развернуть тему
Заключение: место анализа данных
Время прохождения 320 минут
- Необходимость объяснения паттернов для принятия решений (107мин.)
- Анализ данных и смежные подходы (213мин.)
Свернуть
Развернуть тему
Приложение 1. Основы вычислительной среды MATLAB и ее аналогов
Время прохождения 149 минут
Свернуть
Развернуть тему
Приложение 3. Две случайные выборки для экспериментов
Время прохождения 107 минут
Свернуть
Развернуть тему
Методика
Материалы курса
Лекции304
Тесты5
Поделиться курсом
Подписка от 475 ₽/мес.
Курсы по теме:
Используют:
0
учебных заведений
0
преподавателей
0
студентов
Научная школа:
МИРЭА — Российский технологический университет (г. Москва)
Используют:
172
учебных заведения
111
преподавателей
307
студентов
Попробуйте личную
подписку от 475 ₽/мес
Полный доступ к порталу Юрайт со всеми учебниками, курсами и сервисами на 1, 6 и 12 месяцев
Образовательная платформа Юрайт - это цифровой контент, сервисы, данные для университетов и колледжей.
Ссылки
ООО «Электронное издательство Юрайт»
Свидетельство о регистрации СМИ 2020
Свидетельство о регистрации СМИ 2020
Ваш IP-адрес: 216.73.216.147
Репутация и технологическое лидерство в цифровом образовании
Приглашаем на XVIII Зимнюю школу преподавателя 26-30 января 2026 г. Скидка до 1 декабря на платные форматы: получите УПК на 72 и 108 ч.!
Начать экзамен
У вас на прохождение экзамена:
Остановить или пройти экзамен повторно невозможно.
Начать экзамен
У вас осталось на прохождение экзамена:
Остановить или пройти экзамен повторно невозможно.
Создание новой папки
Выбранная книга издается в нескольких томах (частях), рекомендуем добавить в корзину следующие книги:
| Название | Цена | Заказать |
