Базовая информация по дисциплине

«Основы работы с Большими данными» 3 семестр

Информация об авторах

Гапаева Хава Алиевна – ассистент кафедры «Информационные системы в экономике»

Цели и задачи дисциплины

Цели дисциплины: подготовка студентов к аналитической и управленческой деятельности в сфере бизнес информатики, с акцентом на применение методов и инструментов для работы с большими
данными.

 Задачи дисциплины:

-ознакомление студентов с понятийным аппаратом и основными теоретическими положениями в области больших данных, включая структуры данных и методы хранения и обработки; изучение методов и инструментов для анализа больших данных, включая машинное обучение, искусственный интеллект, алгоритмы кластеризации и классификации; обсуждение вопросов конфиденциальности, безопасности данных и нормативных требований при работе с Большими данными.

Длительность изучения дисциплины: 17 недель

Трудоемкость дисциплины: 4 зачетные единицы

В результате освоения дисциплины студент должен:

Знать:

- принципы работы с большими объемами данных, методы их обработки и анализа; основные технологии и инструменты для работы с Большими данными, такие как Hadoop, Spark, и базы данных NoSQL; этические и правовые аспекты работы с данными, включая вопросы конфиденциальности и безопасности.

Уметь:

-применять инструменты для сбора, хранения и анализа больших объемов данных; использовать методы машинного обучения и искусственного интеллекта для анализа больших данных; применять технологии Больших данных в различных бизнес-задачах, таких как прогнозирование, оптимизация и персонализация.

Владеть:

- навыками работы с современными инструментами для анализа больших данных; умением использовать облачные технологии для обработки больших объемов данных; навыками подготовки аналитических отчетов и презентаций на основе анализа больших данных.

 

Структура дисциплины

Теоретический

материал

Количество модулей – 2

Количество тем/лекций в каждом модуле - 3;4.

Практический

материал

По данной дисциплине предусматривается выполнение лабораторных работ к двум модулям. Всего 7 лабораторных работ

Контрольно-измерительные материалы

В комплекте тестовых заданий имеется по 20 вопросов к каждому модулю, на ответы отводится 40 минут.

Программа дисциплины

Модуль

Темы/Лекции

Материалы для сопровождения дисциплины

Контрольно- измерительные материалы

Направления подготовки

Модуль 1

1.Введение в аналитику больших данных и основные концепции.

2. Работа с базами данных. Язык SQL.

3. Теория вероятностей и математической статистики.

1.Презентация

2.Лабораторные работы

Тест

БИН (бакалавриат)

 

 

Модуль 2

4. Визуализация. Построение дашбордов.

5. Введение в продуктовую аналитику.

6. Машинное обучение.

7. Финансовая математика в аналитике данных.

1.Презентация

2.Лабораторные работы

Тест

 

Учебно-методическое и информационное обеспечение дисциплины:

1.Меликов П.И. Изучаем основы Python. Практический курс для дата-аналитиков / Меликов П.И.. — Москва, Алматы : Ай Пи Ар Медиа, EDP Hub (Идипи Хаб), 2023. — 480 c. — URL: https://www.iprbookshop.ru/130920.html  —

2.Маркус Г. Искусственный интеллект: перезагрузка: как создать машинный разум, которому действительно можно доверять / Маркус Г., Дэвис Э.. — Москва : Альпина ПРО, 2022. — 300 c. — URL:https://www.iprbookshop.ru/122525.html

3.Двойнишников С.В. Методы обработки данных в научных исследованиях : учебное пособие / Двойнишников С.В.. — Новосибирск : Новосибирский государственный университет, 2022. — 76 c. — URL: https://www.iprbookshop.ru/128134.html

4.Андреева О.В. Основы алгоритмизации и программирования на языке Python : учебник / Андреева О.В., Ремизова О.И.. — Москва : Издательский Дом МИСиС, 2022. — 149 c. — URL: https://www.iprbookshop.ru/129510.html