• A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site
Contacts

119049, Moscow, Pokrovsky boulevard, 11, office Т-523

Phone: +7 (495) 772-95-90 *27379

E-mail: nberzon@hse.ru

Administrations
Department Academic Supervisor Nikolay I. Berzon
Department Head Anna Kuznetsova
Deputy Head Andrey I. Stolyarov
Article
Efficiency evaluation of electricity distribution companies: Integrating data envelopment analysis and machine learning for a holistic analysis

Omrani H., Emrouznejad A., Teplova T. et al.

Engineering Applications of Artificial Intelligence. 2024. Vol. 133. No. F.

Book chapter
Digital Learning as an Innovation in Higher Education and a Mechanism for Increasing Its Attractiveness to Young People

Osipov V. S., Vagin S., Frantsuzenko Polina S. et al.

In bk.: Digital Education in Russia and Central Asia. Singapore: Springer, 2022. P. 267-278.

Data Analysis and Crypto Asset Market Modeling

2023/2024
Academic Year
RUS
Instruction in Russian
6
ECTS credits
Type:
Elective course
When:
1 year, 1, 2 module

Instructors

Программа дисциплины

Аннотация

Курс «Анализ данных и моделирование на рынке криптоактивов» рассчитан на студентов, заинтересованных в применении продвинутых методов искусственного интеллекта в приложении к рынку криптоиндустрии и имеющих навыки программирования (Питон начального уровня). Курс практикоориентированный, нацелен на раскрытие особенностей функционирования и регулирования рынков криптовалют, криптоактивов (5 сегментов NFT), децентрализованных финансов, поиска информации по ним, обработки данных и применения современных методов выявления зависимостей, а также прогнозирования. С помощью языка программирования Питон студенты освоят на практических примерах применение методов машинного обучения, эконометрических и статистических моделей, нейронных сетей для данных высоковолатильных и подверженных внешним шокам сегментов рынка крипты. Из 60 аудиторных часов 56 часов составят семинарские занятия в компьютерном классе с разбором примеров и обсуждением результатов. Запись на курс предполагает входное тестирование или наличие ранее изученного курса Питон.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целью учебной дисциплины «Анализ данных и моделирование на рынке криптоактивов» является ознакомление магистров с методами оценки биржевых характеристик криптовалют с помощью моделей машинного обучения, а также эконометрических и статистических подходов. В курсе затрагиваются такие продвинутые темы анализа данных и машинного обучения, как майнинг текстовых данных, их обработка, а также использование моделей глубокого обучения в рамках задачи построения индекса сентимента. Помимо инструментальной базы, студенты изучат теоретические основы рынка криптоактивов, его характеристики, а также основные особенности и отличия от классических финансовых рынков.
  • 1. Получить знания о продвинутых методах искусственного интеллекта и их применение в рынке криптоактивов.
  • 2. Разработать практические навыки в анализе и моделировании рынков криптовалют, криптоактивов (включая сегменты NFT) и децентрализованных финансов.
  • 3. Освоить методы обработки и анализа данных, выявления зависимостей и прогнозирования на рынке криптоактивов.
  • 4. Получить знания о функционировании и регулировании рынков децентрализованных финансов.
  • 5. Улучшить навыки работы с языком программирования Python для применения методов машинного обучения, эконометрических и статистических моделей, а также нейронных сетей на данных высоковолатильных и подверженных внешним шокам сегментов рынка криптоактивов.
  • 6. Активное участие в семинарских занятиях, разборе примеров и обсуждении результатов, что способствует практическому применению полученных знаний.
Планируемые результаты обучения

Планируемые результаты обучения

  • Использует полученные знания для анализа и оценки применимости технологии блокчейн и криптовалютных платформ для решения различных задач; использовать криптовалюты в качестве финансового инструмента; проводить аудит криптовалютных проектов;
  • Понимание основных понятий и технологий, связанных с криптовалютами и цифровыми активами, а также основных протоколов Defi и их принципов работы.
  • Умение оценивать риски и возможности, связанные с инвестированием в криптовалюты и цифровые активы, и принимать обоснованные решения на основе анализа этих рисков и возможностей.
  • Понимаение возможных перспектив и путей развития криптовалют и цифровых активов, а также их возможного влияния на финансовую систему в целом.
  • Осознание значимости изучения ML методов при прогнозировании цен на криптовалюты и цифровые активы, а также подготовка к работе в цифровой экономике и конкуренции в изменяющейся рыночной среде.
  • Знание основных эконометрических методов и моделей для анализа рынка криптовалют.
  • Умение проводить анализ взаимосвязей между криптовалютами и другими финансовыми инструментами, используя эконометрические модели.
  • Понимание неустойчивости криптоактивов и проблем с выборкой данных, а также необходимости учета нелинейных зависимостей и структурных изменений.
  • Умение обнаруживать и учитывать проблемы мультиколлинеарности и эндогенности переменных при использовании эконометрических моделей для прогнозирования цен на криптовалюты.
  • Понимание ограничений в использовании эконометрических моделей для прогнозирования криптоактивов и их важности в контексте более широкого экономического и финансового анализа.
  • Студенты приобретут знания о фунциях и инструментах библиотек Pandas, Numpy, Matplotlib и дополнительных инструментах, необходимых для работы с данными.
  • Смогут использовать Pandas для обработки и анализа данных, научатся осуществлять различные преобразования данных, а также графически отображать полученные результаты .
  • Студенты овладеют основами использования библиотек Request и Beautiful Soup для извлечения информации и научатся использовать алгоритмы поиска для получения нужных данных.
  • Cтуденты научатся запускать парсер текстовых и количественных данных и формировать первичный текстовый корпус и сводные таблицы количественных данных.
  • Анализировать особенности датасетов и способности определять лучшие нейросетевые модели для обработки входных данных.
  • Применять различные подходы к оптимизации архитектуры нейронных сетей и настройке набора гиперпараметров.
  • Применять методы бинарной и мультиклассовой классификации количественных данных.
  • Уметь предварительно обрабатывать текстовые данные, включая фильтрацию, очистку, лемматизацию и стемминг.
  • Уметь классифицировать текстовые данные с использованием моделей машинного обучения с учителем.
  • Владть навыками использования предобученных классификаторов Bert и FinBert в решении задач разметки текстовых данных.
  • Владеть навыками построения нейронных сетей для классификации текстовых массивов на основе использования Word Embedding.
  • Уметь оценивать качество моделей на основе измерения точности классификации сбалансированных и несбалансированных тренировочных датасетов.
  • Применять различные методы и подходы к анализу количественных и текстовых данных в области криптовалют.
  • Владеть навыками воспроизведения машинного и глубокого обучения для прогнозирования и классификации характеристик криптовалют.
  • Владеть навыками эконометрического анализа и интерпретации результатов для объяснения характеристик криптовалют.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Входной тест на проверку навыков программирования на Python.
  • Введение в нейросети. Подходы к оптимизации гиперпараметров модели.
  • Практические аспекты обработки текстовых данных. Решение задач NLP и формирования текстовых корпусов для их последующей классификации.
  • Реализация индивидуальных проектов по анализу криптовалют.
  • Криптовалюты, цифровые активы и Defi-протоколы как специфический объект исследования.
  • Эконометрические методы исследования рынка криптовалют. Недостатки эконометрического подхода в анализе криптоактивов.
  • Использование библиотек Pandas, Numpy, Matplotlib для проведения исследования рынка криптовалют. Основы работы с API поставщиков данных и криптовалютных бирж.
  • Алгоритмы построения базовых моделей машинного обучения (градиентный спуск, решающие деревья) для их проверки и оценки на устойчивость в процессе тестирования гипотез исследования.
Элементы контроля

Элементы контроля

  • неблокирующий Домашняя работа 1
  • неблокирующий Домашнее задание 2
  • неблокирующий Защита индивидуального проекта
  • неблокирующий Входное тестирование на знание языка Python
  • неблокирующий Домашнее задание 3
Промежуточная аттестация

Промежуточная аттестация

  • 2023/2024 учебный год 2 модуль
    0.15 * Входное тестирование на знание языка Python + 0.15 * Домашнее задание 2 + 0.15 * Домашнее задание 3 + 0.15 * Домашняя работа 1 + 0.4 * Защита индивидуального проекта
Список литературы

Список литературы

Рекомендуемая основная литература

  • Algorithms, blockchain & cryptocurrency : implications for the future of the workplace, Brown, G., 2020
  • An introduction to applied econometrics : a time series approach, Patterson, K., 2000
  • Analysis of financial time series, Tsay, R. S., 2005
  • Introduction to natural language processing, Eisenstein, J., 2019
  • Machine learning : beginner's guide to machine learning, data mining, big data, artificial intelligence and neural networks, Trinity, L., 2019
  • Neural networks, Abdi, H., 1999
  • Principles of artificial neural networks, Graupe, D., 2007
  • Временные ряды. Обработка данных и теория, Бриллинджер, Д., 1980
  • Изучаем pandas : высокопроизводительная обработка и анализ данных в Python, Хейдт, М., 2018
  • Изучаем программирование на Python, Бэрри, П., 2017
  • Многомерный статистический анализ и временные ряды, Кендалл, М., 1976
  • Основы Data Science и Big data : Python и наука о данных, Силен, Д., 2017
  • Основы Python : научитесь думать как программист, Дауни, А. Б., 2021

Рекомендуемая дополнительная литература

  • Inclusive fintech : blockchain, cryptocurrency and ICO, Lee, D., 2018