Действующий

Об утверждении профессионального стандарта "Специалист по большим данным"

     3.1.4. Трудовая функция

Наименование

Проведение аналитического исследования с применением технологий больших данных в соответствии с требованиями заказчика

Код

A/04.6

Уровень (подуровень) квалификации

6

Происхождение трудовой функции

Оригинал

X

Заимствовано из оригинала

Код оригинала

Регистрационный номер профессионального стандарта

Трудовые действия

Выбор методов и инструментальных средств анализа больших данных для проведения аналитических работ

Разработка, поверка, оценка используемых моделей больших данных

Адаптация и развертывание моделей больших данных в предметной среде

Выбор средств представления результатов аналитики больших данных

Подготовка отчета по результатам аналитических работ с использованием технологий больших данных

Консультирование заказчика по результатам аналитических работ с применением технологий больших данных

Мониторинг эффективности работы аналитики больших данных

Формирование предложений по использованию результатов анализа больших данных: рассылка, создание приложений, оптимизация процессов

Формирование предложений по развитию существующей методологической и технологической инфраструктуры анализа больших данных на основе выполненных работ

Необходимые умения

Планировать аналитические работы с использованием технологий больших данных

Проводить аналитические работы с использованием технологий больших данных, как индивидуально, так и, осуществляя руководство малыми аналитическими группами

Использовать имеющуюся у исполнителя методологическую и технологическую инфраструктуру анализа больших данных для выполнения аналитических работ

Проводить сравнительный анализ методов и инструментальных средств анализа больших данных

Разрабатывать и оценивать модели больших данных

Программировать на языках высокого уровня, ориентированных на работу с большими данными: для статистической обработки данных и работы с графикой, для работы с разрозненными фрагментами данных в больших массивах, для работы с базами структурированных и неструктурированных данных

Адаптировать и развертывать модели в предметной среде

Решать задачи классификации, кластеризации, регрессии, прогнозирования, снижения размерности и ранжирования данных

Решать проблемы переобучения и недообучения алгоритма

Формировать предложения по использованию результатов анализа

Оформлять результаты аналитического исследования для представления заказчику

Разъяснять заказчику результаты аналитической работы

Осуществлять поиск информации о новых и перспективных методах анализа больших данных, выполнять сравнительный анализ методов

Необходимые знания

Содержание и последовательность выполнения этапов аналитического проекта

Основы управления аналитическими работами

Основы управления малыми аналитическими группами

Возможности имеющейся у исполнителя методологической и технологической инфраструктуры анализа больших данных

Предметная область анализа

Теория принятия решений

Математическое моделирование

Теоретические и прикладные основы анализа больших данных

Современный опыт использования анализа больших данных

Технологии анализа данных: статистический анализ, семантический анализ, анализ изображений, машинное обучение, методы сравнения средних, частотный анализ, анализ соответствий, кластерный анализ, дискриминантный анализ, факторный анализ, деревья классификации, многомерное шкалирование, моделирование структурными уравнениями, методы анализа выживаемости, временные ряды, планирование экспериментов, карты контроля качества

Нейронные сети: полносвязные, свёрточные и рекуррентные нейронные сети, методы обучения нейронных сетей, нейросетевые методы понижения размерности

Статистические модели

Статистический анализ: метод многовариантного тестирования, корреляционный анализ, регрессионный анализ

Статистические методы: параметрические, непараметрические, управляемые, неуправляемые, полууправляемые, кластеризация

Семантический анализ: обработка естественного языка, сентиментный анализ, анализ текста

Алгоритмы машинного обучения: обучение с учителем, обучение без учителя, полууправляемое обучение, обучение с подкреплением

Машинное обучение: классификация, кластеризация, обнаружение выбросов, фильтрация

Методы и модели классификации: логистическая регрессия, деревья решений, предредукция, постредукция, модели, основанные на правилах, вероятностные классификаторы, усиление энтропии информации

Фильтрация шумовых выбросов, виды шумовых выбросов: глобальный, контекстуальный, коллективный

Анализ изображений, анализ сетей, анализ пространственных данных, анализ временных рядов

Методы идентификации шаблонов

Методы оценки моделей: оценка качества построенной модели по тестовой выборке и анализ обобщающих способностей алгоритма

Распределенный анализ данных

Анализ данных в реальном времени

Правила деловой переписки

Методы разработки отчетной аналитической документации

Другие характеристики

-