Наука о больших данных описывает высокоуровневые аспекты процесса анализа данных.
Достоверность и качество данных: полнота и точность данных с точки зрения семантического содержания, а также качества синтаксиса данных (например, наличия пропущенных полей или неправильных значений).
Визуализация: способ представления данных для аналитика, принимающего решения на их основе. Как правило, визуализация следует за этапом анализа данных и является заключительным этапом процесса технического анализа данных.
Качество данных (синтаксис) [Data quality (syntax)]: синтаксическое качество данных (например, наличие пропущенных полей или неправильных значений).
Типы данных: характеристики данных, такие как структурированные или неструктурированные данные, изображения (например, пиксельные), текст (например, последовательности символов), последовательности генов, числовое значение.
Метаданные: характеристики качества и полноты используемых метаданных.
Курирование и управление: характеризует процесс, обеспечивающий высокое качество данных, и ответственное лицо.
Примечание - Форма представления варианта использования включает отдельное поле для описания проблем безопасности и защиты персональных данных.
Аналитика данных: характеристики, в обобщенном виде инструменты и алгоритмы, используемые при обработке данных на любой стадии, включая преобразование данных в информацию, информации - в знания, а знания - в мудрость.