Для поддержки единого информационного пространства, производительности и точности принятия решений исходные данные должны быть представлены в унифицированном виде. Основные методы трансформации данных:
- преобразование упорядоченных данных - оптимизация представления данных с целью обеспечения дальнейшего анализа (прогнозирование временного ряда, группировка по временному периоду);
- квантование - разбиение диапазона возможных значений числового признака на заданное количество интервалов и присвоение номера интервала попавшим в них значениям;
- сортировка - изменение порядка следования записей исходной выборки данных в соответствии с определенным алгоритмом;
- слияние - объединение нескольких выборок данных по одноименным полям. Операция слияния используется для обогащения данных: если выборка содержит недостаточно данных для анализа, то ее можно дополнить недостающей информацией из другой выборки;
- группировка и разгруппировка - обобщение информации за счет объединения ее в минимально необходимое количество полей и значений;
- настройка набора данных - изменение имен, типов, меток и назначения полей исходной выборки данных;
- табличная подстановка значений - изменение значений в исходной выборке данных на основе таблицы подстановки;
- вычисляемые значения - выполнение расчетов на основе исходных данных для получения необходимых значений.