В настоящем стандарте применены следующие термины с соответствующими определениями:
2.1
большие данные (big data): Большие массивы данных, отличающиеся главным образом такими характеристиками, как объем, разнообразие, скорость обработки и/или вариативность, которые требуют использования технологии масштабирования для эффективного хранения, обработки, управления и анализа. Примечание - Термин "большие данные" широко применяется в различных значениях, например в качестве наименования технологии масштабирования, используемой для обработки больших массивов данных. [ГОСТ Р ИСО/МЭК 20546-2021, статья 3.1.2] |
2.2 |
данные (data): Представление информации в формальном виде, пригодном для передачи, интерпретации или обработки. Примечание - Данные могут быть обработаны автоматически или вручную. [ГОСТ Р ИСО/МЭК 20546-2021, статья 3.1.5] |
2.3 |
изменчивость данных (data volatility): Характеристика данных, относящаяся к скорости их изменения с течением времени. [ГОСТ Р ИСО/МЭК 20546-2021, статья 3.1.17] |
2.4 |
массив данных (data set, dataset): Идентифицируемая совокупность данных, к которой можно получить доступ или скачать в одном или нескольких форматах. [ГОСТ Р ИСО/МЭК 20546-2021, статья 3.1.11] |
2.5 |
обработка данных (data processing): Систематическое выполнение операций с данными. Примечания 1 Арифметические или логические операции с данными, объединение или сортировка данных или такие операции с текстом, как редактирование, сортировка, объединение, хранение, извлечение, отображение или печать. 2 Термин "обработка данных" не должен использоваться в качестве синонима для термина "обработка информации". [ГОСТ Р ИСО/МЭК 20546-2021, статья 3.1.9] |
2.6 |
тип данных (data type, datatype): Совокупность объектов данных установленной структуры и набора допустимых операций над этими объектами. Примечания 1 Целочисленный тип данных имеет простую структуру, каждый экземпляр которой, обычно называемый значением, представляет собой одно из целых чисел из заданного диапазона, а допустимые действия включают в себя обычные арифметические операции над этими целыми числами. 2 Если толкование не вызывает сомнений, то вместо термина "тип данных" может быть использован термин "тип". 3 Тип данных: определение и термины, стандартизованные ИСО/МЭК [ИСО/МЭК 2382-15:1999]. [ГОСТ Р ИСО/МЭК 20546-2021, статья 3.1.12] |
2.7 |
файл (file): Поименованная совокупность записей, рассматриваемая как единое целое. [ГОСТ Р ИСО/МЭК 20546-2021, статья 3.1.21] |
2.8 сохранность больших данных (big data preservation): Комплекс мероприятий, стратегий и политик, разработанный сервис-провайдером больших данных, для обеспечения доступности и использования ценной информации в экосистеме больших данных.
Примечание - Экосистема больших данных определяет необходимые действия для ролей, предоставляющих или использующих сервисы больших данных, а также взаимоотношения между ними (см. [1]).
2.9 сохранность данных (data preservation): Политики и мероприятия по обеспечению постоянного доступа к данным.
2.10 политика сохранности данных (data preservation policy): Набор правил для контроля мероприятий по сохранности данных.