Целое (тип данных)

Целое, целочисленный тип данных (англ. Integer), в информатике — один из простейших и самых распространённых типов данных в языках программирования. Служит для представления целых чисел.

Множество чисел этого типа представляет собой конечное подмножество бесконечного множества целых чисел, ограниченное максимальным и минимальным значениями.

В программировании различают беззнаковые целые числа и целые числа со знаком. Знак числа обычно кодируется старшим битом машинного слова. Традиционно, если старший бит равен 1, то число считается отрицательным, только, если оно не определено как беззнаковое.

Количество чисел в машинном изображении множества целых чисел зависит от длины машинного слова, обычно выражаемой в битах. Например, при длине машинного слова 1 байт (8 бит) диапазон представимых целых чисел со знаком от -128 до 127. В беззнаковом формате байтововое представление числа будет от 0 до 255 (2⁸ - 1). Если используется 32-разрядное машинное слово, то целое со знаком будет представлять значения от −2 147 483 648 (-2³¹) до 2 147 483 647 (2³¹−1); всего 1 0000 0000₁₆ (4 294 967 296₁₀) возможных значений.

Ограничение длины машинного слова, обусловленное конкретной аппаратной реализацией того или иного компьютера, не препятствие для обработки ими весьма длинных в битах представлений целых чисел, достигаемое усложнением программных алгоритмов. Естественное ограничение - конечность ёмкости памяти и разумное время на исполнение.

Целые числа и вычисления с целыми числами в современных компьютерах имеют очень важное значение (в подавляющем количестве приложений занимают меньше ресурсов процессора, чем, арифметика с плавающей точкой). Вся адресная арифметика и операции с индексами массивов основаны на целочисленных операциях.

Представление

В памяти типовой компьютерной системы целое число представлено в виде цепочки битов фиксированного (кратного 8) размера. Эта последовательность нулей и единиц — не что иное, как двоичная запись числа, поскольку обычно для представления чисел в современной компьютерной технике используется позиционный двоичный код. Диапазон целых чисел, как правило, определяется количеством байтов в памяти компьютера, отводимых под одну переменную.

Многие языки программирования предлагают выбор между короткими (англ. short), длинными (англ. long) и целыми стандартной длины. Длина стандартного целого типа, как правило, совпадает с размером машинного слова на целевой платформе. Для 16-разрядных операционных систем — этот тип (int) составляет 2 байта и совпадает с типом short int (можно использовать как short, опуская слово int), для 32-разрядных операционных систем он будет равен 4 байтам и совпадает с длинным целым long int (можно использовать как long, опуская слово int), и в этом случае будет составлять 4 байта. Короткое целое short int, для 16-разрядных операционных систем, 32-разрядных операционных систем, и для большинства 64-разрядных операционных систем составляет — 2 байта. Также в некоторых языках может использоваться тип данных двойное длинное long long, который составляет 8 байт.

Для 64-разрядных операционных систем учитывая разность моделей данных (LP64, LLP64, ILP64), представление целого типа на разных моделях данных может отличаться между собой. Тип int и long может составлять как 4, так и 8 байт.

Стоит отметить, что каждый язык программирования реализует свою сигнатуру представления целых чисел, которая может отличатся от международных стандартов, но обязана его/их поддерживать. К примеру можно отнести кросс-платформенную библиотеку Qt, где целое представляется типом qintX и quintX, где X-8,16,32,64.

Целые типы подразделяются на беззнаковые (англ. unsigned) и знаковые (англ. signed).

Беззнаковые целые

Беззнаковые целые представляют только неотрицательные числа, при этом все разряды кода используются для представления значения числа и максимальное число соответствует единичным значениям кода во всех разрядах: 111…111. m-байтовая переменная целого типа без знака, очевидно, принимает значения от 0 до +2^8m−1.

В C и C++ для обозначения беззнаковых типов используется префикс unsigned. В C# в качестве показателя беззнаковости используется префикс u (англ. unsigned). Например, для объявления беззнакового целого, равного по размеру одному машинному слову используется тип uint.

Беззнаковые целые, в частности, используются для адресации памяти, представления символов.

Иногда в литературе^[1] встречаются рекомендации не использовать тип беззнаковые целые, поскольку он может быть не реализован процессором компьютера, однако вряд ли этот совет следует считать актуальным — большинство современных процессоров (в том числе x86-совместимые^[2]) одинаково хорошо работают как со знаковыми, так и с беззнаковыми целыми.

В некоторых языках, например java, беззнаковые целые типы (за исключением символьного) отсутствуют.^[3]

Неправильное использование беззнаковых целых может приводить к неочевидным ошибкам из-за возникающего переполнения^[4]. В приведённом ниже примере использование беззнаковых целых в цикле в C и C++ превращает этот цикл в бесконечный:

char ar[N];
for (unsigned int i = N-1; i >= 0; --i){
      ar[i] = i; 
}

Целые со знаком

Существует несколько различных способов представления целых значений в двоичном коде в виде величины со знаком (англ.)русск.. В частности можно назвать прямой и обратный коды. Знак кодируется в старшем разряде числа: 0 соответствует положительным, а 1 отрицательным числам.

Могут быть использованы и более экзотические представления отрицательных чисел, такие, как, например, система счисления по основанию −2.^[5]

Однако для большинства современных процессоров обычным представлением чисел со знаком является дополнительный код. Максимальное положительное число представляется двоичным кодом 0111…111, максимальное по модулю отрицательное кодом 1000…000, а код 111…111 соответствует −1. Такое представление чисел соответствует наиболее простой реализации арифметических логических устройств процессора на логических вентилях и позволяет использовать один и тот же алгоритм сложения и вычитания как для беззнаковых чисел, так и для чисел со знаком (отличие — только в условиях, при которых считается, что наступило арифметическое переполнение).

m-байтовая переменная целого типа со знаком принимает значения от −2^8m-1 до +2^8m-1−1.

Предельные значения для разных битностей

Ниже представлена таблица предельных значений десятичных чисел для разных битностей при кодировании дополнительным кодом. В колонке «Максимальное десятичное» сначала идёт максимальное значение целого без знака, а под ним минимальное и максимальное целое со знаком.

Бит	Байт	Дв. слов	Максимальное десятичное	Дес. цифр
4	½	⅛	15 -8 +7	2 1 1
8	1	¼	255 -128 +127	3 3 3
16	2	½	65.535 -32.768 +32.767	5 5 5
24	3	¾	16.777.215 -8.388.608 +8.388.607	8 7 7
32	4	1	4.294.967.295 -2.147.483.648 +2.147.483.647	10 10 10
48	6	1½	281.474.976.710.655 -140.737.488.355.328 +140.737.488.355.327	15 15 15
64	8	2	18.446.744.073.709.551.615 -9.223.372.036.854.775.808 +9.223.372.036.854.775.807	20 19 19
96	12	3	79.228.162.514.264.337.593.543.950.335 -39.614.081.257.132.168.796.771.975.168 +39.614.081.257.132.168.796.771.975.167	29 29 29
128	16	4	340.282.366.920.938.463.463.374.607.431.768.211.455 -170.141.183.460.469.231.731.687.303.715.884.105.728 +170.141.183.460.469.231.731.687.303.715.884.105.727	39 39 39
256	32	8	115.792.089.237.316.195.(...).584.007.913.129.639.935 -57.896.044.618.658.097.(...).792.003.956.564.819.968 +57.896.044.618.658.097.(...).792.003.956.564.819.967	78 77 77
512	64	16	13.407.807.929.942.597.099.(...).946.433.649.006.084.095 -6.703.903.964.971.298.549.(...).973.216.824.503.042.048 +6.703.903.964.971.298.549.(...).973.216.824.503.042.047	155 154 154
1.024	128	32	179.769.313.486.231.590.(...).356.329.624.224.137.215 -89.884.656.743.115.795.(...).678.164.812.112.068.608 +89.884.656.743.115.795.(...).678.164.812.112.068.607	309 308 308
2.048	256	64	32.317.006.071.311.007.(...).853.611.059.596.230.655 -16.158.503.035.655.503.(...).926.805.529.798.115.328 +16.158.503.035.655.503.(...).926.805.529.798.115.327	617 617 617
4.096	512	128	1.044.388.881.413.152.506.(...).708.340.403.154.190.335 -522.194.440.706.576.253.(...).354.170.201.577.095.168 +522.194.440.706.576.253.(...).354.170.201.577.095.167	1.234 1.233 1.233
8.192	1.024	256	1.090.748.135.619.415.929.(...).505.665.475.715.792.895 -545.374.067.809.707.964.(...).252.832.737.857.896.448 +545.374.067.809.707.964.(...).252.832.737.857.896.447	2.467 2.466 2.466
16.384	2.048	512	1.189.731.495.357.231.765.(...).027.290.669.964.066.815 -594.865.747.678.615.882.(...).513.645.334.982.033.408 +594.865.747.678.615.882.(...).513.645.334.982.033.407	4.933 4.932 4.932
32.768	4.096	1.024	1.415.461.031.044.954.789.(...).668.104.633.712.377.855 -707.730.515.522.477.394.(...).334.052.316.856.188.928 +707.730.515.522.477.394.(...).334.052.316.856.188.927	9.865 9.864 9.864
65.536	8.192	2.048	2.003.529.930.406.846.464.(...).587.895.905.719.156.735 -1.001.764.965.203.423.232.(...).793.947.952.859.578.368 +1.001.764.965.203.423.232.(...).793.947.952.859.578.367	19.729 19.729 19.729
131.072	16.384	4.096	4.014.132.182.036.063.039.(...).812.318.570.934.173.695 -2.007.066.091.018.031.519.(...).906.159.285.467.086.848 +2.007.066.091.018.031.519.(...).906.159.285.467.086.847	39.457 39.457 39.457
262.144	32.768	8.192	16.113.257.174.857.604.736(...).605.349.934.298.300.415 -8.056.628.587.428.802.368.(...).302.674.967.149.150.208 +8.056.628.587.428.802.368.(...).302.674.967.149.150.207	78.914 78.913 78.913
524.288	65.536	16.384	259.637.056.783.100.077.(...).364.528.226.185.773.055 -129.818.528.391.550.038.(...).182.264.113.092.886.528 +129.818.528.391.550.038.(...).182.264.113.092.886.527	157.827 157.827 157.827
1.048.576	131.071	32.767	67.411.401.254.990.734.(...).119.068.940.335.579.135 -33.705.700.627.495.367.(...).559.534.470.167.789.568 +33.705.700.627.495.367.(...).559.534.470.167.789.567	315.653 315.653 315.653

Операции над целыми

Арифметические операции

К целочисленным значениям применимы в первую очередь арифметические операции. Ниже приведены самые часто используемые (в скобках указаны их обозначения в различных языках программирования и им аналогичным средствах).

Сравнение (англ. comparision). Здесь применимы соотношения «равно» («=»; «==»; «eq»), «не равно» («!=»; «<>»; «ne»), «больше» («>»; «gt»), «больше или равно» («>=»; «ge»), «меньше» («<»; «lt») и «меньше или равно» («<=»; «le»).
Инкремент (англ. increment; «++») и декремент (англ. decrement; «--») — арифметическое увеличение или уменьшение числа на единицу. Выделено в отдельные операции из-за частого использования с переменными-счётчиками в программировании.
Сложение (англ. addition; «+») и вычитание (англ. subtraction; «-»).
Умножение (англ. multiplication; «*»).
Деление (англ. division; «/»; «\») и получение остатка от деления (англ. modulo; «%»). Некоторые процессоры (например, архитектуры x86) позволяют производить обе эти операции за одну инструкцию.
Инверсия знака (англ. negation) и получение абсолютного значения (англ. absolute).
Получение знака. Результатом такой операции обычно является 1 для положительных значений, −1 — для отрицательных и 0 — для нуля.
Возведение в степень («^»).

В некоторых языках программирования для лаконичности есть операторы, которые позволяют производить арифметическую операцию с присвоением. Например, «+=» складывает текущее значение переменной слева с выражением справа и помещает результат в исходную переменную. Так же в некоторых языках и средах доступна совмещённая операция MulDiv, которая умножает на одно число, а потом делит результат на второе.

Обычно самыми дорогими по скорости операциями являются умножение и деление (получение остатка от деления).

В памяти компьютера для хранения целых чисел обычно отводится ячейки фиксированного объёма. Из-за этого операции увеличения и уменьшения значений могут приводить к переполнению, что оборачивается искажением результата. Некоторые языки программирования позволяют производит вызов исключения в таких случаях. Кроме этого можно определять поведение при переполнении:

Циклическая операция (обычно происходит по умолчанию). Например, если сделать инкремент 8-битного беззнакового значения 255, то получится 0.
Операция с насыщением. Если будет достигнут предел, то конечным значением будет это предельное. Например, если к 8-битному беззнаковому числу 250 прибавить 10, то получится 255. Сложение, вычитание и умножение с насыщением обычно применяется при работе с цветом.

Побитовые операции

Помимо математических, к целым числам применимы битовые операции, которые основаны на особенностях позиционного двоичного кодирования. Обычно они выполняются значительно быстрее арифметических операций и поэтому их используют как более оптимальные аналоги.

Битовый сдвиг влево с дополнением нулями аналогичен умножению числа на степень двойки (количество бит сдвига соответствует степени двойки).
Битовый сдвиг вправо аналогичен делению на степень двойки (количество бит сдвига соответствует степени двойки). Некоторые языки программирования и процессоры поддерживают арифметический сдвиг, который позволяет сохранять знак у целых со знаком (сохраняется значение старшего бита).
У целых со знаком знак можно узнать по старшему биту (у отрицательных он установлен).
Чтение и установка младшего бита позволяет управлять чётностью (у нечётных чисел он установлен).
Побитовое «И» над определённым количеством младших бит позволяет узнать остаток от деления на степень двойки (степень соответствует количеству бит).
Побитовое «ИЛИ» над определённым количеством младших бит и последующий инкремент округляет число на значение, равное степени двойки (степень соответствует количеству бит) — используется для выравнивания адресов и размеров на определённое значение.

Работа со строками

Довольно частыми операциями являются получение строки из числового значения во внутреннем представлении и обратно — число из строки. При преобразовании в строку обычно доступны средства задания форматирования в зависимости от языка пользователя.

Ниже перечислены некоторые из представлений чисел строкой.

Десятичное число (англ. decimal). При получении строки обычно можно задать разделители разрядов, количество знаков (добавляются лидирующие нули если их меньше) и обязательное указание знака числа.
Число в системе счисления, которое является степенью двойки. Самые частые: двоичное (binary англ. binary), восьмиричное (англ. octal) и шестнадцатиричное (англ. hexadecimal). При получении строки обычно можно задать разделители групп цифр и минимальное количество цифр (производится дополнение нулями, если их меньше). Так как эти представления чаще всего используются в программировании, то здесь обычно доступны соответствующие опции. Например, указание префикса и постфикса для получения значения в соответствии с синтаксисом языка. Для 16-ричных актуально указание регистра символов, а также обязательное добавление нуля, если первая цифра представлена буквой (чтобы число не определялось как строковый идентификатор).
Римское число (англ. roman).
Словесное представление (в том числе сумма прописью) — число представляется словами на указанном натуральном языке.

Перечислимый тип

К целым относится также перечислимый тип. Переменные перечислимого типа принимают конечный заранее заданный набор значений. Размер набора не определяется числом байтов, используемых для представления целочисленных значений переменных такого типа.

Например, в языке Python логический тип является подтипом целого и использует имена False и True, которые при приведении к целому получают значения 0 и 1 соответственно^[6].

См. также

Примечания

↑ Бен-Ари, 2000, с. 54
Урок 7. Расширенные арифметические операции с целыми числами, Низкоуровневое программирование, СУНЦ НГУ

Types, Values and Variables, Java Languaege Specification, 2-nd ed.

«Нужны ли беззнаковые целые?» (22 января 2013)

↑ Hacker's Delight, 2004, с. 215-221

↑ Beazley, 2009, pp. 38

Литература

Основные определения цифровой и микропроцессорной техники, Система дистанционного обучения СПбГУ ИТМО, Програмное обеспечение измерительных систем на базе универсальных компьютеров

М. Бен-Ари. Глава 4. Элементарные типы данных // Языки программирования. Практический сравнительный анализ = Understanding Programming Language. — Москва: Мир, 2000. — С. 53-74. — 366 с. — ISBN 5-03-003314-9.

Теренс Пратт, Марвин Зелковиц. 5.2. Скалярные типы данных // Языки программирования. Разработка и реализация = Programming Language. Design and Implementation. — 4-th edition. — Питер, 2002. — С. 205-216. — 688 с. — ISBN 5-03-003314-9.

Генри Уоррен мл. Алгоритмические трюки для программистов = Hacker's Delight. — Вильямс, 2004. — 288 с. — ISBN 5-8459-0572-9.

Behrooz Parhami. Computer Arithmetic: Algorithms and Hardware Designs. — New York: Oxford University Press, 2000. — 510 p. — ISBN 0-19-512583-5.

David M. Beazley. Python Essential Reference. — 4th Edition. — Addison-Wesley Professional, 2009. — 717 с. — ISBN 978-0672329784.

Типы данных

Неинтерпретируемые

Бит • Ниббл • Байт • Кубит • Трит • Трайт • Слово

Числовые

Целый • С фиксированной запятой • С плавающей запятой • Рациональный • Комплексный • Длинный • Интервальный

Текстовые

Символьный • Строковый

Ссылочные

Адрес • Ссылка • Ссылка в С++ • Указатель • Обёртка

Композитные

Алгебраический тип данных (обобщённый) • Массив • Ассоциативный массив • Класс • Список • Кортеж • Объект • Структура • Множество • Объединение (меченое)

Другие

Логический • Низший • Высший • Перечисляемый • Коллекция • Исключение • Функциональный • Род (Метакласс) • Монада • Семафор • Поток • Void

Связанные темы

Абстрактный тип данных • Примитивный тип • Структура данных • Дженерик • Переменная типа • Интерфейс • Конструктор данных • Конструктор типов • Приведение типа • Система типов

Light-industry-up.ru

Экосистема промышленности

Публикации