Измерение информации

Измерение информации

Измерение информации
Как и любую другую физическую величину, информацию можно измерить. Существуют разные подходы к измерению информации. Один из таких подходов рассматривается в курсе информатики за 7 класс.

При измерении информации следует учитывать как объем передаваемого сообщения, так и его смысловую нагрузку. В связи с этим в информатике существуют разные подходы к измерению информации.

Способы оценки величины информации могут учитывать или не учитывать смысла информационного сообщения.

Один из способов нахождения количества информации основан на определении веса каждого символа в тексте сообщения. При таком подходе объем сообщения зависит от количества знаков в тексте, чем больше тест, тем больше весит информационное сообщение.

При этом абсолютно не важно, что написано, какой смысл несет сообщение. Так как определение объема информации привязано к текстовым единицам: буквам, цифрам, знакам препинания, то такой подход к измерению информации получил название алфавитного.

Вес отдельного знака зависит от их количества в алфавите. Число символов алфавита называют мощностью (N). Например, мощность алфавита английского языка по числу символов равно 26, русского языка 33.

Но на самом деле, при написании текста используются и прописные и строчные буквы, а также знаки препинания, пробелы и специальные невидимые символы, обозначающие конец абзаца и перевод к новой строке.

Поэтому имеют дело с мощностью 128 или в расширенной версии 256 символов.

Рис. 1. Таблица символов – латиница.

Для двоичного алфавита, состоящего из двух символов – нуля и единицы, мощность алфавита будет составлять 2. Вес символа бинарного алфавита выбран в качестве минимальной единицы информации и называется «бит». Происхождение термина «бит» исходит от англоязычного слова «binary», что означает двоичный.

Восемь бит образуют байт.

Название «байт» было придумано в 1956 году В. Бухгольцем при проектировании первого суперкомпьютера. Слово «byte» было получено путем замены второй буквы в созвучном слове «bite», чтобы избежать путаницы с уже имеющимся термином «bit».

Рис. 2. Портрет Вернера Бухгольца.

На практике величина объема информации выражает в более крупных единицах: килобайтах, терабайтах, мегабайтах.

Следует запомнить, что килобайт равен 1024 байта, а не 1000. Как, например, 1 километр равен 1000 метрам. Эта разница получается за счет того, 1 байт равен 8 битам, а не 10.

Для того, чтобы легче запомнить единицы измерения, следует воспользоваться таблицей степени двойки.

Таблица степеней двойки

Показатель степениЗначение
12
24
38
416
532
664
7128
8256
9512
101024
201048576

Рис. 3. Единицы измерения информации.

То есть, 23 = 8 – это 1 байт, состоящий из 8 бит, 210 = 1024 это 1 килобайт, 220 = 1048576 представляет собой 1 мегабайт, 230 = 1 гигабайт, 240 = 1 терабайт.

Вес символа (i) и мощность алфавита (N) связаны между собой соотношением: 2i = N.

Так, алфавит мощностью в 256 символов имеет вес каждого символа в 8 бит, то есть один байт. Это означает, что на каждую букву приходится по байту. В таком случае, нетрудно определить, сколько весит весь кодируемый текст сообщения.

Для этого достаточно вес символа алфавита умножить на количество символов в тексте.

При подсчете количества символов в сообщении следует не забывать, что знаки препинания, а также пробелы – это тоже символы и они весят столько же, сколько и буквы.

Например, при условии, что каждая буква кодируется одним байтом, для текста, «Ура! Наступили каникулы.» информационный объем определяется умножением 8 битов на 24 символа (без учета кавычек). Произведение 8 * 24 = 192 бита – столько весит кодируемая фраза. В переводе на байты: 192 бита разделить на 8 получим 24 байта.

Эта схема работает и в обратной задаче. Пусть информационное сообщение составляет 2 килобайта и состоит из 512 символов. Необходимо определить мощность алфавита, используемого для кодирования сообщения.

Решение: Сначала целесообразно 2 килобайта перевести в биты: 2 * 1024 = 2048 (бит). Затем объем информационного сообщения делят на количество символов: 2048 / 512 = 4 (бит), получают вес одного символа. Для определения мощности алфавита 2 возводят в степень 4 и получают 16 – это мощность алфавита, то есть количество символов, используемых для кодирования текста.

Одним из способов определения величины информационного сообщения является алфавитный подход, в котором любой знак в тексте имеет некоторый вес, обусловленный мощностью алфавита. Минимальной единицей измерения информации является бит. Информацию можно также измерять в байтах, килобайтах, мегабайтах.

Средняя оценка: 4.4. Всего получено оценок: 103.

Источник: https://obrazovaka.ru/informatika/izmerenie-informacii-podhody-7-klass.html

5. Количество информации. Измерение информации. Единицы измерения

Измерение информации

За единицу количества информациипринимается такое количество информации,которое содержит сообщение, уменьшающеенеопределенность в два раза. Такаяединица названа “бит”.

Для информации существуют свои единицыизмерения информации. Если рассматриватьсообщения информации как последовательностьзнаков, то их можно представлять битами,а измерять в байтах, килобайтах,мегабайтах, гигабайтах, терабайтах ипетабайтах.

Давайте разберемся с этим, ведь нампридется измерять объем памяти ибыстродействие компьютера.

Бит

Единицей измерения количества информацииявляется бит – это наименьшая(элементарная) единица.

1бит – это количество информации,содержащейся в сообщении, которое вдвоеуменьшает неопределенность знаний очем-либо.

Байт

Байт – основная единица измеренияколичества информации.

Байтом называется последовательностьиз 8 битов.

Байт – довольно мелкая единица измеренияинформации. Например, 1 символ – это 1байт.

Производные единицы измерения количестваинформации

1 байт=8 битов

1 килобайт (Кб)=1024 байта =210 байтов

1 мегабайт (Мб)=1024 килобайта =210 килобайтов=220байтов

1 гигабайт (Гб)=1024 мегабайта =210 мегабайтов=230байтов

1 терабайт (Гб)=1024 гигабайта =210 гигабайтов=240байтов

Запомните, приставка КИЛО в информатике– это не 1000, а 1024, то есть 210 .

Методы измерения количества информации

Итак, количество информации в 1 бит вдвоеуменьшает неопределенность знаний.Связь же между количеством возможныхсобытий N и количеством информации Iопределяется формулой Хартли:

N=2i.

Алфавитный подход к измерению количестваинформации

При этом подходе отвлекаются от содержания(смысла) информации и рассматривают еекак последовательность знаков определеннойзнаковой системы. Набор символов языка,т.е. его алфавит можно рассматриватькак различные возможные события. Тогда,если считать, что появление символов всообщении равновероятно, по формулеХартли можно рассчитать, какое количествоинформации несет в себе каждый символ:

I=log2N.

Вероятностный подход к измерениюколичества информации

Этот подход применяют, когда возможныесобытия имеют различные вероятностиреализации. В этом случае количествоинформации определяют по формулеШеннона:

,где

I – количество информации,

N – количество возможных событий,

Pi – вероятность i-го события.

6. Кодирование информации различных видов

1.6.1. КОДИРОВАНИЕ ЧИСЕЛ.

Используя n бит, можно записывать двоичныекоды чисел от 0 до 2n-1, всего 2n чисел.

1) Кодирование положительных чисел: Длязаписи положительных чисел в байтезаданное число слева дополняют нулямидо восьми цифр. Эти нули называютнезначимыми.

Например: записать в байте число 1310 =11012

Результат: 00001101

2) Кодирование отрицательных чисел:Наибольшееположительное число, которое можнозаписать в байт, – это 127, поэтому длязаписи отрицательных чисел используютчисла с 128-го по 255-е. В этом случае, чтобызаписать отрицательное число, к немудобавляют 256, и полученное число записываютв ячейку.

1.6.2. КОДИРОВАНИЕ ТЕКСТА.

Соответствие между набором букв ичислами называется кодировкой символа.Как правило, код символа хранится водном байте, поэтому коды символов могутпринимать значение от 0 до 255. Такиекодировки называют однобайтными.

Онипозволяют использовать 256 символов.Таблица кодов символов называется ASCII(American StandardCodeforInformationInterchange- Американскийстандартный код для обмена информацией).

Таблица ASCII-кодов состоит из двух частей:

Коды от 0 до 127 одинаковы для всех IBM-PCсовместимых компьютеров и содержат:

коды управляющих символов;

коды цифр, арифметических операций,знаков препинания;

некоторые специальные символы;

коды больших и маленьких латинскихбукв.

Вторая часть таблицы (коды от 128 до 255)бывает различной в различных компьютерах.Она содержит:

коды букв национального алфавита;

коды некоторых математическихсимволов;

коды символов псевдографики.

В настоящее время все большеераспространение приобретает двухбайтнаякодировка Unicode. В ней коды символов могутпринимать значение от 0 до 65535.

1.6.3. КОДИРОВАНИЕ ЦВЕТОВОЙ ИНФОРМАЦИИ.

Одним байтом можно закодировать 256различных цветов. Это достаточно длярисованных изображений типа мультфильмов,но не достаточно для полноцветныхизображений живой природы.

Если длякодирования цвета использовать 2 байта,можно закодировать уже 65536 цветов. Аесли 3 байта – 16,5 млн. различных цветов.

Такой режим позволяет хранить, обрабатыватьи передавать изображения, не уступающиепо качеству наблюдаемым в живой природе.

Из курса физики известно, что любой цветможно представить в виде комбинациитрех основных цветов: красного, зеленого,синего (их называют цветовымисоставляющими). Если кодировать цветточки с помощью 3 байтов, то первый байтвыделяется красной составляющей, второй– зеленой, третий – синей. Чем большезначение байта цветовой составляющей,тем ярче этот цвет.

Белый цвет – у точки есть все цветовыесоставляющие, и они имеют полную яркость.Поэтому белый цвет кодируется так: 255255 255. (11111111 11111111 11111111)

Черный цвет – отсутствие всех прочихцветов: 0 0 0. (00000000 00000000 00000000)

Серый цвет – промежуточный между черными белым. В нем есть все цветовыесоставляющие, но они одинаковы инейтрализуют друг друга.

Например: 100 100 100 или 150 150 150. (2-й вариант- ярче).

Красный цвет – все составляющие, кромекрасной, равны 0. Темно-красный: 128 0 0.Ярко-красный: 255 0 0.

Зеленый цвет – 0 255 0.

Синий цвет – 0 0 255.

1.6.4. КОДИРОВАНИЕ ГРАФИЧЕСКОЙ ИНФОРМАЦИИ.

Рисунок разбивают на точки. Чем большебудет точек, и чем мельче они будут, темточнее будет передача рисунка. Затем,двигаясь по строкам слева направоначиная с верхнего левого угла,последовательно кодируют цвет каждойточки. Для черно-белой картинки достаточно1 байта для точки, для цветной – до 3-хбайт для одной точки.

Двоичная система счисления

В двоичной системе счисления используютсявсего две цифры 0 и 1. Другими словами,двойка является основанием двоичнойсистемы счисления. (Аналогично удесятичной системы основание 10.)

Чтобы научиться понимать числа в двоичнойсистеме счисления, сначала рассмотрим,как формируются числа в привычной длянас десятичной системе счисления.

В десятичной системе счисления мырасполагаем десятью знаками-цифрами(от 0 до 9). Когда счет достигает 9, товводится новый разряд (десятки), а единицыобнуляются и счет начинается снова.После 19 разряд десятков увеличиваетсяна 1, а единицы снова обнуляются. И такдалее. Когда десятки доходят до 9, топотом появляется третий разряд – сотни.

Двоичная система счисления аналогичнадесятичной за исключением того, что вформировании числа участвуют всеголишь две знака-цифры: 0 и 1. Как толькоразряд достигает своего предела (т.е.единицы), появляется новый разряд, астарый обнуляется.

Попробуем считать в двоичной системе:

0 – это ноль

1 – это один (и это предел разряда)

10 – это два

11 – это три (и это снова предел)

100 – это четыре

101 – пять

110 – шесть

111 – семь и т.д.

Перевод чисел из двоичной системысчисления в десятичную

Не трудно заметить, что в двоичнойсистеме счисления длины чисел сувеличением значения растут быстрымитемпами. Как определить, что значит вотэто: 10001001? Непривычный к такой формезаписи чисел человеческий мозг обычноне может понять сколько это. Неплохо быуметь переводить двоичные числа вдесятичные.

В десятичной системе счисления любоечисло можно представить в форме суммыединиц, десяток, сотен и т.д. Например:

1476 = 1000 + 400 + 70 + 6

Можно пойти еще дальше и разложить так:

1476 = 1 * 103 + 4 * 102 + 7 * 101 + 6 * 100

Посмотрите на эту запись внимательно.Здесь цифры 1, 4, 7 и 6 – это набор цифр изкоторых состоит число 1476. Все эти цифрыпоочередно умножаются на десятьвозведенную в ту или иную степень. Десять– это основание десятичной системысчисления. Степень, в которую возводитсядесятка – это разряд цифры за минусомединицы.

Аналогично можно разложить и любоедвоичное число. Только основание здесьбудет 2:

10001001 = 1*27 + 0*26 + 0*25 + 0*24 + 1*23 + 0*22 + 0*21 + 1*20

Если посчитать сумму составляющих, тов итоге мы получим десятичное число,соответствующее 10001001:

1*27 + 0*26 + 0*25 + 0*24 + 1*23 + 0*22 + 0*21 + 1*20 = 128 + 0 + 0 +0 + 8 + 0 + 0 + 1 = 137

Т.е. число 10001001 по основанию 2 равно числу137 по основанию 10. Записать это можнотак:

100010012 = 13710

Почему двоичная система счисления такраспространена?

Дело в том, что двоичная система счисления– это язык вычислительной техники.Каждая цифра должна быть как-топредставлена на физическом носителе.

Если это десятичная система, то придетсясоздать такое устройство, которое можетбыть в десяти состояниях. Это сложно.Проще изготовить физический элемент,который может быть лишь в двух состояниях(например, есть ток или нет тока).

Этоодна из основных причин, почему двоичнойсистеме счисления уделяется стольковнимания.

Перевод десятичного числа в двоичное

Может потребоваться перевести десятичноечисло в двоичное. Один из способов –это деление на два и формированиедвоичного числа из остатков. Например,нужно получить из числа 77 его двоичнуюзапись:

77 / 2 = 38 (1 остаток)

38 / 2 = 19 (0 остаток)

19 / 2 = 9 (1 остаток)

9 / 2 = 4 (1 остаток)

4 / 2 = 2 (0 остаток)

2 / 2 = 1 (0 остаток)

1 / 2 = 0 (1 остаток)

Собираем остатки вместе, начиная сконца: 1001101. Это и есть число 77 в двоичномпредставлении. Проверим:

1001101 = 1*26 + 0*25 + 0*24 + 1*23 + 1*22 + 0*21 + 1*20 = 64 + 0 + 0+ 8 + 4 + 0 + 1 = 77

ASCII(англ. American Standard Code for InformationInterchange) — американская стандартнаякодировочная таблица для печатныхсимволов и некоторых специальных кодов.В американском варианте английскогоязыка произносится [э́ски], тогда как вВеликобритании чаще произносится[а́ски]; по-русски произносится также[а́ски] или [аски́].

ASCII представляет собой кодировку дляпредставления десятичных цифр, латинскогои национального алфавитов, знаковпрепинания и управляющих символов.

Изначально разработанная как 7-битная,с широким распространением 8-битногобайта ASCII стала восприниматься какполовина 8-битной.

В компьютерах обычноиспользуют расширения ASCII с задействованным8-м битом и второй половиной кодовойтаблицы (например КОИ-8).

Поскольку ASCII изначально предназначалсядля обмена информацией (по телетайпу),в нём, кроме информационных символов,используются символы-команды дляуправления связью. Это обычный наборспецсигналов, применявшийся и в другихдокомпьютерных средствах обменасообщениями (азбука Морзе, семафорнаяазбука), дополненный с учётом спецификиустройства.

(После названия каждого символа указанего 16-ричный код)

NUL, 00 — Null, пустой. Всегда игнорировался.На перфолентах 1 представляласьотверстием, 0 — отсутствием отверстия.

Поэтому пустые части перфоленты доначала и после конца сообщения состоялииз таких символов. Сейчас используетсяво многих языках программирования какконец строки.

(Строка понимается какпоследовательность символов.) В некоторыхоперационных системах NUL — последнийсимвол любого текстового файла.

SOH, 01 — Start Of Heading, началозаголовка.

STX, 02 — Start of Text, началотекста. Текстомназывалась часть сообщения, предназначеннаядля печати. Адрес, контрольная сумма ит. д. входили или в заголовок, или в частьсообщения после текста.

ETX, 03 — End of Text, конецтекста. Здесь телетайппрекращал печатать. Использованиесимвола Ctrl-C, имеющего код 03, для прекращенияработы чего-то (обычно программы),восходит ещё к тем временам.

EOT, 04 — End of Transmission, конецпередачи. В системеUNIX Ctrl-D, имеющий тот же код, означаетконец файла при вводе с клавиатуры.

ENQ, 05 — Enquire. Прошуподтверждения.

ACK, 06 — Acknowledgement. Подтверждаю.

BEL, 07 — Bell, звонок, звуковой сигнал. Сейчастоже используется. В языках программированияC и C++ обозначается \a.

BS, 08 — Backspace, возврат на один символ.Сейчас стирает предыдущий символ.

TAB, 09 — Tabulation. Обозначался также HT —Horizontal Tabulation, горизонтальная табуляция.Во многих языках программированияобозначается \t .

LF, 0A — Line Feed, перевод строки. Сейчас вконце каждой строчки текстового файластавится либо этот символ, либо CR, либои тот и другой (CR, затем LF), в зависимостиот операционной системы. Во многихязыках программирования обозначается и при выводе текста приводит к переводустроки.

VT, 0B — Vertical Tab, вертикальная табуляция.

FF, 0C — Form Feed, прогон страницы, новаястраница.

CR, 0D — Carriage Return, возвраткаретки. Во многихязыках программирования этот символ,обозначаемый \r, можно использовать длявозврата в начало строчки без переводастроки. В некоторых операционных системахэтот же символ, обозначаемый Ctrl-M, ставитсяв конце каждой строчки текстового файлаперед LF.

SO, 0E — Shift Out, измени цвет ленты (использовалсядля двуцветных лент; цвет менялся обычнона красный). В дальнейшем обозначалначало использования национальнойкодировки.

SI, 0F — Shift In, обратно к Shift Out.

DLE, 10 — Data Link Escape, освобождение каналаданных — следующие символы представляютсобой данные, а не управляющие символы.

DC1, 11 — Device Control 1, 1-й символ управленияустройством — включить устройствочтения перфоленты.

DC2, 12 — Device Control 2, 2-й символ управленияустройством — включить перфоратор.

DC3, 13 — Device Control 3, 3-й символ управленияустройством — выключить устройствочтения перфоленты.

DC4, 14 — Device Control 4, 4-й символ управленияустройством — выключить перфоратор.

NAK, 15 — Negative Acknowledgment, неподтверждаю. ОбратноAcknowledgment.

SYN, 16 — Synchronization. Этот символ передавался,когда для синхронизации было необходимочто-нибудь передать.

ETB, 17 — End of Text Block, конецтекстового блока.Иногда текст по техническим причинамразбивался на блоки.

CAN, 18 — Cancel, отмена (того, что было переданоранее).

EM, 19 — End of Medium, конец носителя (кончиласьперфолента и т. д.)

SUB, 1A — Substitute, подставить. Ставится наместе символа, значение которого былопотеряно или испорчено при передаче.Сейчас Ctrl-Z используется как конец файлапри вводе с клавиатуры в системах DOS иWindows. У этой функции нет никакой очевиднойсвязи с символом SUB.

ESC, 1B — Escape. Следующие за ним символыимеют какое-то другое значение, отличноеот того, которое определено в ASCII. Обычноначинал управляющие последовательности.

FS, 1C — File Separator, разделитель файлов.

GS, 1D — Group Separator, разделитель групп.

RS, 1E — Record Separator, разделитель записей.

US, 1F — Unit Separator, разделитель юнитов. Тоесть поддерживалось 4 уровня структуризацииданных: сообщение могло состоять изфайлов, файлы из групп, группы из записей,записи из юнитов.

DEL, 7F — Delete, стереть последний символ.Символом DEL, состоящим в двоичном кодеиз всех единиц, можно было забить любойсимвол. Устройства и программы игнорировалиDEL так же, как NUL. Код этого символапроисходит из первых текстовых процессоровс памятью на перфоленте: в них удалениесимвола происходило забиванием егокода дырочками (обозначавшими логическиеединицы).

Растровая и векторная графика

Способы представления изображений впамяти ЭВМ

Формальное определение компьютерная(машинная) графика – это создание,хранение и обработка моделей объектови их изображений с помощью ЭВМ. Подинтерактивной компьютерной графикойпонимают раздел компьютерной графики,изучающий вопросы динамическогоуправления со стороны пользователясодержанием изображения, его формой,размерами и цветом на экране с помощьюинтерактивных устройств взаимодействия.

Под компьютерной геометрией понимаютматематический аппарат, применяемый вкомпьютерной графике.

Необходимо отметить следующуюотличительную черту компьютерныхизображений. Изображения, которые мывстречаем в нашей повседневной жизни,реальные картины природы, можно бесконечнодетализировать, выявлять все новыецвета и оттенки.

Изображения, хранящиесяв памяти компьютера, независимо отспособа их получения и представления,всегда являются усеченной модельюкартины реального мира.

Их детализациявозможна лишь с той степенью, котораябыла заложена при их создании илиполучении, и их цветовая гамма будет нешире заранее оговоренной.

Одно и то же изображение может бытьпредставлено в памяти ЭВМ двумяпринципиально различными способами иполучено два различных типа изображения:растровое и векторное. Рассмотримподробнее эти способы представленияизображений, выделим их основныепараметры и определим их достоинстваи недостатки.

Что такое растровое изображение?

Возьмём фотографию (например, см. рис.1.1). Конечно, она тоже состоит из маленькихэлементов, но будем считать, что отдельныеэлементы мы рассмотреть не можем. Онапредставляется для нас, как реальнаякартина природы.

Теперь разобьём это изображение намаленькие квадратики (маленькие, новсё-таки чётко различимые), и каждыйквадратик закрасим цветом, преобладающимв нём (на самом деле программы приоцифровке генерируют некий «средний»цвет, т. е. если у нас была одна чёрнаяточка и одна белая, то квадратик будетиметь серый цвет).

Как мы видим, изображение стало состоятьиз конечного числа квадратиковопределённого цвета. Эти квадратикиназывают pixel (от PICture ELement) – пиксел илипиксель.

Рис. 1.1. Исходное изображение

Теперь каким-либо методом занумеруемцвета. Конкретная реализация этихметодов нас пока не интересует. Для нассейчас важно то, что каждый пиксель нарисунке стал иметь определённый цвет,обозначенный цифрой (рис. 1.2).

Рис. 1.2. Фрагмент оцифрованного изображенияи номера цветов

Теперь пойдём по порядку (слева направои сверху вниз) и будем в строчку выписыватьномера цветов встречающихся пикселей.Получится строка примерно следующеговида:

1 2 8 3 212 45 67 45 127 4 78 225 34 …

Вот эта строка и есть наши оцифрованныеданные. Теперь мы можем сжать их (таккак несжатые графические данные обычноимеют достаточно большой размер) исохранить в файл.

Итак, под растровым (bitmap, raster) понимаютспособ представления изображения ввиде совокупности отдельных точек(пикселей) различных цветов или оттенков.Это наиболее простой способ представленияизображения, ибо таким образом видитнаш глаз.

Достоинством такого способа являетсявозможность получения фотореалистичногоизображения высокого качества в различномцветовом диапазоне. Недостатком –высокая точность и широкий цветовойдиапазон требуют увеличения объемафайла для хранения изображения иоперативной памяти для его обработки.

Для векторной графики характерноразбиение изображения на ряд графическихпримитивов – точки, прямые, ломаные,дуги, полигоны. Таким образом, появляетсявозможность хранить не все точкиизображения, а координаты узлов примитивови их свойства (цвет, связь с другимиузлами и т. д.).

Вернемся к изображению на рис. 1.1. Взглянемна него по-другому. На изображении легкоможно выделить множество простыхобъектов — отрезки прямых, ломанные,эллипс, замкнутые кривые.

Представимсебе, что пространство рисунка существуетв некоторой координатной системе.

Тогдаможно описать это изображение, каксовокупность простых объектов,вышеперечисленных типов, координатыузлов которых заданы вектором относительноточки начала координат (рис. 1.3).

Рис. 1.3. Векторное изображение и узлыего примитивов

Проще говоря, чтобы компьютер нарисовалпрямую, нужны координаты двух точек,которые связываются по кратчайшейпрямой. Для дуги задается радиус и т.д. Таким образом, векторная иллюстрация– это набор геометрических примитивов.

Важной деталью является то, что объектызадаются независимо друг от друга и,следовательно, могут перекрыватьсямежду собой.

При использовании векторного представленияизображение хранится в памяти как базаданных описаний примитивов. Основныеграфические примитивы, используемые ввекторных графических редакторах:точка, прямая, кривая Безье, эллипс(окружность), полигон (прямоугольник).Примитив строится вокруг его узлов(nodes). Координаты узлов задаютсяотносительно координатной системымакета.

А изображение будет представлять изсебя массив описаний – нечто типа:

отрезок (20,20-100,80);

окружность(50,40-30);

кривая_Безье (20,20-50,30-100,50).

Каждому узлу приписывается группапараметров, в зависимости от типапримитива, которые задают его геометриюотносительно узла. Например, окружностьзадается одним узлом и одним параметром– радиусом.

Такой набор параметров,которые играют роль коэффициентов идругих величин в уравнениях и аналитическихсоотношениях объекта данного типа,называют аналитической моделью примитива.

Отрисовать примитив – значит построитьего геометрическую форму по его параметрамсогласно его аналитической модели.

Векторное изображение может быть легкомасштабировано без потери деталей, таккак это требует пересчета сравнительнонебольшого числа координат узлов. Другойтермин – «object-oriented graphics».

Самой простой аналогией векторногоизображения может служить аппликация.Все изображение состоит из отдельныхкусочков различной формы и цвета (дажечасти растра), «склеенных» между собой.

Понятно, что таким образом труднополучить фотореалистичное изображение,так как на нем сложно выделить конечноечисло примитивов, однако существеннымидостоинствами векторного способапредставления изображения, по сравнениюс растровым, являются:

· векторное изображение может бытьлегко масштабировано без потери качества,так как это требует пересчета сравнительнонебольшого числа координат узлов;

· графические файлы, в которых хранятсявекторные изображения, имеют существенноменьший, по сравнению с растровыми,объем (порядка нескольких килобайт).

Сферы применения векторной графикиочень широки. В полиграфике – от созданиякрасочных иллюстраций до работы сошрифтами. Все, что мы называем машиннойграфикой, 3D-графикой, графическимисредствами компьютерного моделированияи САПР – все это сферы приоритетавекторной графики, ибо эти ветви деревакомпьютерных наук рассматриваютизображение исключительно с позицииего математического представления.

Как видно, векторным можно назватьтолько способ описания изображения, асамо изображение для нашего глаза всегдарастровое.

Таким образом, задачамивекторного графического редактораявляются растровая прорисовка графическихпримитивов и предоставление пользователюсервиса по изменению параметров этихпримитивов.

Все изображение представляетсобой базу данных примитивов и параметровмакета (размеры холста, единицы измеренияи т. д.). Отрисовать изображение – значитвыполнить последовательно процедурыпрорисовки всех его деталей.

Для уяснения разницы между растровойи векторной графикой приведем простойпример. Вы решили отсканировать Вашуфотографию размером 10´15 см чтобы затемобработать и распечатать на цветномпринтере. Для получения приемлемогокачества печати необходимо разрешениене менее 300 dpi. Считаем:

10 см = 3,9 дюйма; 15 см = 5,9 дюймов.

По вертикали: 3,9 * 300 = 1170 точек.

По горизонтали: 5,9 * 300 = 1770 точек.

Итак, число пикселей растровой матрицы 1170 * 1770 = 2 070 900.

Теперь решим, сколько цветов мы хотимиспользовать. Для черно-белого изображенияиспользуют обычно 256 градаций серогоцвета для каждого пикселя, или 1 байт.Получаем, что для хранения нашегоизображения надо 2 070 900 байт или 1,97 Мб.

Для получения качественного цветногоизображения надо не менее 256 оттенковдля каждого базового цвета. В моделиRGB соответственно их 3: красный, зеленыйи синий. Получаем общее количество байт– 3 на каждый пиксел. Соответственно,размер хранимого изображения возрастаетв три раза и составляет 5,92 Мб.

Для создания макета для полиграфиифотографии сканируют с разрешением 600dpi, следовательно, размер файла вырастаетеще вчетверо.

С другой стороны, если изображениесостоит из простых объектов, то для егохранения в векторном виде необходимоне более нескольких килобайт.

Источник: https://studfile.net/preview/2180025/page:4/

Единицы измерения объёма информации

Измерение информации

Одной из характеристик любой информация является ее объем. Например, небольшую заметку может характеризовать количество слов ее составляющих, а книги обычно меряют уже страницами. В электронных устройствах есть свои единицы объема информации, которые показывают, сколько нужно места для ее хранения.

Здесь придется сделать небольшое отступление, чтобы объяснить, как вообще хранится в компьютерах информация.

Из информатики нам известно, что обычные компьютеры распознают только два состояния, включено и выключено (высокий и низкий сигнал).

Для описания этих состояний достаточно всего двух цифр 0 (выключено или ложь) и 1 (включено или истина). Все остальное получается из комбинации нулей и единиц. Это так называемая двоичная система счисления.

С другой стороны, мы все обычно пользуемся десятичной системой счисления, которая использует уже десять цифр: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9.

Отсюда у простых людей есть определенные трудности в понимании, как оперируют информацией компьютеры. К счастью, в контексте этой статьи, нам ненужно вникать во все эти тонкости.

Достаточно запомнить, что компьютеры оперируют только 0 и 1 и это соответствует одному биту.

Бит (bit) — минимальный объем информации в двоичной системе счисления, равен 0 или 1. Это конечно хорошо, но как нам записать, что то более осмысленное? Выход находится в комбинировании нескольких бит.

Если взять два бита, то вместе они уже имеют не два состояния (0 или 1), а четыре: 00, 01, 10, 11. Восемь последовательных бит дают в сумме 256 (28) возможных комбинаций нуля и единицы.

Такое количество комбинаций достаточно, чтобы закодировать все буквы алфавита, цифры, знаки препинания и остальные служебные вещи.

Таблица соответствия двоичных кодов некоторым ASCII кодам

СимволКодСимволКод
а11100000А11000000
б11100001Б11000001
ю11111110Ю11011110
я11111111Я11011111
000110000100110001
800111000900111001
Пустой ASCII символ00000000%00100101
пробел00100000.00101110
f01100110F01000110
w01110111W01010111

В действительности все немного сложнее, поскольку в мире существует множество языков, а так же других полезных символов. Естественно общее количество символов получается гораздо больше, чем 256.

Для решения этой проблемы используют таблицы кодировки, чтобы компьютер мог понять, какому символу на каком языке должен соответствовать тот или иной двоичный код.

Например, в операционной системе Windows используется кодировка Windows-1251, в которой в первых 128 комбинациях закодированы служебные символы, цифры, знаки препинания и латинские буквы, а оставшиеся комбинации отданы под хранение кириллицы и всяких дополнительных значков.

Фраза «Привет, мир!» в двоичном коде в кодировке Windows-1251 выглядит так:

110011111111000011101000111000101110010111110010001011000010000011101100111010001111000000100001

Естественно в ней отсутствуют украинские буквы, французские, иероглифы и много чего еще. Мало того даже для одного языка может существовать несколько кодировок (для кириллицы Windows-1251, KOI8-R, CP-866, MacCyrillic, ISO 8859-5), что часто приводит к проблемам в виде кракозябр при переносе документов.

Решить эту проблему можно создав единую таблицу кодировки, включающую в себя все существующие символы на всех языках, в том числе мертвых. Такой кодировкой стал активно развивающийся стандарт Юникод.

Правда у него есть свои проблемы, в контексте этой статьи это выражается в том, что один редко используемый символ в Unicode может занимать до 32 бит, в частности символы кириллицы занимают 16 бит.

Что такое байт

Байт (byte) — восемь последовательных битов образуют 1 байт. Это минимальный объем информации, к которому можно обратится напрямую и с которым имеют дело компьютерные программы. В современной компьютерной технике 1 байт равен 8 битам, но есть исключения, поэтому его еще иногда называют «октет» для полной однозначности. Теперь вы знаете, сколько бит в байте.

Именно в байтах измеряют объем любой информации неважно текст, изображение и видео. Поэтому в Проводник показывает вес (объем) файла в байтах, о существовании битов обычные пользователи компьютера могут даже не догадываться. Объем накопителей для хранения данных так же выражается в байтах.

В школе изучают эти приставки и все знают, что приставка «кило» означает тысяча (103), например километр (1 000 метров), килограмм (1 000 грамм). Приставка «мега» означает миллион (106), например мегагерц (1 000 000 герц), мегаом (1 000 000 ом).

Есть и многие другие широко распространенные в нашей жизни приставки. Именно в этот момент у изучающих компьютер начинается путаница. Дело в том, что в компьютерах используют те же приставки, то есть килобайт, мегабайт, гигабайт и так далее, но они кратны 1 024 (210).

Согласитесь, неожиданный поворот. На эту тему есть даже древний анекдот:

     — В чем отличие программиста от простого человека?
     — Программист думает, килограмм картошки — это 1 024 грамма, а простой человек полагает, что в килобайте 1 000 байт.

На самом деле, для обозначения единиц компьютерной информации существуют свои собственные приставки, которые устраняют эту чехарду, правда ими практически никто не пользуется. Считается, что в силу их громоздкости и труднопроизносимости. Образуются заменой последнего слога стандартной приставки на «би», кибибайт, мебибайт, гибибайт, тебибайт и так далее.

Килобайт (КБ, Кбайт) — единица информации равная 1 024 байтам. Хотя правильнее как уже говорилось выше, называть ее кибибайтом. Чтобы перевести килобайты в байты, их нужно умножить на 1 024, а чтобы получились биты, умножить получившееся число еще на 8. В итоге, в 1 КБ содержит 8 192 бита.

Мегабайт (МБ, Мбайт) — единица информации равная 1 024 килобайта. Чтобы перевести байты в мегабайты их нужно разделить на 1 024 и еще раз на 1 024, то есть он равен 1 048 576 байтам. Обычно вес музыки, фотографий или коротких видеоклипов измеряется как раз в них.

Гигабайт (ГБ, Гбайт) — единица информации равная 1 024 мегабайта, 1 048 576 килобайт, 1 073 741 824 байтам или 8 589 934 592 бит. В основном это фильмы в хорошем качестве. Высчитывать все это вручную не очень удобно, поэтому ниже есть специальный конвертер для пересчета единиц измерения объема информации.

Терабайт (ТБ, Тбайт) — самая большая единица объема информации, с которой может столкнуться обычный пользователь компьютера на сегодняшний день и то не в виде отдельных файлов, а в виде объема жесткого диска.

Равен 1 024 гигабайтам или 1 048 576 мегабайтам.

С другой стороны, объем потребляемой информации постоянно растет и в будущем терабайт может стать такой же привычной величиной и повсеместное внедрение видео формата 4K вполне может этому поспособствовать.

https://www.youtube.com/watch?v=JNZUZKsQSSc

Это самые распространенные на сегодняшний день объемы отдельных файлов встречающиеся в компьютерах обычных пользователей.

Остальные единицы измерения информации, такие как терабайт, петабайт, эксабайт и так далее пока не встречаются в домашних компьютерах, за исключением терабайта.

Вы можете посмотреть в таблице, а так же воспользоваться онлайн калькулятором расположенным ниже для их пересчета.

ОбщеупотребительныеПриставки МЭКНазваниеСокращениеНазваниеСокращениеСтепень
байтБ (байт)байтБ20
килобайтКБ (Кбайт)кибибайтКиБ210
мегабайтМБ (Мбайт)мебибайтМиБ220
гигабайтГБ (Гбайт)гибибайтГиБ230
терабайтТБ (Тбайт)тебибайтТиБ240
петабайтПБ (Пбайт)пебибайтПиБ250
эксабайтЭБ (Эбайт)эксбибайтЭиБ260
зеттабайтЗБ (Збайт)зебибайтЗиБ270
йоттабайтЙБ (Йбайт)йобибайтЙиБ280

Разобрались, что такое килобайт, мегабайт, гигабайт и так далее? Хорошо, однако, это еще не вся путаница, которая подстерегает чайника в компьютерах. Все еще интереснее и веселее.

Почему объем жесткого диска меньше, чем написано на этикетке

Вы возможно уже сталкивались с ситуацией, когда вы купили жесткий диск емкостью 500 ГБ, а операционная система видит заметно меньше, например, только 465 ГБ.

Ответ кроется все в тех же приставках и бардаке в их применении. Зато маркетологи знают, как можно буквально по мановению волшебной палочки увеличить емкость дисков своей компании.

Достаточно посчитать ее по своей собственной методике.

Производитель может придерживаться при расчетах объема диска международной системы СИ, где гигабайт это 109 и напишет на этикетке диска емкостью 500 млрд. байт, что он на 500 ГБ.

Когда вы его подключите к компьютеру, то Windows будет считать в двоичной системе и насчитает только 465 ГБ. Причем чем больше емкость диска, тем больше разница между этикеткой и реально доступным объемом.

Более того, производитель может посчитать каким-нибудь еще способом, допустим, гигабайт окажется равным 1 млн. килобайт.

В чем измеряется скорость интернета

Вы еще не потерялись во всех этих хитросплетениях? Тогда новая порция чудес ждет вас. Дело в том, что скорость передачи данных в компьютерных сетях измеряется в битах в секунду. Именно в битах, а не в байтах.

Это достаточно просто проверить, достаточно посмотреть, что пишет Windows в свойствах вашего подключения к интернету, там окажется, скорее всего, 100 Мбит/с или 1 Гбит/с.

Реальную скорость вашего подключения к интернету можно измерить.

Провайдеры точно так же указывают в тарифах именно биты в секунду. Причем здесь повторяется ситуация с байтами. Согласно международной системе СИ 1 Мбит это 1 000 000 бит, а в двоичной системе он должен называться мебибит и равняться 1 048 576 бит. Поэтому, что на самом деле имеет человек в виду говоря «мегабит», сказать однозначно нельзя.

Чтобы не мучиться с калькулятором, пересчитывая одни единицы в другие, вы можете воспользоваться нашим конвертером величин. Просто введите в поле число и выберите в выпадающем списке, в какой оно единице измерения. Нажмите кнопку «Пересчитать» и калькулятор сам пересчитает его в другие единицы измерения объема информации.

Конечно, новичкам трудно сразу разобраться во всей этой путанице, с другой стороны это особо и не требуется.

Главное помнить, что 8 бит равно 1 байту, остальные величины кратны 1 024, вес файлов измеряется в байтах, а скорость интернета в битах. Этого вполне достаточно для нормальной работы за компьютером.

А чтобы вам было легче сориентироваться, насколько много весит тот или иной файл, приведем в качестве справки объем некоторых носителей информации.

  • Дискета 3,5″ (если вы знаете, что это такое) — 1.44 МБ
  • CD диск — 700 МБ
  • DVD диск (однослойный) — 4.7 ГБ
  • Blu-ray диск (однослойный) — 25 ГБ
  • HDD (макс. емкость в настоящее время для домашнего компьютера) — 12 ТБ

Вот собственно и все, что мы вам хотели рассказать про единицы измерения информации в операционной системе компьютера. Рекомендуем сохранить данную страницу в закладки, чтобы иметь возможность быстро перевести килобайты в другие единицы измерения информации с помощью нашего конвертера.

Источник: https://beginpc.ru/windows/units-of-information

Единицы измерения объема информации

Измерение информации

Для измерения длины есть такие единицы, как миллиметр, сантиметр, метр, километр. Известно, что масса измеряется в граммах, килограммах, центнерах и тоннах. Бег времени выражается в секундах, минутах, часах, днях, месяцах, годах, веках. Компьютер работает с информацией и для измерения ее объема также имеются соответствующие единицы измерения.

Бит и байт – минимальные единицы измерения информации

Мы уже знаем, что компьютер воспринимает всю информацию через нули и единички.

Бит – это минимальная единица измерения информации, соответствующая одной двоичной цифре («0» или «1»).

Бит – это только 0 («ноль») или только 1 («единичка»). С помощью одного бита можно записать два состояния: 0 (ноль) или 1 (один). Бит – это минимальная ячейка памяти, меньше не бывает. В этой ячейке может храниться либо нолик, либо единичка.

Байт состоит из восьми бит. Используя один байт, можно закодировать один символ из 256 возможных (256 = 28). Таким образом, один байт равен одному символу, то есть 8 битам:

1 символ = 8 битам = 1 байту.

Буква, цифра, знак препинания – это символы. Одна буква – один символ. Одна цифра – тоже один символ. Один знак препинания (либо точка, либо запятая, либо вопросительный знак и т.п.) – снова один символ. Один пробел также является одним символом.

Кроме бита и байта, конечно же, есть и другие, более крупные единицы измерения информации.

Таблица байтов:

1 байт = 8 бит

1 Кб (1 Килобайт) =  210 байт = 2*2*2*2*2*2*2*2*2*2 байт =
= 1024 байт (примерно 1 тысяча байт – 103 байт)

1 Мб (1 Мегабайт) = 220 байт = 1024 килобайт (примерно 1 миллион байт – 106 байт)

1 Гб (1 Гигабайт) =   230 байт = 1024 мегабайт (примерно 1 миллиард байт – 109 байт)

1 Тб (1 Терабайт) =    240 байт = 1024 гигабайт (примерно 1012 байт). Терабайт иногда называют тонна.

1 Пб (1 Петабайт) =   250 байт = 1024 терабайт (примерно 1015 байт).

1 Эксабайт =              260 байт = 1024 петабайт (примерно 1018 байт).

1 Зеттабайт =            270 байт = 1024 эксабайт (примерно 1021 байт).

1 Йоттабайт =           280 байт = 1024 зеттабайт (примерно 1024 байт).

В приведенной выше таблице степени двойки (210, 220, 230 и т.д.) являются точными значениями килобайт, мегабайт, гигабайт. А вот степени числа 10 (точнее, 103, 106, 109 и т.п.) будут уже приблизительными значениями, округленными в сторону уменьшения. Таким образом, 210 = 1024 байта представляет точное значение килобайта, а 103 = 1000 байт является приблизительным значением килобайта.

Такое приближение (или округление) вполне допустимо и является общепринятым.

Ниже приводится таблица байтов с английскими сокращениями (в левой колонке):

1 Kb ~ 103 b = 10*10*10 b= 1000 b – килобайт

1 Mb ~ 106 b = 10*10*10*10*10*10 b = 1 000 000 b – мегабайт

1 Gb ~ 109 b – гигабайт

1 Tb ~ 1012 b – терабайт

1 Pb ~ 1015 b – петабайт

1 Eb ~ 1018 b – эксабайт

1 Zb ~ 1021 b – зеттабайт

1 Yb ~ 1024 b – йоттабайт

Выше в правой колонке приведены так называемые «десятичные приставки», которые используются не только с байтами, но и в других областях человеческой деятельности. Например, приставка «кило» в слове «килобайт» означает тысячу байт. В случае с километром она соответствует тысяче метров, а в примере с килограммом она равна тысяче грамм.

Продолжение следует…

Возникает вопрос: есть ли продолжение у таблицы байтов? В математике есть понятие бесконечности, которое обозначается как перевернутая восьмерка: ∞.

Понятно, что в таблице байтов можно и дальше добавлять нули, а точнее, степени к числу 10 таким образом: 1027, 1030, 1033 и так до бесконечности. Но зачем это надо? В принципе, пока хватает терабайт и петабайт. В будущем, возможно, уже мало будет и йоттабайта.

Напоследок парочка примеров по устройствам, на которые можно записать терабайты и гигабайты информации.

Есть удобный «терабайтник» – внешний жесткий диск, который подключается через порт USB к компьютеру. На него можно записать терабайт информации. Особенно удобно для ноутбуков (где смена жесткого диска бывает проблематична) и для резервного копирования информации. Лучше заранее делать резервные копии информации, а не после того, как все пропало.

Флешки бывают 1 Гб, 2 Гб, 4 Гб, 8 Гб, 16 Гб, 32 Гб , 64 Гб и даже 1 терабайт.

CD-диски могут вмещать 650 Мб, 700 Мб, 800 Мб и 900 Мб.

DVD-диски рассчитаны на большее количество информации: 4.7 Гб, 8.5 Гб, 9.4 Гб и 17 Гб.

Упражнения по компьютерной грамотности

описаны в статье “Байт, килобайт, мегабайт…”

Статья закончилась, но можно еще прочитать:

Кодирование текстовой информации

Проверяем, кодирует ли компьютер текст

Кодирование цветовой информации

Получайте актуальные статьи по компьютерной грамотности прямо на ваш почтовый ящик.
Уже более 3.000 подписчиков

.

Важно: необходимо подтвердить свою подписку! В своей почте откройте письмо для активации и кликните по указанной там ссылке. Если письма нет, проверьте папку Спам.

Источник: https://www.compgramotnost.ru/kodirovanie-informacii/edinicy-izmereniya-obema-informacii

Vse-referaty
Добавить комментарий