Как измерить объем информации

Как измерить объем информации

Какое количество информации содержится, к примеру, в тексте романа «Война и мир», во фресках Рафаэля или в генетическом коде человека? Ответа на эти вопросы наука не даёт и, по всей вероятности, даст не скоро. А возможно ли объективно измерить количество информации ? Важнейшим результатом теории информации является следующий вывод:

В определенных, весьма широких условиях можно пренебречь качественными особенностями информации, выразить её количество числом, а также сравнить количество информации, содержащейся в различных группах данных.

В настоящее время получили распространение подходы к определению понятия «количество информации», основанные на том, что информацию, содержащуюся в сообщении, можно нестрого трактовать в смысле её новизны или, иначе, уменьшения неопределённости наших знаний об объекте . Эти подходы используют математические понятия вероятности и логарифма. Если вы еще не знакомы с этими понятиями, то можете пока пропустить этот материал.

Подходы к определению количества информации. Формулы Хартли и Шеннона.

Американский инженер Р. Хартли в 1928 г. процесс получения информации рассматривал как выбор одного сообщения из конечного наперёд заданного множества из N равновероятных сообщений, а количество информации I, содержащееся в выбранном сообщении, определял как двоичный логарифм N .

Формула Хартли: I = log 2 N

Допустим, нужно угадать одно число из набора чисел от единицы до ста. По формуле Хартли можно вычислить, какое количество информации для этого требуется: I = log 2 100 > 6,644. Таким образом, сообщение о верно угаданном числе содержит количество информации, приблизительно равное 6,644 единицы информации.

Приведем другие примеры равновероятных сообщений :

  1. при бросании монеты: «выпала решка» , «выпал орел» ;
  2. на странице книги: «количество букв чётное» , «количество букв нечётное» .

Определим теперь, являются ли равновероятными сообщения «первой выйдет из дверей здания женщина» и «первым выйдет из дверей здания мужчина» . Однозначно ответить на этот вопрос нельзя . Все зависит от того, о каком именно здании идет речь. Если это, например, станция метро, то вероятность выйти из дверей первым одинакова для мужчины и женщины, а если это военная казарма, то для мужчины эта вероятность значительно выше, чем для женщины.

Для задач такого рода американский учёный Клод Шеннон предложил в 1948 г. другую формулу определения количества информации, учитывающую возможную неодинаковую вероятность сообщений в наборе .

Формула Шеннона: I = — ( p 1 log 2 p 1 + p 2 log 2 p 2 + . . . + p N log 2 p N ),
где p i — вероятность того, что именно i -е сообщение выделено в наборе из N сообщений.

Легко заметить, что если вероятности p 1 , . p N равны, то каждая из них равна 1 / N , и формула Шеннона превращается в формулу Хартли.

Помимо двух рассмотренных подходов к определению количества информации, существуют и другие. Важно помнить, что любые теоретические результаты применимы лишь к определённому кругу случаев, очерченному первоначальными допущениями .

В качестве единицы информации Клод Шеннон предложил принять один бит ( англ . bit — bi nary digi t — двоичная цифра).

Бит в теории информации — количество информации, необходимое для различения двух равновероятных сообщений (типа «орел»—»решка», «чет»—»нечет» и т.п.).

В вычислительной технике битом называют наименьшую «порцию» памяти компьютера, необходимую для хранения одного из двух знаков «0» и «1», используемых для внутримашинного представления данных и команд.

Бит — слишком мелкая единица измерения. На практике чаще применяется более крупная единица — байт , равная восьми битам. Именно восемь битов требуется для того, чтобы закодировать любой из 256 символов алфавита клавиатуры компьютера (256=2 8 ).

Широко используются также ещё более крупные производные единицы информации :

  • 1 Килобайт (Кбайт) = 1024 байт = 2 10 байт,
  • 1 Мегабайт (Мбайт) = 1024 Кбайт = 2 20 байт,
  • 1 Гигабайт (Гбайт) = 1024 Мбайт = 2 30 байт.

В последнее время в связи с увеличением объёмов обрабатываемой информации входят в употребление такие производные единицы, как:

  • 1 Терабайт (Тбайт) = 1024 Гбайт = 2 40 байт,
  • 1 Петабайт (Пбайт) = 1024 Тбайт = 2 50 байт.

За единицу информации можно было бы выбрать количество информации, необходимое для различения, например, десяти равновероятных сообщений. Это будет не двоичная (бит), а десятичная ( дит ) единица информации.

Источник

Учитель информатики

Сайт учителя информатики. Технологические карты уроков, Подготовка к ОГЭ и ЕГЭ, полезный материал и многое другое.

§ 1.6. Измерение информации

Информатика. 7 класса. Босова Л.Л. Оглавление

  • бит
  • информационный вес символа
  • информационный объём сообщения
  • единицы измерения информации

1.6.1. Алфавитный подход к измерению информации

Одно и то же сообщение может нести много информации для одного человека и не нести её совсем для другого человека. При таком подходе количество информации определить однозначно затруднительно.

Алфавитный подход позволяет измерить информационный объём сообщения, представленного на некотором языке (естественном или формальном), независимо от его содержания.

Для количественного выражения любой величины необходима, прежде всего, единица измерения. Измерение осуществляется путём сопоставления измеряемой величины с единицей измерения. Сколько раз единица измерения «укладывается» в измеряемой величине, таков и результат измерения.

При алфавитном подходе считается, что каждый символ некоторого сообщения имеет определённый информационный вес — несёт фиксированное количество информации. Все символы одного алфавита имеют один и тот же вес, зависящий от мощности алфавита. Информационный вес символа двоичного алфавита принят за минимальную единицу измерения информации и называется 1 бит.

Обратите внимание, что название единицы измерения информации «бит» (bit) происходит от английского словосочетания binary digit — «двоичная цифра».

За минимальную единицу измерения информации принят 1 бит. Считается, что таков информационный вес символа двоичного алфавита.

1.6.2. Информационный вес символа произвольного алфавита

Ранее мы выяснили, что алфавит любого естественного или формального языка можно заменить двоичным алфавитом. При этом мощность исходного алфавита N связана с разрядностью двоичного кода i, требуемой для кодирования всех символов исходного алфавита, соотношением: N = 2 i .

Разрядность двоичного кода принято считать информационным весом символа алфавита. Информационный вес символа алфавита выражается в битах.

Информационный вес символа алфавита i и мощность алфавита N связаны между собой соотношением: N = 2 i .

Задача 1. Алфавит племени Пульти содержит 8 символов. Каков информационный вес символа этого алфавита?

Решение. Составим краткую запись условия задачи.

Известно соотношение, связывающее величины i и N : N = 2 i .

С учётом исходных данных: 8 = 2 i . Отсюда: i = 3.

Полная запись решения в тетради может выглядеть так:

1.6.3. Информационный объём сообщения

Информационный объём сообщения (количество информации в сообщении), представленного символами естественного или формального языка, складывается из информационных весов составляющих его символов.

Информационный объём сообщения I равен произведению количества символов в сообщении К на информационный вес символа алфавита i;I = К • i.

Задача 2. Сообщение, записанное буквами 32-символьного алфавита, содержит 140 символов. Какое количество информации оно несёт?

Задача 3. Информационное сообщение объёмом 720 битов состоит из 180 символов. Какова мощность алфавита, с помощью которого записано это сообщение?

1.6.4. Единицы измерения информации

В наше время подготовка текстов в основном осуществляется с помощью компьютеров. Можно говорить о «компьютерном алфавите», включающем следующие символы: строчные и прописные русские и латинские буквы, цифры, знаки препинания, знаки арифметических операций, скобки и др. Такой алфавит содержит 256 символов. Поскольку 256 = 2 8 , информационный вес каждого символа этого алфавита равен 8 битам. Величина, равная восьми битам, называется байтом. 1 байт — информационный вес символа алфавита мощностью 256.

1 байт = 8 битов

Бит и байт — «мелкие» единицы измерения. На практике для измерения информационных объёмов используются более крупные единицы:

1 килобайт = 1 Кб = 1024 байта = 2 10 байтов
1 мегабайт = 1 Мб = 1024 Кб = 2 10 Кб = 2 20 байтов
1 гигабайт = 1 Гб = 1024 Мб = 2 10 Мб = 2 20 Кб = 2 30 байтов
1 терабайт = 1 Тб = 1024 Гб = 2 10 Гб = 2 20 Мб = 2 30 Кб = 2 40 байтов

Задача 4. Информационное сообщение объёмом 4 Кбайта состоит из 4096 символов. Каков информационный вес символа используемого алфавита? Сколько символов содержит алфавит, с помощью которого записано это сообщение?

Ответ: 8 битов, 256 символов.

Задача 5. В велокроссе участвуют 128 спортсменов. Специальное устройство регистрирует прохождение каждым из участников промежуточного финиша, записывая его номер цепочкой из нулей и единиц минимальной длины, одинаковой для каждого спортсмена. Каков будет информационный объём сообщения, записанного устройством после того, как промежуточный финиш пройдут 80 велосипедистов?

Решение. Номера 128 участников кодируются с помощью двоичного алфавита. Требуемая разрядность двоичного кода (длина цепочки) равна 7, так как 128 = 2 7 . Иначе говоря, зафиксированное устройством сообщение о том, что промежуточный финиш прошёл один велосипедист, несёт 7 битов информации. Когда промежуточный финиш пройдут 80 спортсменов, устройство запишет 80 • 7 = 560 битов, или 70 байтов информации.

Ответ: 70 байтов.

Самое главное.

При алфавитном подходе считается, что каждый символ некоторого сообщения имеет опредёленный информационный вес — несёт фиксированное количество информации.

1 бит — минимальная единица измерения информации.

Информационный вес символа алфавита i и мощность алфавита N связаны между собой соотношением: N = 2 i .

Информационный объём сообщения I равен произведению количества символов в сообщении К на информационный вес символа алфавита i: I = K•i.

1 байт = 8 битов.

Байт, килобайт, мегабайт, гигабайт, терабайт — единицы измерения информации. Каждая следующая единица больше предыдущей в 1024 (210) раза.

Вопросы и задания.

1.Ознакомтесь с материалами презентации к параграфу, содержащейся в электронном приложении к учебнику. Используйте эти материалы при подготовке ответов на вопросы и выполнении заданий.

Источник

Единицы измерения объёма информации

Одной из характеристик любой информация является ее объем. Например, небольшую заметку может характеризовать количество слов ее составляющих, а книги обычно меряют уже страницами. В электронных устройствах есть свои единицы объема информации, которые показывают, сколько нужно места для ее хранения.

Здесь придется сделать небольшое отступление, чтобы объяснить, как вообще хранится в компьютерах информация. Из информатики нам известно, что обычные компьютеры распознают только два состояния, включено и выключено (высокий и низкий сигнал). Для описания этих состояний достаточно всего двух цифр 0 (выключено или ложь) и 1 (включено или истина). Все остальное получается из комбинации нулей и единиц. Это так называемая двоичная система счисления.

С другой стороны, мы все обычно пользуемся десятичной системой счисления, которая использует уже десять цифр: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9. Отсюда у простых людей есть определенные трудности в понимании, как оперируют информацией компьютеры. К счастью, в контексте этой статьи, нам ненужно вникать во все эти тонкости. Достаточно запомнить, что компьютеры оперируют только 0 и 1 и это соответствует одному биту.

Бит (bit) — минимальный объем информации в двоичной системе счисления, равен 0 или 1. Это конечно хорошо, но как нам записать, что то более осмысленное? Выход находится в комбинировании нескольких бит. Если взять два бита, то вместе они уже имеют не два состояния (0 или 1), а четыре: 00, 01, 10, 11. Восемь последовательных бит дают в сумме 256 (2 8 ) возможных комбинаций нуля и единицы. Такое количество комбинаций достаточно, чтобы закодировать все буквы алфавита, цифры, знаки препинания и остальные служебные вещи.

Таблица соответствия двоичных кодов некоторым ASCII кодам

Символ Код Символ Код
а 11100000 А 11000000
б 11100001 Б 11000001
ю 11111110 Ю 11011110
я 11111111 Я 11011111
00110000 1 00110001
8 00111000 9 00111001
Пустой ASCII символ 00000000 % 00100101
пробел 00100000 . 00101110
f 01100110 F 01000110
w 01110111 W 01010111

В действительности все немного сложнее, поскольку в мире существует множество языков, а так же других полезных символов. Естественно общее количество символов получается гораздо больше, чем 256. Для решения этой проблемы используют таблицы кодировки, чтобы компьютер мог понять, какому символу на каком языке должен соответствовать тот или иной двоичный код. Например, в операционной системе Windows используется кодировка Windows-1251 , в которой в первых 128 комбинациях закодированы служебные символы, цифры, знаки препинания и латинские буквы, а оставшиеся комбинации отданы под хранение кириллицы и всяких дополнительных значков.

Фраза «Привет, мир!» в двоичном коде в кодировке Windows-1251 выглядит так:

Естественно в ней отсутствуют украинские буквы, французские, иероглифы и много чего еще. Мало того даже для одного языка может существовать несколько кодировок (для кириллицы Windows-1251 , KOI8-R , CP-866 , MacCyrillic, ISO 8859-5 ), что часто приводит к проблемам в виде кракозябр при переносе документов. Решить эту проблему можно создав единую таблицу кодировки, включающую в себя все существующие символы на всех языках, в том числе мертвых. Такой кодировкой стал активно развивающийся стандарт Юникод. Правда у него есть свои проблемы, в контексте этой статьи это выражается в том, что один редко используемый символ в Unicode может занимать до 32 бит, в частности символы кириллицы занимают 16 бит.

Что такое байт

Байт (byte) — восемь последовательных битов образуют 1 байт. Это минимальный объем информации, к которому можно обратится напрямую и с которым имеют дело компьютерные программы. В современной компьютерной технике 1 байт равен 8 битам, но есть исключения, поэтому его еще иногда называют «октет» для полной однозначности. Теперь вы знаете, сколько бит в байте.

Именно в байтах измеряют объем любой информации неважно текст, изображение и видео. Поэтому в Проводник показывает вес (объем) файла в байтах, о существовании битов обычные пользователи компьютера могут даже не догадываться. Объем накопителей для хранения данных так же выражается в байтах.

В школе изучают эти приставки и все знают, что приставка «кило» означает тысяча (10 3 ), например километр (1 000 метров), килограмм (1 000 грамм). Приставка «мега» означает миллион (10 6 ), например мегагерц (1 000 000 герц), мегаом (1 000 000 ом). Есть и многие другие широко распространенные в нашей жизни приставки. Именно в этот момент у изучающих компьютер начинается путаница. Дело в том, что в компьютерах используют те же приставки, то есть килобайт, мегабайт, гигабайт и так далее, но они кратны 1 024 (2 10 ). Согласитесь, неожиданный поворот. На эту тему есть даже древний анекдот:

— В чем отличие программиста от простого человека?
— Программист думает, килограмм картошки — это 1 024 грамма, а простой человек полагает, что в килобайте 1 000 байт.

На самом деле, для обозначения единиц компьютерной информации существуют свои собственные приставки, которые устраняют эту чехарду, правда ими практически никто не пользуется. Считается, что в силу их громоздкости и труднопроизносимости. Образуются заменой последнего слога стандартной приставки на «би», кибибайт, мебибайт, гибибайт, тебибайт и так далее.

Килобайт (КБ, Кбайт) — единица информации равная 1 024 байтам . Хотя правильнее как уже говорилось выше, называть ее кибибайтом. Чтобы перевести килобайты в байты, их нужно умножить на 1 024 , а чтобы получились биты, умножить получившееся число еще на 8. В итоге, в 1 КБ содержит 8 192 бита .

Мегабайт (МБ, Мбайт) — единица информации равная 1 024 килобайта . Чтобы перевести байты в мегабайты их нужно разделить на 1 024 и еще раз на 1 024 , то есть он равен 1 048 576 байтам . Обычно вес музыки, фотографий или коротких видеоклипов измеряется как раз в них.

Гигабайт (ГБ, Гбайт) — единица информации равная 1 024 мегабайта , 1 048 576 килобайт , 1 073 741 824 байтам или 8 589 934 592 бит . В основном это фильмы в хорошем качестве. Высчитывать все это вручную не очень удобно, поэтому ниже есть специальный конвертер для пересчета единиц измерения объема информации.

Терабайт (ТБ, Тбайт) — самая большая единица объема информации, с которой может столкнуться обычный пользователь компьютера на сегодняшний день и то не в виде отдельных файлов, а в виде объема жесткого диска. Равен 1 024 гигабайтам или 1 048 576 мегабайтам . С другой стороны, объем потребляемой информации постоянно растет и в будущем терабайт может стать такой же привычной величиной и повсеместное внедрение видео формата 4K вполне может этому поспособствовать.

Это самые распространенные на сегодняшний день объемы отдельных файлов встречающиеся в компьютерах обычных пользователей. Остальные единицы измерения информации, такие как терабайт, петабайт, эксабайт и так далее пока не встречаются в домашних компьютерах, за исключением терабайта. Вы можете посмотреть в таблице, а так же воспользоваться онлайн калькулятором расположенным ниже для их пересчета.

Общеупотребительные Приставки МЭК
Название Сокращение Название Сокращение Степень
байт Б (байт) байт Б 2 0
килобайт КБ (Кбайт) кибибайт КиБ 2 10
мегабайт МБ (Мбайт) мебибайт МиБ 2 20
гигабайт ГБ (Гбайт) гибибайт ГиБ 2 30
терабайт ТБ (Тбайт) тебибайт ТиБ 2 40
петабайт ПБ (Пбайт) пебибайт ПиБ 2 50
эксабайт ЭБ (Эбайт) эксбибайт ЭиБ 2 60
зеттабайт ЗБ (Збайт) зебибайт ЗиБ 2 70
йоттабайт ЙБ (Йбайт) йобибайт ЙиБ 2 80

Разобрались, что такое килобайт, мегабайт, гигабайт и так далее? Хорошо, однако, это еще не вся путаница, которая подстерегает чайника в компьютерах. Все еще интереснее и веселее.

Почему объем жесткого диска меньше, чем написано на этикетке

Вы возможно уже сталкивались с ситуацией, когда вы купили жесткий диск емкостью 500 ГБ, а операционная система видит заметно меньше, например, только 465 ГБ. Ответ кроется все в тех же приставках и бардаке в их применении. Зато маркетологи знают, как можно буквально по мановению волшебной палочки увеличить емкость дисков своей компании. Достаточно посчитать ее по своей собственной методике.

Производитель может придерживаться при расчетах объема диска международной системы СИ, где гигабайт это 10 9 и напишет на этикетке диска емкостью 500 млрд. байт, что он на 500 ГБ. Когда вы его подключите к компьютеру, то Windows будет считать в двоичной системе и насчитает только 465 ГБ. Причем чем больше емкость диска, тем больше разница между этикеткой и реально доступным объемом. Более того, производитель может посчитать каким-нибудь еще способом, допустим, гигабайт окажется равным 1 млн. килобайт.

В чем измеряется скорость интернета

Вы еще не потерялись во всех этих хитросплетениях? Тогда новая порция чудес ждет вас. Дело в том, что скорость передачи данных в компьютерных сетях измеряется в битах в секунду. Именно в битах, а не в байтах. Это достаточно просто проверить, достаточно посмотреть, что пишет Windows в свойствах вашего подключения к интернету, там окажется, скорее всего, 100 Мбит/с или 1 Гбит/с.

Провайдеры точно так же указывают в тарифах именно биты в секунду. Причем здесь повторяется ситуация с байтами. Согласно международной системе СИ 1 Мбит это 1 000 000 бит, а в двоичной системе он должен называться мебибит и равняться 1 048 576 бит. Поэтому, что на самом деле имеет человек в виду говоря «мегабит», сказать однозначно нельзя.

Чтобы не мучиться с калькулятором, пересчитывая одни единицы в другие, вы можете воспользоваться нашим конвертером величин. Просто введите в поле число и выберите в выпадающем списке, в какой оно единице измерения. Нажмите кнопку «Пересчитать» и калькулятор сам пересчитает его в другие единицы измерения объема информации.

Калькулятор единиц объема информации
Число:
Разделять разряды:
Байт: Бит:
Килобайт: Килобит:
Мегабайт: Мегабит:
Гигабайт: Гигабит:
Терабайт: Терабит:
Петабайт: Петабит:
Эксабайт: Эксабит:
Зеттабайт: Зеттабит:
Йоттабайт: Йоттабит:

Конечно, новичкам трудно сразу разобраться во всей этой путанице, с другой стороны это особо и не требуется. Главное помнить, что 8 бит равно 1 байту, остальные величины кратны 1 024, вес файлов измеряется в байтах, а скорость интернета в битах. Этого вполне достаточно для нормальной работы за компьютером. А чтобы вам было легче сориентироваться, насколько много весит тот или иной файл, приведем в качестве справки объем некоторых носителей информации.

  • Дискета 3,5″ (если вы знаете, что это такое) — 1.44 МБ
  • CD диск — 700 МБ
  • DVD диск (однослойный) — 4.7 ГБ
  • Blu-ray диск (однослойный) — 25 ГБ
  • HDD (макс. емкость в настоящее время для домашнего компьютера) — 12 ТБ

Вот собственно и все, что мы вам хотели рассказать про единицы измерения информации в операционной системе компьютера. Рекомендуем сохранить данную страницу в закладки, чтобы иметь возможность быстро перевести килобайты в другие единицы измерения информации с помощью нашего конвертера.

Источник

Читайте также:  Годовой объем производства при дополнительных инвестициях
Поделиться с друзьями
Объясняем