Как измеряется объем данных

Единицы измерения объема данных и ёмкости памяти

Итак, в мы выяснили, что в большинстве современных кодировок под хранение на электронных носителях информации одного символа текста отводится 1 байт. Т.е. в байтах измеряется объем (V), занимаемый данными при их хранении и передаче (файлы, сообщения).

Объем данных (V) – количество байт, которое требуется для их хранения в памяти электронного носителя информации.

Память носителей в свою очередь имеет ограниченную ёмкость, т.е. способность вместить в себе определенный объем. Ёмкость памяти электронных носителей информации, естественно, также измеряется в байтах.

Однако байт – мелкая единица измерения объема данных, более крупными являются килобайт, мегабайт, гигабайт, терабайт…

Следует запомнить, что приставки “кило”, “мега”, “гига”… не являются в данном случае десятичными. Так “кило” в слове “килобайт” не означает “тысяча”, т.е. не означает “10 3 ”. Бит – двоичная единица, и по этой причине в информатике удобно пользоваться единицами измерения кратными числу “2”, а не числу “10”.

1 байт = 2 3 =8 бит, 1 килобайт = 2 10 = 1024 байта. В двоичном виде 1 килобайт = &10000000000 байт.

Т.е. “кило” здесь обозначает ближайшее к тысяче число, являющееся при этом степенью числа 2, т.е. являющееся “круглым” числом в двоичной системе счисления.

Именование Обозначение Значение в байтах
Килобайт 1 Кb 2 10 b 1 024 b
Мегабайт 1 Mb 2 10 Kb = 2 20 b 1 048 576 b
Гигабайт 1 Gb 2 10 Mb = 2 30 b 1 073 741 824 b
Терабайт 1 Tb 2 10 Gb = 2 40 b 1 099 511 627 776 b
Петабайт 1 PiB 2 10 Tb = 2 5 0 b примерно 10 15 байт
Эксабайт 1 EiB 2 10 Pib = 2 6 0 b примерно 10 18 байт
Зеттабайт 1 ZiB 2 10 Eib = 2 7 0 b примерно 10 21 байт
Йоттабайт 1 YiB 2 10 Zib = 2 8 0 b примерно 10 24 байт

В связи, с тем, что единицы измерения объема и ёмкости носителей информации кратны 2 и не кратны 10, большинство задач по этой теме проще решается тогда, когда фигурирующие в них значения представляются степенями числа 2.

Рассмотрим пример подобной задачи и ее решение:

Пример: В текстовом файле хранится текст объемом в 400 страниц. Каждая страница содержит 3200 символов. Если используется кодировка KOI-8 (8 бит на один символ), то размер файла составит:

1) Определяем общее количество символов в текстовом файле. При этом мы представляем числа, кратные степени числа 2 в виде степени числа 2, т.е. вместо 4, записываем 2 2 и т.п. Для определения степени можно использовать Таблицу 7.

символов.

2) По условию задачи 1 символ занимает 8 бит, т.е. 1 байт => файл занимает 2 7 *10000 байт.

3) 1 килобайт = 2 10 байт => объем файла в килобайтах равен:

.

Источник

В чём измеряется количество данных и какие объёмы информации востребованы сегодня

Объём — основная количественная характеристика информации. Например, величина небольшой заметки измеряется числом знаков или слов, а объём книги оценивается уже в более крупных единицах — страницах. Свои меры количества существуют и для электронных носителей. Из курса информатики мы знаем, что компьютеры работают по принципу «да или нет», то есть регистрируют либо наличие сигнала, либо его отсутствие. В числовом выражении эти два состояния обозначаются как 1 и 0. Графически любой процесс обработки информации представляет собой уникальную последовательность нулей и единиц. Это и есть двоичная система, которая лежит в основе любого компьютерного алгоритма.

Битом в двоичном исчислении называют наименьший, неделимый объем информации. Иными словами, бит — это 0 либо 1. Любые массивы данных представляют собой комбинации из множества бит. Даже если взять пару бит, то в сочетании они смогут принять уже четыре формы: 01,10,11 и 00. Последовательность из восьми бит потенциально имеет 256 возможных сочетаний нуля и единицы. Этого уже достаточно, чтобы загрузить в компьютер, например, целый алфавит или систему цифр.

Читайте также:  Генератор аврора объем масла

Байт и более крупные единицы

Восемь бит, расположенных в определённой последовательности, составляют один байт или октет — наименьший информационный блок, к которому система обращается напрямую. Именно этими блоками оперируют компьютерные программы. Вот почему в Проводнике Windows объём каждого файла отображается именно в байтах.

Множества байт обозначают при помощи приставок, которые используются в любых математических расчётах: «кило-», «мега-», «гига-» и так далее. Мы знаем, например, что приставка «кило-» означает 10 в 3 степени, то есть 1000. Поэтому начинающие изучать информатику путаются. Проблема в том, что в этой науке используются те же самые приставки, но кратны они не 1000, а 1024, то есть 2 в 10 степени. Таким образом, в килобайте содержится не 1000 байт, а 1024. В теории уникальные обозначения для различных объемов компьютерных данных существуют, и они могли бы путаницу устранить. Эти обозначения образуются путём изменения последнего слога обычной приставки на слог «би» — например, кибибайт, гибибайт и так далее. Однако на практике эти обозначения не используются.

Путаницей с радостью пользуются в собственных интересах производители жёстких дисков. Типична ситуация, когда человек покупает винчестер, например, на 500 гигабайт, но, подключив его к компьютеру, видит, что памяти на нём значительно меньше — скажем, 465. Причина кроется в том, что производитель при расчёте пользуется международной системой единиц, согласно которой один гигабайт равен 10 в 9 степени (1 млрд) байт. А вот операционная система ориентирована на двоичную систему исчисления, в которой 1 гигабайт — это 1 073 741 824 байт. Отсюда разница. И чем больше памяти на носителе, тем значительнее может быть расхождение между заявленным и реальным объемом.

На современном этапе развития IT-индустрии наиболее часто используются следующие единицы:

  • Мегабайт (Мб), 1024 килобайта. Обычно в них измеряется размер небольших музыкальных файлов, фотографий и непродолжительных видеозаписей.
  • Гигабайт (Гб), 1024 мегабайта. В гигабайтах измеряют вес фильмов в высоком качестве, современных видеоигр и т.п.
  • Терабайт (Тб), 1024 Гб. На сегодняшний день это самая крупная информационная единица, с которой имеет дело обычный пользователь. Причём в терабайтах на домашних компьютерах измеряются объёмы не отдельных файлов, а целых локальных дисков.

Более крупные единицы — петабайт, эксабайт, зеттабайт, йоттабайт — тоже существуют, но домашние и офисные компьютеры столь огромными массивами данных не оперируют. Впрочем, это лишь вопрос времени.

Какие объёмы информации обрабатывают современные компьютеры

XXI век называют эпохой информации неслучайно. Ещё в 1975 году появился термин «информационный взрыв», то есть лавинообразное увеличение количества информации в мире: научных работ, журналистских статей и других публикаций. Когда интернет пришел в каждый дом, информационный взрыв достиг и вовсе невиданных масштабов. Согласно статистике, количество цифровых данных в мире сегодня удваивается каждые полтора года. Вот первая причина, по которой объем памяти на электронных носителях постепенно увеличивается: чем больше информации появляется, тем больше места требуется для ее хранения. Первый жёсткий диск с ёмкостью 1 Тб появился на рынке в 2007-м году, то есть сравнительно недавно. Сейчас, в 2019-м, уже активно распространяются винчестеры объёмом до 14 Тб. Это если говорить об отдельных домашних и офисных ПК. Что же касается масштабных организаций наподобие сотовых операторов и крупных майнинговых ферм, то они оперируют уже петабайтами данных.

Количество информации не единственная причина, по которой емкость цифровых носителей увеличивается год от года. Еще лет десять назад трудно было представить себе компьютерную игру размером в 100 Гб. Сегодня таких игр становится всё больше. Фотореалистичная графика, высокое разрешение и сложная система обработки изображения требуют не только мощного «железа», но и значительного пространства на диске. Другой пример — фильмы. Если кинолента средней продолжительности в разрешении 1080 p занимает всего два-три гигабайта памяти, то в разрешении 4K тот же фильм будет «весить» уже все 30 Гб. При этом 4K — технология уже не самая современная, и экраны с разрешением 8K уже существуют.

Читайте также:  5062 coloplast conveen мешок для сбора мочи мочеприемник прикроватный объем 1500мл трубка 90 см

Словом, чем больше информации вложено в продукт, тем больше места требуется для ее содержания и обработки. Однако сами устройства для хранения данных постепенно как раз уменьшаются в размерах. Это особенно заметно, если проследить историю развития носителей и сравнить, например, первый накопитель на магнитных дисках с его потомками, которые служат нам сегодня. И подобная тенденция обнадеживает, ведь объемы данных, которые сегодня появляются в мире, с каждым годом не просто планомерно увеличиваются, а растут экспоненциально. Информационный взрыв уже произошёл, и мы с вами находимся в его эпицентре.

Источник

Информатика. 7 класс

Конспект урока

Единицы измерения информации

Перечень вопросов, рассматриваемых в теме:

  • Алфавитный подход к измерению информации.
  • Наименьшая единица измерения информации.
  • Информационный вес одного символа алфавита и информационный объём всего сообщения.
  • Единицы измерения информации.
  • Задачи по теме урока.

Каждый символ информационного сообщения несёт фиксированное количество информации.

Единицей измерения количества информации является бит – это наименьшаяединица.

1 Кб (килобайт) = 1024 байта= 2 10 байтов

1 Мб (мегабайт) = 1024 Кб = 2 10 Кб

1 Гб (гигабайт) = 1024 Мб = 2 10 Мб

1 Тб (терабайт) =1024 Гб = 2 10 Гб

Формулы, которые используются при решении типовых задач:

Информационный вес символа алфавита и мощность алфавита связаны между собой соотношением: N = 2 i .

Информационный объём сообщения определяется по формуле:

I – объём информации в сообщении;

К – количество символов в сообщении;

i – информационный вес одного символа.

  1. Босова Л. Л. Информатика: 7 класс. // Босова Л. Л., Босова А. Ю. – М.: БИНОМ, 2017. – 226 с.
  1. Босова Л. Л. Информатика: 7–9 классы. Методическое пособие. // Босова Л. Л., Босова А. Ю., Анатольев А. В., Аквилянов Н.А. – М.: БИНОМ, 2019. – 512 с.
  2. Босова Л. Л. Информатика. Рабочая тетрадь для 7 класса. Ч 1. // Босова Л. Л., Босова А. Ю. – М.: БИНОМ, 2019. – 160 с.
  3. Босова Л. Л. Информатика. Рабочая тетрадь для 7 класса. Ч 2. // Босова Л. Л., Босова А. Ю. – М.: БИНОМ, 2019. – 160 с.
  4. Гейн А. Г. Информатика: 7 класс. // Гейн А. Г., Юнерман Н. А., Гейн А.А. – М.: Просвещение, 2012. – 198 с.

Теоретический материал для самостоятельного изучения.

Любое сообщение несёт некоторое количество информации. Как же его измерить?

Одним из способов измерения информации является алфавитный подход, который говорит о том, что каждый символ любого сообщения имеет определённый информационный вес, то есть несёт фиксированное количество информации.

Сегодня на уроке мы узнаем, чему равен информационный вес одного символа и научимся определять информационный объём сообщения.

Что же такое символ в компьютере? Символом в компьютере является любая буква, цифра, знак препинания, специальный символ и прочее, что можно ввести с помощью клавиатуры. Но компьютер не понимает человеческий язык, он каждый символ кодирует. Вся информация в компьютере представляется в виде нулей и единичек. И вот эти нули и единички называются битом.

Информационный вес символа двоичного алфавита принят за минимальную единицу измерения информации и называется один бит.

Алфавит любого понятного нам языка можно заменить двоичным алфавитом. При этом мощность исходного алфавита связана с разрядностью двоичного кода соотношением: N = 2 i .

Эту формулу можно применять для вычисления информационного веса одного символа любого произвольного алфавита.

Алфавит древнего племени содержит 16 символов. Определите информационный вес одного символа этого алфавита.

Составим краткую запись условия задачи и решим её:

16 = 2 i , 2 4 = 2 i , т. е. i = 4

Ответ: i = 4 бита.

Информационный вес одного символа этого алфавита составляет 4 бита.

Сообщение состоит из множества символов, каждый из которых имеет свой информационный вес. Поэтому, чтобы вычислить объём информации всего сообщения, нужно количество символов, имеющихся в сообщении, умножить на информационный вес одного символа.

Математически это произведение записывается так: I = К · i.

Например: сообщение, записанное буквами 32-символьного алфавита, содержит 180 символов. Какое количество информации оно несёт?

32 = 2 i , 2 5 = 2 i , т.о. i = 5,

I = 180 · 5 = 900 бит.

Читайте также:  Как найти объем парапета

Ответ: I = 900 бит.

Итак, информационный вес всего сообщения равен 900 бит.

В алфавитном подходе не учитывается содержание самого сообщения. Чтобы вычислить объём содержания в сообщении, нужно знать количество символов в сообщении, информационный вес одного символа и мощность алфавита. То есть, чтобы определить информационный вес сообщения: «сегодня хорошая погода», нужно сосчитать количество символов в этом сообщении и умножить это число на восемь.

I = 23 · 8 = 184 бита.

Значит, сообщение весит 184 бита.

Как и в математике, в информатике тоже есть кратные единицы измерения информации. Так, величина равная восьми битам, называется байтом.

Бит и байт – это мелкие единицы измерения. На практике для измерения информационных объёмов используют более крупные единицы: килобайт, мегабайт, гигабайт и другие.

1 Кб (килобайт) = 1024 байта= 2 10 байтов

1 Мб (мегабайт) = 1024 Кб = 2 10 Кб

1 Гб (гигабайт) = 1024 Мб = 2 10 Мб

1 Тб (терабайт) =1024 Гб = 2 10 Гб

Итак, сегодня мы узнали, что собой представляет алфавитный подход к измерению информации, выяснили, в каких единицах измеряется информация и научились определять информационный вес одного символа и информационный объём сообщения.

Материал для углубленного изучения темы.

Как текстовая информация выглядит в памяти компьютера.

Набирая текст на клавиатуре, мы видим привычные для нас знаки (цифры, буквы и т.д.). В оперативную память компьютера они попадают только в виде двоичного кода. Двоичный код каждого символа, выглядит восьмизначным числом, например 00111111. Теперь возникает вопрос, какой именно восьмизначный двоичный код поставить в соответствие каждому символу?

Все символы компьютерного алфавита пронумерованы от 0 до 255. Каждому номеру соответствует восьмиразрядный двоичный код от 00000000 до 11111111. Этот код ‑ просто порядковый номер символа в двоичной системе счисления.

Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера, называется таблицей кодировки.Таблица для кодировки – это «шпаргалка», в которой указаны символы алфавита в соответствии порядковому номеру. Для разных типов компьютеров используются различные таблицы кодировки.

Таблица ASCII (или Аски), стала международным стандартом для персональных компьютеров. Она имеет две части.

В этой таблице латинские буквы (прописные и строчные) располагаются в алфавитном порядке. Расположение цифр также упорядочено по возрастанию значений. Это правило соблюдается и в других таблицах кодировки и называется принципом последовательного кодирования алфавитов. Благодаря этому понятие «алфавитный порядок» сохраняется и в машинном представлении символьной информации. Для русского алфавита принцип последовательного кодирования соблюдается не всегда.

Запишем, например, внутреннее представление слова «file». В памяти компьютера оно займет 4 байта со следующим содержанием:

01100110 01101001 01101100 01100101.

А теперь попробуем решить обратную задачу. Какое слово записано следующим двоичным кодом:

01100100 01101001 01110011 01101011?

В таблице 2 приведен один из вариантов второй половины кодовой таблицы АSСII, который называется альтернативной кодировкой. Видно, что в ней для букв русского алфавита соблюдается принцип последовательного кодирования.

Вывод: все тексты вводятся в память компьютера с помощью клавиатуры. На клавишах написаны привычные для нас буквы, цифры, знаки препинания и другие символы. В оперативную память они попадают в форме двоичного кода.

Из памяти же компьютера текст может быть выведен на экран или на печать в символьной форме.

Сейчас используют целых пять систем кодировок русского алфавита (КОИ8-Р, Windows, MS-DOS, Macintosh и ISO). Из-за количества систем кодировок и отсутствия одного стандарта, очень часто возникают недоразумения с переносом русского текста в компьютерный его вид. Поэтому, всегда нужно уточнять, какая система кодирования установлена на компьютере.

Разбор решения заданий тренировочного модуля

№1. Определите информационный вес символа в сообщении, если мощность алфавита равна 32?

Информационный вес символа алфавита и мощность алфавита связаны между собой соотношением: N = 2 i .

32 = 2 i , 32 – это 2 5 , следовательно, i =5 битов.

№2. Выразите в килобайтах 2 16 байтов.

2 16 можно представить как 2 6 · 2 10 .

2 6 = 64, а 2 10 байт – это 1 Кб. Значит, 64 · 1 = 64 Кб.

№3. Тип задания: выделение цветом

8 х = 32 Кб, найдите х.

8 можно представить как 2 3 . А 32 Кб переведём в биты.

Источник

Поделиться с друзьями
Объясняем