1.1. Измерение информации. Алфавитный подход

Как применить алфавитный подход для измерения объема информации?

Подумай

  • Что такое алфавитный подход измерения объема информации?
  • В каких случаях используется?

Новые знания

Алфавитный подход

    Алфавитный подход к измерению информации эквивалентен ранее рассмотренному вероятностному подходу. Здесь рассматривается измерение количества информации текстового (символьного) сообщения, составленного из символов какого-нибудь алфавита. При алфавитном подходе к измерению информации количество информации не зависит от содержания. Алфавитный подход – единственный способ, дающий возможность измерения информации, обрабатываемой на компьютерах, вычислительной технике, мобильных устройствах.
   ​Основным понятием данного подхода является – алфавит. Алфавит – ограниченное множество символов, предназначенное для представления информации. Число символов алфавита называют мощностью алфавита.

   Если считать, что алфавит – это событие, то каждый из символов в сообщении можно рассматривать как одно из состояний события. Если появление символов равновероятно, то можно рассчитать, сколько бит информации несет каждый символ (Х) с помощью уравнения Хартли.

N – мощность используемого алфавита.
Xинформационный вес символа.

   Отсюда можно сделать вывод: Для вычисления информационного объема сообщения I, состоящего из К символов, необходимо информационный вес одного символа Х умножить на К.

I – информационный объем сообщения;
К – мощность;
Х – информационный вес символа.

   Величину количества информации можно назвать информационным объемом текста. Наименьшая мощность алфавита для передачи информации равна 2. Такой алфавит называется двоичным.

   В двоичном алфавите информационный вес символа равен одному биту, так как 2х = 2. Таким образом, один символ двоичного алфавита несет 1 бит информации. В дальнейшем более подробно рассмотрим алфавит внутреннего (машинного) языка компьютера – язык двоичного кодирования.

   Бит – основная единица измерения информации. Байт – информационный вес символа алфавита. В современных вычислительных системах байт состоит из восьми битов и, соответственно, может принимать одно из 256 (28) различных значений (состояний, кодов).
   ​Количество информации зависит от объема текста (от числа знаков в тексте) и от мощности алфавита.

   Пример. Сообщение, состоящее из 20 символов, записано из букв алфавита, представленного 64 символами. Какое количество информации оно несет?
​Ответ: 120 бит информации.

   Примечание: Здесь задан алфавит мощностью N=64, количество символов K=20. Тогда по формуле Хартли информационный вес (Х) составляет 6 бит, количество информации (І) составляет 20*6 = 120 бит.

Анализ задач

   Пример № 1

   Сообщение, содержащее 40 символов, составлено с помощью 32-символьного алфавита. Каков информационный объем сообщения?

Дано:
N = 32
K = 40​

Решение:
​​N = 2х => 32 = 2x  =>  x = 5
I = K * x => I = 40 * 5 => I = 200 бит.

Ответ: 200 бит.

Найти: I - ?

   Пример № 2

   Электронная книга содержит 150 страниц, на каждой странице – 40 строк, в каждой строке – 60 символов. Определите информационный объем книги.

Дано:
K1 = 150
K​​2 = 40
K3 = 60
N = 256

Решение:
​Формула для вычисления информационного объема:  
​I = К * Х
​​N = 2x => 256 = 2x => X = 8 бит;
K = K1 * K2 * K3;
K = 150 * 40 * 60; K = 360000;
I = 8 бит * 360000 = 2880000 бит = 360000​ байт = 351,56 Кб​

Ответ​: 351, 56 Кб

Найти:
I - ?

   Примечание: Мощность алфавита, используемого в компьютере, равна 256.

  Пример № 3

   Будем считать, что алфавит казахского языка состоит из 42 букв, 12 знаков препинания и 10 цифр, то есть 64-символьный алфавит. Алфавит английского языка пусть состоит из 32 символов, включающих 26 букв и 6 знаков препинания. Сравните объем информации в сообщениях, составленных из 70 символов алфавита казахского языка и из 70 символов алфавита английского языка.

Дано:
N1=64
N2=32
K1 =70
K2=70

Решение:
Формула для вычисления информационного объема:​ 
​I = К * Х
​​N = 2х1 => 64 = 2х1 => Х1 = 6 бит;
N2 = 2х2 => 32 = 2х2 => X2 = 5 бит;
I1 = 70 * 6 бит = 420 бит;
I2 = 70 * 5 бит = 350 бит​

I1 I2 = 420 350 = 1.2

​Ответ: больше в 1,2 раза 

Найти: 

I1 I2  - ?

Применение

Х = 

Ответ:  бита.

Х = 6 
N = 

Ответ: в алфавите потерянной цивилизации было  символа.

Х = 
I = 

Ответ: курьер доставил объём информации в размере  бит.

I = 


Ответ:  Кб

Вопросы

1. Что такое алфавит?

  • Алфавит - это неограниченный набор символов, который можно использовать только для чтения информации.
  • Алфавит - это бесконечный набор символов, используемых для представления информации.
  • Алфавит – ограниченное множество символов, предназначенных для представления информации.
  • Алфавит - это ограниченный набор символов, используемых только для изменения информации.

2. Что определяет мощность алфавита?

  • общее количество символов в алфавите
  • общее количество символов в алфавите предложения
  • половина от общего количества символов в алфавите
  • общее количество символов в алфавите слова

3. Что такое информационный вес символа алфавита?

  • измеряется в битах
  • вес одного слова
  • зависит от количества знаков в алфавите
  • измеряется количеством
  • не зависит от количества знаков в алфавите
  • измеряется в байтах
  • вес одного символа

4. Как можно измерить информационный объем текста с помощью алфавитного подхода? (найдите ошибки в формуле и исправьте их)

K = N•Х

5. Какие формулы и величины используются при алфавитном подходе измерения информации?

  • N = 2х
  • N=2•k
  • I=K•x

6. Что такое байт, килобайт, мегабайт, гигабайт?

          • 1000 мегабайт
          • 8000 бит
          • 1000 байт
          • 8 мегабит
          • 8 гигабит
          • 8 килобит
          • 8000 килобит
          • 8 бит
          • 1000 килобайт
          • 8000 мегабит
          Өтінемін күте тұрыңыз