Алфавитный подход к оценке количества информации. формула хартли — в помощь студенту

Алфавитный подход к оценке количества информации. Формула Хартли - в помощь студентуАлфавитный подход к оценке количества информации. Формула Хартли - в помощь студенту

Алфавитный подход к оценке количества информации. Формула Хартли - в помощь студенту

Описание термина

Понятие мощности алфавита находится в основании изучения информатики. Алфавитом принято называть набор многочисленных символов. Сумма всех их в определённом языке и есть алфавитная мощность. Иными словами, это количество всех символов, входящих в конкретно взятый язык. Сюда входят не только буквы, но и прочие обозначения, в частности:

alt

Узнай стоимость своей работы

Бесплатная оценка заказа!

Оценим за полчаса!

Алфавитный подход к оценке количества информации. Формула Хартли - в помощь студенту

  • числа;
  • спецсимволы;
  • двоеточия;
  • пробел;
  • скобки;
  • запятые;
  • точки;
  • многоточия и прочее.

Это определение считается обобщённым и не принимает во внимание вычисления информационной составляющей сообщения. Она может содержать в себе числа, знаки препинания и прочее.

В этом случае прибегают к использованию другого способа. Его суть основывается на том, что любая буква, цифра или знак обладают собственным информационным объемом данных.

Компьютер работает с этим информационным кодом и распознает то, что было написано.

Основным постулатом в информатике является тот факт, что устройство разбирает введённую информацию исключительно в двоичном коде в форме нуля и единицы.

В итоге получается, что абсолютно любой символ алфавита может быть успешно закодирован при помощи соответствующего подбора этих двух цифровых символов.

Самая маленькая последовательность, применяемая при обозначении какой-либо цифры, буквы или другого знака, состоит из двух элементов.

alt

Узнай стоимость своей работы

Бесплатная оценка заказа!
Читайте также:  Приемы риск-менеджмента - в помощь студенту

Оценим за полчаса!

Информационная масса отдельно взятого символа обычно изображается в форме информационной стандартной измерительной единицы, которая называется «бит». Восемь битов становятся равны одному байту.

Отображение символов в двоичном коде

Алфавитная мощность может быть использована на практике только при наличии двоичного кода. В качестве примера можно использовать упрощённый алфавит, состоящий всего из четырёх символов. В этом случае разрядность их и информационное представление описываются следующим образом:

  • 1 — 00;
  • 2 — 01;
  • 3 — 10;
  • 4 — 11.

Алфавитный подход к оценке количества информации. Формула Хартли - в помощь студенту

Из этого списка можно сделать вывод о том, что если алфавитная мощность равняется 4, то масса отдельного единичного символа будет составлять 2 бита. Если же есть алфавит, состоящий из 8 символов, то при подборе двоичного трёхзначного кода для него комбинационное количество будет следующим:

  • 1 — 000;
  • 2 — 001;
  • 3 — 010;
  • 4 — 011;
  • 5 — 100;
  • 6 — 101;
  • 7 — 110;
  • 8 — 111.

Иными словами, если алфавитная мощность равна 8, то вес отдельно взятого символа для двоичного трёхзначного кода составит 3 бита.

Вычисление мощности алфавита

Численность знаков в коде и мощность алфавита всегда выражают определённую зависимость. Для того чтобы определить информационный объём, который заключается в сообщении, прибегают к специальному способу измерения, которое выражается в формуле мощности алфавита: N = 2 в n -ной степени.

Алфавитный подход к оценке количества информации. Формула Хартли - в помощь студенту

Эта формула была изобретена американским инженером Ральфом Хартли более сотни лет тому назад.

Она применяется для работы с равновероятными событиями и используется для определения мощности конкретного буквенного набора, которая обозначается буквой N (информационная масса или объём).

n означает численность бит в словесной единице, иными словами, количество знаков внутри двоичного кода. Так, если n равен 1, то N тоже равен 1, при n = 2 N = 4, при n = 3 N = 8, при n = 4 N = 16.

Чтобы сформулировать теорию о численности информации в набранном словосочетании, пользуются формулой I=K*i. В этом случае К обозначает численность всех символов в предложении, а i — это информационная масса символа.

При ответе на вопрос, как найти мощность алфавита, нужно сказать, что в русском языке 33 буквы, поэтому это можно выразить как N = 33. Для сравнения, аналогичный показатель в английском, немецком и французском языках равняется 26, в испанском — 27. Венгерский язык, например, является 40-символьным.

Существует также и клавиатурный язык, куда входят не только буквы, но и дополнительные знаки. Так, в русском языке есть ещё 10 цифр и 11 символов, а также пробел и пара скобок.

Их мощность прибавляется к аналогичному буквенному показателю, и на выходе получается N = 33+10+11+1+2=57.

В некоторых случаях букву «ё» не выделяют в качестве отдельного самостоятельного символа, и в таком случае полная мощность русского алфавита становится равна 56.

Почти всегда при наборе текста на компьютерах и других электронных устройствах приходится сталкиваться с написанием различных символов. К ним следует отнести:

  • заглавные и жирные буквы;
  • курсив;
  • скобки;
  • знаки препинания;
  • вычислительные операции и прочее.

По всем расчётам получается, что мощность компьютерного алфавита составляет 256 различных символов и вариантов. В соответствии с формулой Хартли, N = 256, а i — масса любого из значков в клавиатурном алфавите соответствует одному байту, или восьми битам.

Алфавитный подход к оценке количества информации. Формула Хартли - в помощь студенту

Размер любой напечатанной фразы может быть вычислен по формуле V=K ⋅ log2N. В этом случае N обозначает количество всех символов в алфавите, а K — это численность знаков непосредственно в напечатанной фразе. Так, например, имеется произвольный текст объёмом в 25 листов. На каждом из них расположено по 45 строчек текста, содержащих по 58 символов.

Исходя из этого, на любой отдельной странице будет 45*58 = 2610 байт информации. В целом же по всему тексту этот объём будет равен 2610*25 = 65250 байт. Для обозначения мощности алфавита в информатике общепринятым вариантом является буква N из формулы Хартли. Именно ее чаще всего указывают в большинстве учебников и профессиональной литературе.

В кодовой таблице ASCII используют восьмибитную кодировку текстовых сообщений.

Она позволяет полностью вместить основной набор символов кириллического и латинского алфавитов как в строчном, так и в прописном вариантах.

Также с её помощью можно отобразить знаки препинания, цифры и прочие базовые знаки. Часто пользователям приходится иметь дело с более крупными объёмами, состоящими из триллионов байтов.

Читайте также:  Гностицизм - в помощь студенту

Для удобства их всегда переводят в увеличенные величины — кило-, мега-, гигабайты и прочее. Для их упрощённого обозначения используются специальные сокращения: Кб, Мб, Гб и так далее. 1 Кб равняется 1024 байтам (2 байта в десятой степени), 1 Мб составляет 1024 Кб (2 Кб в десятой степени) и так далее. Исходя из этого, 65250 байт будут составлять 63,72 килобайта.

Поскольку один отдельный символ состоит из 8 битов, то устанавливать их кодировку целиком не представляется возможным. Вместо этого предпочтительнее образовать кодировку трёхбитовых комбинаций. Расчёт этого действия проводится по формуле Хартли, где n-ная степень будет равняться трём. В результате получается N, равная 8.

При определении мощности чаще всего используют алфавитный подход. Он говорит о том, что объём информации, заложенной в тексте, зависит исключительно от мощности самого алфавита и размера сообщения (то есть количества символов, содержащихся в нём). Этот показатель не имеет никакой связи со смысловым наполнением для человека.

Примеры расчёта мощности

Алфавитный подход к оценке количества информации. Формула Хартли - в помощь студенту

От пользователей или обучающихся в задачах часто требуют научиться определять информационный объём какого-либо сообщения, приняв информационный вес символа за один байт. Так, в отрывке из поэмы Н. Н. Некрасова «Крестьянские дети»:

«Однажды, в студеную зимнюю пору,

Я из лесу вышел; был сильный мороз»

будет 67 символов вместе с пробелами, то есть, в соответствии с условиями задания, 67 байт. Их количество умножают на 8 (количество битов в байте), и на выходе получается 536 битов.

Таким образом, зная в теории суть мощности, можно без проблем определять информационный объем различных сообщений.

Источник: https://nauka.club/informatika/moshchnost-alfavita.html

Алфавитный (объёмный) подход к измерению информации — урок. Информатика, 10 класс

Алфавитный (объёмный) подход к измерению информации позволяет определить количество информации, заключенной в тексте, записанном с помощью некоторого алфавита.

Алфавит — множество используемых символов в языке.

Обычно под алфавитом понимают не только буквы, но и цифры, знаки препинания и пробел.

Мощность алфавита ((N)) — количество символов, используемых в алфавите.

Например, мощность алфавита из русских букв равна (32) (буква ё обычно не используется).

  • Если допустить, что все символы алфавита встречаются в тексте с одинаковой частотой (равновероятно), то количество информации, которое несет каждый символ, вычисляется по формуле Хартли:
  • i=log2N,
  • где (N) — мощность алфавита.
  • Формула Хартли задает связь между количеством возможных событий (N) и количеством информации(i):
  • N=2i

Из базового курса информатики известно, что в компьютерах используется двоичное кодирование информации. Для двоичного представления текстов в компьютере чаще всего используется равномерный восьмиразрядный код. С его помощью можно закодировать алфавит из (256) символов, поскольку 256=28.

В стандартную кодовую таблицу (например, ASCII) помещаются все необходимые символы: английские и русские прописные и строчные буквы, цифры, знаки препинания, знаки арифметических операций, всевозможные скобки и пр.

В двоичном коде один двоичный разряд несет одну единицу информации, которая называется 1 бит.

Например, в (2)-символьном алфавите каждый символ «весит» (1) бит (log22=1); в (4)-символьном алфавите каждый символ несет (2) бита информации (log24=2); в (8)-символьном — (3) бита (log28=3) и т. д.

Один символ из алфавита мощностью (256) (28) несет в тексте (8) битов информации. Такое количество информации называется байтом.

Информационный объем текста в памяти компьютера измеряется в байтах. Он равен количеству знаков в записи текста.

Для измерения информации используются и более крупные единицы:

Название единицы измерения Численная величина в байтах
210
220 (1024) килобайт1 048 576  байт
230 (1024) мегабайт1 073 741 824 байт
240 (1024) гигабайт 1 099 511 627 776 байт
250 (1024) терабайт 1 125 899 906 842 624 байт
260 (1024) петабайт  1 152 921 504 606 846 976 байт
270 (1024) эксабайт  1 180 591 620 717 411 303 424 байт
280 (1024) зеттабайт1208925819614629174706176 байт

Единицы измерения количества информации, в названии которых есть приставки «кило», «мега» и т. д., с точки зрения теории измерений не являются корректными, поскольку эти приставки используются в метрической системе мер, в которой в качестве множителей кратных единиц используется коэффициент

 (10), где (n = 3, 6, 9) и т. д.

Для устранения этой некорректности Международная электротехническая комиссия, занимающаяся созданием стандартов для отрасли электронных технологий, утвердила ряд новых приставок для единиц измерения количества информации: киби (kibi), меби (mebi), гиби (gibi), теби (tebi), пети (peti), эксби (exbi). Однако пока используются старые обозначения единиц измерения количества информации, и требуется время, чтобы новые названия начали широко применяться.

Обрати внимание!

Проблема применения десятичных приставок к единицам измерения в двоичном счислении — ссылка

Последовательность действий при переводе одних единиц измерения информации в другие приведена на следующей схеме:

Алфавитный подход к оценке количества информации. Формула Хартли - в помощь студенту

  1. Если весь текст состоит из (K) символов, то при алфавитном подходе объём (V) содержащейся в нем информации равен:
  2. V=K⋅i
  3. где (i) — информационный вес одного символа в используемом алфавите.
  4. Зная, что i=log2N, данную выше формулу можно представить в другом виде:
  5. если количество символов алфавита равно (N), а количество символов в записи сообщения — (K), то информационный объем (V) данного сообщения вычисляется по формуле:
  6. V=K⋅log2N

При алфавитном подходе к измерению информации информационный объем текста зависит только от размера текста и от мощности алфавита, а не от содержания. Поэтому нельзя сравнивать информационные объемы текстов, написанных на разных языках, по размеру текста.

Пример:

1. Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего предложения: Белеет Парус Одинокий В Тумане Моря Голубом!

  • Решение.
  • Так как в предложении (44) символа (считая знаки препинания и пробелы), то информационный объем вычисляется по формуле:
  • V=44⋅1 байт=44 байта=44⋅8 бит=352 бита

2. Объем сообщения равен (11) Кбайт. Сообщение содержит (11 264) символа. Какова мощность алфавита?

  1. Решение.
  2. Выясним, какое количество бит выделено на (1) символ. Для этого переведем объем сообщения в биты:
  3. 11 Кбайт=11⋅210 байт=11⋅210⋅23 бит=11⋅213 бит и разделим его на число символов.
  4. На (1) символ приходится: 11⋅21311264=11⋅21311⋅210=23=8 бит.
  5. Мощность алфавита определяем из формулы Хартли: N=28=256 символов.

Источники:

Семакин И. Г. Информатика и ИКТ. Базовый уровень : учебник для 10-11 классов / И. Г. Семакин, Е. К. Хеннер. — 8-е изд. — М. : БИНОМ. Лаборатория знаний, 2012, стр. 17-20Информатика и ИКТ. Задачник-практикум: в 2т. Т. 1 / Л. А. Залогова [и др.] ; под ред. И. Г. Семакина, Е. К. Хеннера. — 3-е изд. — М. : БИНОМ. Лаборатория знаний, 2011, стр. 18-19

Самылкина Н. Н. Информатика : все темы для подготовки к ЕГЭ. (В помощь старшекласснику). М. : Эксмо, 2011, стр. 12-13

Источник: https://www.yaklass.ru/p/informatika/10-klass/informatciia-i-informatcionnye-protcessy-11955/izmerenie-informatcii-11900/re-8ec31838-8317-451a-94cc-0ebdcc4e1e32

Измерение информации. меры информации. подходы к определению количества информации

Люди обмениваются информацией в форме сообщений. Сообщение — это форма представления информации в виде речи, текстов, жестов, взглядов, изображений, цифровых данных, графиков, таблиц и т.п.

Одно и то же информационное сообщение (статья в газете, объявление, письмо, телеграмма, справка, рассказ, чертёж, радиопередача и т.п.) может содержать разное количество информации для разных людей — в зависимости от их предшествующих знаний, от уровня понимания этого сообщения и интереса к нему.

В информатике используются различные подходы к измерению информации:

Содержательный подход к измерению информации. Сообщение – информативный поток, который в процессе передачи информации поступает к приемнику.

Сообщение несет информацию для человека, если содержащиеся в нем сведения являются для него новыми и понятными Информация — знания человека ? сообщение должно быть информативно.

Если сообщение не информативно, то количество информации с точки зрения человека = 0. (Пример: вузовский учебник по высшей математике содержит знания, но они не доступны 1-класснику)

Алфавитный подход к измерению информации не связывает кол-во информации с содержанием сообщения. Алфавитный подход — объективный подход к измерению информации. Он удобен при использовании технических средств работы с информацией, т.к. не зависит от содержания сообщения.

Кол-во информации зависит от объема текста и мощности алфавита. Ограничений на max мощность алфавита нет, но есть достаточный алфавит мощностью 256 символов. Этот алфавит используется для представления текстов в компьютере.

Поскольку 256=28, то 1символ несет в тексте 8 бит информации.

  • Алфавит — упорядоченный набор символов, используемый для кодирования сообщений на некотором языке.
  • Мощность алфавита — количество символов алфавита.
  • Двоичный алфавит содержит 2 символа, его мощность равна двум.

Сообщения, записанные с помощью символов ASCII, используют алфавит из 256 символов. Сообщения, записанные по системе UNICODE, используют алфавит из 65 536 символов.

Вероятностный подход к измерения информации. Все события происходят с различной вероятностью, но зависимость между вероятностью событий и количеством информации, полученной при совершении того или иного события можно выразить формулой которую в 1948 году предложил Шеннон.

В вычислительной технике применяются две стандартные единицы измерения: бит (binary digit) и байт (byte). Если сообщение уменьшило неопределеность знаний ровно в два раза, то говорят, что сообщение несет 1 бит информации.

1 бит — объем информации такого сообщения, которое уменьшает неопределенность знания в два раза.

Для измерения информации используется и более крупные единицы:

Единицы измерения информации в вычислительной технике
1 бит
1 байт 8 бит
1 Кбайт (килобайт) 210 байт = 1024 байт 1 тыс. байт
1 Мбайт (мегабайт) 210 Кбайт = 220 байт 1 млн. байт
1 Гбайт (гигабайт) 210 Мбайт = 230 байт 1 млрд. байт
Количество информации – число, адекватно характеризующее разнообразие (структурированность, определенность, выбор состояний и т.д.) в оцениваемой системе. Количество информации часто оценивается в битах, причем такая оценка может выражаться и в долях бит (так речь идет не об измерении или кодировании сообщений).

В настоящее время получили распространение подходы к определению понятия количество информации, основанные на том, что информацию, содержащуюся в сообщении, можно нестрого трактовать в смысле её новизны или, иначе, уменьшения неопределённости наших знаний об объекте. Эти подходы используют математические понятия вероятностии логарифма.

Мера информации – критерий оценки количества информации. Обычно она задана некоторой неотрицательной функцией, определенной на множестве событий и являющейся аддитивной, то есть мера конечного объединения событий (множеств) равна сумме мер каждого события.

Подходы к определению количества информации.Формулы Хартли и Шеннона.Американский инженер Р. Хартли в 1928 г. процесс получения информации рассматривал как выбор одного сообщения из конечного наперёд заданного множества из N равновероятных сообщений, а количество информации I, содержащееся в выбранном сообщении, определял как двоичный логарифм N.
Формула Хартли: I = log2N

Допустим, нужно угадать одно число из набора чисел от единицы до ста. По формуле Хартли можно вычислить, какое количество информации для этого требуется: I = log2100  6,644. Таким образом, сообщение о верно угаданном числе содержит количество информации, приблизительно равное 6,644 единицы информации.

Приведем другие примеры равновероятных сообщений:

  1. при бросании монеты: выпала решка, выпал орел;
  2. на странице книги: количество букв чётное, количество букв нечётное.

Определим теперь, являются ли равновероятными сообщения первой выйдет из дверей здания женщина и первым выйдет из дверей здания мужчина. Однозначно ответить на этот вопрос нельзя.

Все зависит от того, о каком именно здании идет речь.

Если это, например, станция метро, то вероятность выйти из дверей первым одинакова для мужчины и женщины, а если это военная казарма, то для мужчины эта вероятность значительно выше, чем для женщины.

Для задач такого рода американский учёный Клод Шеннон предложил в 1948 г. другую формулу определения количества информации, учитывающую возможную неодинаковую вероятность сообщений в наборе.

Формула Шеннона: I = — ( p1log2 p1 + p2 log2 p2 + . . . + pN log2 pN), где pi — вероятность того, что именно i-е сообщение выделено в наборе из N сообщений.Алфавитный подход к оценке количества информации. Формула Хартли - в помощь студенту

Легко заметить, что если вероятности p1, …, pN равны, то каждая из них равна 1 / N, и формула Шеннона превращается в формулу Хартли.

Помимо двух рассмотренных подходов к определению количества информации, существуют и другие. Важно помнить, что любые теоретические результаты применимы лишь к определённому кругу случаев, очерченному первоначальными допущениями.

Читайте также:  Программирование - в помощь студенту

В качестве единицы информации Клод Шеннон предложил принять один бит (англ. bit — binary digit — двоичная цифра).

Бит в теории информации — количество информации, необходимое для различения двух равновероятных сообщений (типа орел—решка, чет—нечет и т.п.). В вычислительной технике битом называют наименьшую порцию памяти компьютера, необходимую для хранения одного из двух знаков 0 и 1, используемых для внутримашинного представления данных и команд.

Бит — слишком мелкая единица измерения. На практике чаще применяется более крупная единица — байт, равная восьми битам. Именно восемь битов требуется для того, чтобы закодировать любой из 256 символов алфавита клавиатуры компьютера (256=28).

Широко используются также ещё более крупные производные единицы информации:

1 Килобайт (Кбайт) = 1024 байт = 210 байт,
1 Мегабайт (Мбайт) = 1024 Кбайт = 220 байт,
1 Гигабайт (Гбайт) = 1024 Мбайт = 230 байт.

В последнее время в связи с увеличением объёмов обрабатываемой информации входят в употребление такие производные единицы, как:

1 Терабайт (Тбайт) = 1024 Гбайт = 240 байт,
1 Петабайт (Пбайт) = 1024 Тбайт = 250 байт.

Информационный объем сообщения (информационная емкость сообщения) – количество информации в сообщении, измеренное в битах, байтах или производных единицах (Кбайтах, Мбайтах и т. д.).

Статьи к прочтению:

Информация, количество информации

Источник: http://csaa.ru/izmerenie-informacii-mery-informacii-podhody-k/

Алфавитный подход к оценке количества информации. Формула Хартли

Оценка объема информации с точки зрения содержания оценивает количество данных с позиции минимизации неопределенных знаний.

Любой автоматизированный аппарат не имеет возможности улавливать самую суть содержимого данных, ведь автоматическая работа подразумевает лишь регистрировать электроимпульсные, либо их отсутствие. Из за подобной ситуации, ВЭМ требуются специфичный метод оценивания объема данных, который называют «алфавитный подход к определению количества информации».

Количественная оценка объема информации на основе алфавитного подхода

Метод алфавита подразумевает, что все варианты данных можно обозначить как специальный код из своеобразного количества символов, входящих в алфавит (при этом сам алфавит может быть любым).

Средства хранения данных содержат разнообразные конечные последовательности, обладающие всеми признаками информации: хранение, передача, обработка человеком и электронно-вычислительными инструментами (например, компьютеры).

Данный метод впервые описан Колмогоровым, где он отметил, что информация, содержащаяся в последовательности символов не связана с информацией непосредственного сообщения, а зависит лишь от самого маленького набора символов, которого хватает для составления кода.

Такой способ обеспечивает ситуацию, при которой объем информации оценивается максимально объективно и не находится в зависимости от адресата, ожидающего данные. Информационная составляющая несет смысловую нагрузку только в момент выбора алфавита. Иногда ней можно пренебречь полностью.

Базой для развития данного метода является оценка количества символов в данных. Исходя из этого, можно понять, что смысл имеет лишь общая длина данных, без учета информативной ценности.

Следует учитывать, что длина данных может варьироваться в зависимости от такого фактора как «мощность алфавита». Данные особенности можно понять разобрав любую текстовую информацию. Язык не имеет значения, но проще будет оперировать текстом на родном языке.

Емкость информации, алфавитная мощность. Формула количества информации (формула Хартли)

Алфавитом принято называть совокупность символов, составляющих какой-либо язык. Под этими символами подразумеваются буквенные обозначения, реже знаки, цифровые обозначения, символы пробела и так далее.

Что же такое мощность алфавита? Мощность алфавита это обобщенное совокупность всех символов, в их полном количественном представлении.

Приведем пример, как определить мощность алфавита:

  • Алфавит, на основе кириллицы – мощность 33
  • Алфавит, на основе латыни – мощность 26
  • Алфавит, на основе клавиатуры вычислительной машины – мощность 256 (с учетом всех видов символов)
  • Алфавит, на основе двоичного кода – мощность 2

При использовании метода алфавита принято считать, что каждый отдельно взятый символ данных уже подразумевает некоторую емкость данных, находящуюся в зависимости от алфавитной мощности.

Последовательность символов для обозначения текстового сообщения содержит знаков – N. При самом простейшем варианте, когда длина кодировки соответствует всего лишь одному символу, источник посылает один из N вариантов текста, с таким количеством данных, которое будет соответствовать I.

Данное равенство названо в честь ученого Хартли, создавшего базу для развития теоретических основ учения об информации. В частности его работы отвечают на такие вопросы, как – «как найти мощность алфавита?» и «как обозначается информационный объём в информатике?».

По мнению Хартли: объем данных в тексте может быть подвержен неожиданных воздействиям извне, что взаимосвязано со степенью вероятного получения данных. Если эта степень минимальна, то данные будут малоинформативны и бесполезны для дальнейшей обработки.

Обратите внимание: в формуле Хартли абсолютно пренебрегается наличие неожиданных вводных. Формула Хартли (информатика) действует лишь при одинаковой степени вероятности расстановки знаков, при самодостаточной статистике.

К примеру, укажите, как записывается формула Хартли для расчета объема данных в символе двоичного кода:

  • Таким образом, информационная емкость такого символа будет равняться 1 биту.
  • Задачи: алфавитный подход к измерению информации (Пример 1)
  • Определим размер информации одной буквы из алфавита кириллицы (буквы «ё» — не входит в расчет)
  • Решение задачи:

Предположим, что информация создается поэтапно, с последовательностью в один знак (наподобие создания телеграммы). Пусть каждый отдельно взятый знак предположительно может являться любым алфавитным символом или обозначением. На практике, это не совсем соответствует действительности, но такой подход позволяет упростить решение.

Каждый этап появления знака соответствует теоретически любому символу N. С учетом, ранее изученной формулы Хартли, в каждом символе зашифрован определенный объем информации. Как же найти мощность алфавита в информатике? По искомой формуле символ хранит 1 бит данных:

Объем данных одной отдельно взятой буквы родного алфавита равен 5 битам.

То есть, формула отражает взаимосвязь всех возможных вариантов событийности и объем данных в определяемом тексте. В данной задаче: N – символы изучаемого алфавита, I – объем данных на один символ.

Текст содержит последовательность знаков с определённым объемом данных. Что такое мощность алфавита и как определить объем данных в тексте? По формуле: Ic=K*I, где Ic – объем данных текста, I- объем данных на один символ, К – расчет символов в тексте.

Практические примеры применения формулы в решении задач

  1. Задачи: (пример 2)
  2. Требуется подсчитать объем данных во фразе «Привет», с учетом 32х-буквенного алфавита (пренебрегаем символом «ё»».

  3. Решение задачи:
  4. Подсчитаем число знаков во фразе и алфавитную мощность (что такое мощность алфавита в информатике – смотрите выше).
  5. Число знаков во фразе – 6 (К), алфавитная мощность соответствует 32 (N).
  6. Подсчитываем объем данных на заданную фразу.

  7. Перемножаем объем данных на один символ (I) и общее число символов на фразу, по ранее изученной формуле: Ic=K*I.
  8. В данном моменте возникает трудность: нам не хватает данных об объеме информации на расчет одного знака.

Применим формулу Хартли.

Так как текст набран с помощью алфавита с алфавитной мощностью соответствующей 32, мы можем уточнить, что объем данных соответствует 5 битам.

Рассчитав объем данных на один символ используемого алфавита и общий подсчет символов в изучаемой фразе, уточним объем данных фразы: Ic=K*I=6*5=30 бит.

При подобных расчетах чаще всего применяют алфавитный размер, который соответствует полной степени двух. Приведём пример: если N – 16, каждый знак содержит 4 бита данных (24 соответствует 16).

Информационные единицы

Максимум алфавитного размера не имеет никаких ограничений. Но стоит иметь в виду, что существует понятие «достаточности» алфавита; подобный вариант используется для работы на электронно-вычислительных машинах. Алфавитная мощность подобной модели соответствует 256 символам, в том числе содержит латиницу, кириллицу, цифровые обозначения, символы действий в арифметике, препинания.

Учитывая ранее полученный данные, известно, что 256 равно 28, а значит 1 знак такого вида алфавита содержит 8 бит данных. В информатике, это равно 1 байту.

При работе с данным алфавитным видом (ASCII-код) – максимально просто высчитывать количество данных в сообщении. Например, в приведенном примере: 1 знак равен 1 байту данных, что позволяет легко рассчитать общее число знаков (объем информации в виде байтов)

Предположим, что текстовое произведение среднего объема, в распечатке насчитывает около 25 листов (50 страниц). Одна страница имеет 50 строчек, а одна строчка – 60 знаков.

Рассчитаем объем одной страницы:

50*60=3000 байт информации

Рассчитаем объем всех данных произведения:

3000*50=150000 байт

Каждая схема измерения включает единицы и их производные.

При расчете крупных информационных объемов – используются килобиты, мегабиты, гигабиты, килобайты, мегабайты, гигабайты.

Источник: https://sciterm.ru/spravochnik/alfavitnij-podhod-k-ocenke-kolichestva-informacii-formula-hartli/

Формула Хартли

Не получается понять каким образом производят измерение количества информации с помощью формулы Хартли? Выход есть! Записывайтесь ко мне на репетиторский урок по информатике и ИКТ.

На своих индивидуальных уроках я делаю упор на практическое прорешивание колоссального количества различных тематических задач.

Вы не только поймете ключевой смысл формулы Хартли, но также решите порядка 10 задач, связанных с измерением количества информации.

Формула Хартли позволяет определить количество информации, которая содержится в информационном сообщении длины n.

Для дальнейшего исследования нам потребуется познакомиться с таким понятием как мощность алфавита.Мощность алфавита – это количество символов/знаков, из которых состоит рассматриваемый алфавит.

Примеры, связанные с мощностью алфавита

  1. Количество букв в русскоязычном алфавите равно 33, следовательно, мощность русского алфавита составляет 33.

  2. Количество арабских цифр, используя которые мы получаем различные числа, равно 10: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9. Следовательно, мощность алфавита арабских цифр составляет 10.

  3. Азбука Морзе оперирует закодированными информационными сообщениями, состоящими из точек и тире, следовательно, мощность азбуки Морзе составляет 2.

Аналитический (в виде формульной зависимости) вид формулы Хартли

Формула Хартли имеет следующий вид: N = mn, где

N – возможное количество различных информационных сообщений, шт;m – количество символов/знаков в рассматриваемом алфавите, шт;n – количество букв/элементов в информационном сообщении, шт.

Рассмотрим задачи, решаемые с применением формулы Хартли

Условие задачи №1:Световое табло состоит из светящихся элементов, каждый из которых может гореть одним из 4-х различных цветов. Сколько различных сигналов можно передать при помощи табло, состоящего из 4-х таких элементов, при условии, что все элементы должны гореть.

Решение:В данном примере под алфавитом необходимо понимать совокупность различных цветов, которыми могут гореть элементы. В условии задачи было сказано, что допускается четыре различных цвета, следовательно, мощность алфавита различных цветов составляет 4, то есть m = 4.

Под информационным сообщением следует понимать набор светящихся элементов. В условии упражнения говорится о 4-х подобных элементах, следовательно, длина сообщения составляет 4, то есть n = 4.

  • И осталось лишь определить количество различных сигналов, используя формулу Хартли:
  • N = mn = 44 = (22)4 = 28 = 128 [сигналов].
  • Ответ: 128

Условие задачи №2:Некоторый алфавит содержит 3 различных символа. Сколько слов длиной в 5 символов можно получить из данного алфавита (символы в слове могут повторяться)?

Решение:В данном примере конкретно не уточняется о каком типе алфавита идет речь. Можно сделать предположение, что это какой-то символьный/знаковый алфавит. В условии задачи было сказано, что рассматриваемый алфавит содержит ровно 3 различных символа, следовательно, мощность данного алфавита составляет 3, m = 3.

Под информационным сообщением следует понимать некое слово. В условии задачи говорится о словах длиной в 5 символов, следовательно, длина информационного сообщения составляет 5, то есть n = 5.

  1. И осталось лишь определить количество различных слов, используя могущественную формулу Хартли:
  2. N = mn = 35 = 243 [слова].
  3. Ответ: 243

Остались вопросы

Если у вас остались какие-либо вопросы по теме «Формула Хартли», то лаконично формулируйте и высылайте их мне на электронный адрес или записывайтесь ко мне на эффективный частный урок по информатике.

Источник: http://www.videoege.ru/informatika/formula-hartli

Ссылка на основную публикацию