Загрузить PDF
Загрузить PDF
С абсолютной частотой все довольно просто: она определяет, сколько раз конкретное число содержится в имеющемся наборе данных (объектов или значений). А вот относительная частота характеризует отношение количества конкретного числа в наборе данных. Другими словами, относительная частота – это отношение количества определенного числа к общему количеству чисел в наборе данных. Имейте в виду, что вычислить относительную частоту достаточно легко.
-
1
Соберите данные. Если вы решаете математическую задачу, в ее условии должен быть дан набор данных (чисел). В противном случае проведите эксперимент или исследование и соберите необходимые данные. Подумайте, в какой форме записать исходные данные.
- Например, нужно собрать данные о возрасте людей, которые посмотрели определенный фильм. Конечно, можно записать точный возраст каждого человека, но в этом случае вы получите довольно большой набор данных с 60-70 числами в пределах от 10 до 70 или 80. Поэтому лучше сгруппировать данные по категориям, таким как «Моложе 20», «20-29», «30-39» «40-49», «50-59» и «Старше 60». Получится упорядоченный набор данных с шестью группами чисел.
- Другой пример: врач собирает данные о температуре пациентов в определенный день. Если записать округленные числа, например, 37, 38, 39, то результат будет не слишком точным, поэтому здесь данные нужно представить в виде десятичных дробей.
-
2
Упорядочьте данные. Когда вы соберете данные, у вас, скорее всего, получится хаотичный набор чисел, например, такой: 1, 2, 5, 4, 6, 4, 3, 7, 1, 5, 6, 5, 3, 4, 5, 1. Такая запись кажется практически бессмысленной и с ней сложно работать. Поэтому упорядочьте числа по возрастанию (от меньшего к большему), например, так: 1,1,1,2,3,3,4,4,4,5,5,5,5,6,6,7.[1]
- Упорядочивая данные, будьте внимательны, чтобы не пропустить ни одного числа. Посчитайте общее количество чисел в наборе данных, чтобы убедиться, что вы записали все числа.
-
3
Создайте таблицу с данными. Собранные данные можно организовать в виде таблицы. Такая таблица будет включать три столбца и использоваться для вычисления относительной частоты. Столбцы обозначьте следующим образом:[2]
Реклама
-
1
Найдите количество чисел в наборе данных. Относительная частота характеризует, сколько раз конкретное число содержится в имеющемся наборе данных по отношению к общему количеству чисел. Чтобы найти относительную частоту, нужно посчитать общее количество чисел в наборе данных. Общее количество чисел станет знаменателем дроби, с помощью которой будет вычислена относительная частота.[3]
- В нашем примере набор данных содержит 16 чисел.
-
2
Найдите количество определенного числа. То есть посчитайте, сколько раз конкретное число встречается в наборе данных. Это можно сделать как для одного числа, так и для всех чисел из набора данных.[4]
- Например, в нашем примере число
встречается в наборе данных три раза.
- Например, в нашем примере число
-
3
Разделите количество конкретного числа на общее количество чисел. Так вы найдете относительную частоту для определенного числа. Вычисление можно представить в виде дроби или воспользоваться калькулятором или электронной таблицей, чтобы разделить два числа.[5]
Реклама
-
1
Результаты вычислений запишите в созданную ранее таблицу. Она позволит представить результаты в наглядной форме. По мере вычисления относительной частоты результаты записывайте в таблицу напротив соответствующего числа. Как правило, значение относительной частоты можно округлить до второго знака после десятичной запятой, но это на ваше усмотрение (в зависимости от требований задачи или исследования). Помните, что округленный результат не равен точному ответу.[6]
- В нашем примере таблица относительных частот будет выглядеть следующим образом:
- x : n(x) : P(x)
- 1 : 3 : 0,19
- 2 : 1 : 0,06
- 3 : 2 : 0,13
- 4 : 3 : 0,19
- 5 : 4 : 0,25
- 6 : 2 : 0,13
- 7 : 1 : 0,06
- Итого : 16 : 1,01
-
2
Представьте числа (элементы), которых нет в наборе данных. Иногда представление чисел с нулевой частотой так же важно, как и представление чисел с ненулевой частотой. Обратите внимание на собранные данные; если между данными имеются пробелы, их нужно заполнить нулями.
- В нашем примере набор данных включает все числа от 1 до 7. Но предположим, что числа 3 нет в наборе. Возможно, это немаловажный факт, поэтому нужно записать, что относительная частота числа 3 равна 0.
-
3
Выразите результаты в процентах. Иногда результаты вычислений нужно преобразовать из десятичных дробей в проценты. Это общепринятая практика, потому что относительная частота характеризует процент случаев появления определенного числа в наборе данных. Чтобы преобразовать десятичную дробь в проценты, нужно десятичную запятую передвинуть на две позиции вправо и приписать символ процента.
- Например, десятичная дробь 0,13 равна 13%.
- Десятичная дробь 0,06 равна 6% (обратите внимание, что перед 6 стоит 0).
Реклама
Советы
- Относительная частота характеризует наличие или возникновение определенного события в наборе событий.
- Если сложить относительные частоты всех чисел из набора данных, вы получите единицу. Помните, что при сложении округленных результатов сумма не будет равна 1,0.
- Если набор данных слишком большой, чтобы обработать его вручную, воспользуйтесь программой MS Excel или MATLAB; это позволит избежать ошибок в процессе вычисления.
Реклама
Источники
Об этой статье
Эту страницу просматривали 145 557 раз.
Была ли эта статья полезной?
Содержание
- Частотный анализ текста онлайн
- Частотный анализ текста на С++. Быстро и просто
- Дешифровка текста методом частотного анализа
- Частотный анализ русского интернет-языка
- Шифрование и дешифрование текста
- Заключение
- Частотный анализ текста. Пример написания калькулятора
- Частота слов в тексте
- Решение
- Решение
Частотный анализ текста онлайн
Частотный анализ – это один из методов криптоанализа, основывающийся на предположении о существовании нетривиального статистического распределения отдельных символов и их последовательностей как в открытом тексте, так и шифрованном тексте, которое с точностью до замены символов будет сохраняться в процессе шифрования и дешифрования.
Кратко говоря, частотный анализ предполагает, что частота появления заданной буквы алфавита в достаточно длинных текстах одна и та же для разных текстов одного языка. При этом в случае моно алфавитного шифрования, если в шифрованном тексте будет символ с аналогичной вероятностью появления, то можно предположить, что он и является указанной зашифрованной буквой. Аналогичные рассуждения применяются к биграммам (двухбуквенным последовательностям), триграммам в случае поли алфавитных шифров.
Метод частотного анализа известен с еще IX-го века и связан и именем Ал-Кинди. Но наиболее известным случаем применения такого анализа является дешифровка египетских иероглифов Ж.-Ф. Шампольоном в 1822 году.
Данный вид анализа основывается на том, что текст состоит из слов, а слова из букв. Количество различных букв в каждом языке ограничено и буквы могут быть просто перечислены. Важными характеристиками текста являются повторяемость букв, пар букв (биграмм) и вообще m-ок (m-грамм), сочетаемость букв друг с другом, чередование гласных и согласных и некоторые другие.
Если – число появлений m-граммы ai1ai2. aim в тексте T, а L – общее число подсчитанных m-грамм, то опыт показывает, что при достаточно больших L частоты
для данной m-граммы мало отличаются друг от друга.
В силу этого, относительную частоту считают приближением вероятности P (ai1ai2. aim) появления данной m-граммы в случайно выбранном месте текста (такой подход принят при статистическом определении вероятности).
В представленной ниже таблице приводятся частоты встречаемости букв в русском языке (в процентах):
Буква алфавита | Показатель частоты встречаемости | Буква алфавита | Показатель частоты встречаемости |
---|---|---|---|
А | 0,062 | Р | 0,04 |
В | 0,038 | Т | 0,053 |
Д | 0,025 | Ф | 0,002 |
Ж | 0,007 | Ц | 0,004 |
И | 0,062 | Ш | 0,006 |
К | 0,028 | Ъ, Ь | 0,014 |
М | 0,026 | Э | 0,003 |
О | 0,09 | Я | 0,018 |
Имеется мнемоническое правило запоминания десяти наиболее частых букв русского алфавита. Эти буквы составляют слово СЕНОВАЛИТР.
Устойчивыми являются также частотные характеристики биграмм, триграмм и четырехграмм осмысленных текстов. Существуют специальные таблицы с указанием частоты биграмм некоторых алфавитов. По результатам исследований с помощью таких таблиц ученые определили наиболее часто встречаемые биграммы и триграммы для русского алфавита:
СТ, НО, ЕН, ТО, НА, ОВ, НИ, РА, ВО, КО, СТО, ЕНО, НОВ, ТОВ, ОВО, ОВА.
Из таблиц биграмм можно также легко извлечь информацию о сочетаемости букв, т.е. о предпочтительных связях букв друг с другом.
Результатом таких исследований является таблица, в которой слева и справа от каждой буквы расположены наиболее предпочтительные «соседи» (в порядке убывания частоты соответствующих биграмм). В таких таблицах обычно указывается также доля гласных и согласных букв (в процентах), предшествующих (или следующих за) данной букве.
Г | С | Слева | Справа | Г | С | |
---|---|---|---|---|---|---|
3 | 97 | л, д, к, т, в, р, н | А | л, н, с, т, р, в, к, м | 12 | 88 |
80 | 20 | я, е, у, и, а, о | Б | о, ы, е, а, р, у | 81 | 19 |
68 | 32 | я, т, а, е, и, о | В | о, а, и, ы, с, н, л, р | 60 | 40 |
78 | 22 | р, у, а, и, е, о | Г | о, а, р, л, и, в | 69 | 31 |
72 | 28 | р, я, у, а, и, е, о | Д | е, а, и, о, н, у, р, в | 68 | 32 |
19 | 81 | м, и, л, д, т, р, н | Е | н, т, р, с, л, в, м, и | 12 | 88 |
83 | 17 | р, е, и, а, у, о | Ж | е, и, д, а, н | 71 | 29 |
89 | 11 | о, е, а, и | З | а, н, в, о, м, д | 51 | 49 |
27 | 73 | р, т, м, и, о, л, н | И | с, н, в, и, е, м, к, з | 25 | 75 |
55 | 45 | ь, в, е, о, а, и, с | К | о, а, и, р, у, т, л, е | 73 | 27 |
77 | 23 | г, в, ы, и, е, о, а | Л | и, е, о, а, ь, я, ю, у | 75 | 25 |
80 | 20 | я, ы, а, и, е, о | М | и, е, о, у, а, н, п, ы | 73 | 27 |
55 | 45 | д, ь, н, о | Н | о, а, и, е, ы, н, у | 80 | 20 |
11 | 89 | р, п, к, в, т, н | О | в, с, т, р, и, д, н, м | 15 | 85 |
65 | 35 | в, с, у, а, и, е, о | П | о, р, е, а, у, и, л | 68 | 32 |
55 | 45 | и, к, т, а, п, о, е | Р | а, е, о, и, у, я, ы, н | 80 | 20 |
69 | 31 | с, т, в, а, е, и, о | С | т, к, о, я, е, ь, с, н | 32 | 68 |
57 | 43 | ч, у, и, а, е, о, с | Т | о, а, е, и, ь, в, р, с | 63 | 37 |
15 | 85 | п, т, к, д, н, м, р | У | т, п, с, д, н, ю, ж | 16 | 84 |
70 | 30 | н, а, е, о, и | Ф | и, е, о, а, е, о, а | 81 | 19 |
90 | 10 | у, е, о, а, ы, и | Х | о, и, с, н, в, п, р | 43 | 57 |
69 | 31 | е, ю, н, а, и | Ц | и, е, а, ы | 93 | 7 |
82 | 18 | е, а, у, и, о | Ч | е, и, т, н | 66 | 34 |
67 | 33 | ь, у, ы, е, о, а, и, в | Ш | е, и, н, а, о, л | 68 | 32 |
84 | 16 | е, б, а, я, ю | Щ | е, и, а | 97 | 3 |
0 | 100 | м, р, т, с, б, в, н | Ы | л, х, е, м, и, в, с, н | 56 | 44 |
0 | 100 | н, с, т, л | Ь | н, к, в, п, с, е, о, и | 24 | 76 |
14 | 86 | с, ы, м, л, д, т,, р, н | Э | н, т, р, с, к | 0 | 100 |
58 | 42 | ь, о, а, и, л, у | Ю | д, т, щ, ц, н, п | 11 | 89 |
43 | 57 | о, н, р, л, а, и, с | Я | в, с, т, п, д, к, м, л | 16 | 84 |
Пример: Проведем анализ текста следующего содержания
«СОКРАТ из Афин (469–399 до н.э.) – знаменитый античный философ, учитель Платона, воплощенный идеал истинного мудреца в исторической памяти человечества. С именем Сократа связано первое фундаментальное деление истории античной философии на до- и после-Сократовскую («Досократики»), отражающее интерес ранних философов VI–V вв. к натурфилософии, а последующего поколения софистов V в. – к этико-политическим темам, главная из которых – воспитание добродетельного человека и гражданина. Сократу был близок софистическому движению. Учение Сократа было устным; все свободное время он проводил в беседах с приезжими софистами и местными гражданами, политиками и обывателями, друзьями и незнакомыми на темы, ставшими традиционными для софистической практики: что есть добро и что – зло, что прекрасно, а что безобразно, что добродетель и что порок, можно ли научиться быть хорошим и как приобретается знание. Об этих беседах мы знаем в основном благодаря ученикам Сократа – Ксенофонту и Платону. Кроме их сочинений, имеются также фрагменты и свидетельства о содержании «сократических диалогов» других сократиков, пародийное изображение Сократа в комедии Аристофана Облака и ряд замечаний о Сократе у Аристотеля. Проблема достоверности изображения личности Сократа в сохранившихся произведениях – ключевой вопрос всех исследований о нем.»
Источник
Частотный анализ текста на С++. Быстро и просто
Хочу рассказать о быстром частотном анализе текста на С++, практически без применения головы и алгоритмов.
Иногда такое задание часто дают на контрольной по программированию в каком-нибудь МИРЭА, или МИФИ.
Суть задачи такова. На входе текстовый файл TextForAnalyze.txt(довольно большой ≈ 400кб). Необходимо получить порядок встречаемости слов файле(в порядке убывания частоты). При сравнении слов регистр не учитывать. Необходимо игнорировать предлоги и союзы (список слов в стоп-словаре составить самостоятельно, стоп-словарь хранить в файле). Разделителями слов являются пробел, табуляция, символы перевода строки, знаки, «слеши» и тд.
Названия функций я делал понятными и не нуждающихся в объяснении.
Для начала нужно быстро получить текст.
Обратим внимание на tolowerStr! Я написал его сам так как мы все знаем какая прожорливая функция, поэтому забудем про нее и реализуем более быструю «функцию»:
В итоге наша «tolowerStr» будет выглядеть так:
Теперь мы будем извращаться по полной и создавать свою локаль. Точнее новый «объект локали» т.к нам не нужны всякие скобки, звездочки, проценты и так далее.
Эта битовая маска наследуется от класса ctype. всего до 256 символов. Да, выглядит ужасно, но зато это очень удобно на практике.
Ну теперь практически все сделано. Записываем в текстовый файл с руки все предлоги, которые не хотим видеть в списке, и пишем такой вот код.
Ну вот и все дело сделано, научный текст весом в 400кб был пройден за 21ms.
Что я считаю довольно хорошим результатом.
Для тестирования я пользуюсь GTEST`ами это удобно.
Источник
Дешифровка текста методом частотного анализа
Привет, Хабр! В этой статье я покажу как сделать частотный анализ современного русского интернет-языка и воспользуюсь им для расшифровки текста. Кому интересно, добро пожаловать под кат!
Частотный анализ русского интернет-языка
В качестве источника, откуда можно взять много текста с современным интернет-языком, была взята социальная сеть Вконтакте, а если быть точнее, то это комментарии к публикациям в различных сообществах данной сети. В качестве сообщества я выбрал реальный футбол. Для парсинга комментариев я воспользовался API Вконтакте:
В результате было получено около 200MB текста. Теперь считаем, какой символ сколько раз встречается:
Полученные результаты можно сравнить с результатами из Википедии и отобразить в виде:
1) сравнительной диаграммы
2) таблицы(слева — данные википедии, справа — мои данные)
Проанализировав данные, можно сделать вывод, что частота встречаемости символов в процентном соотношении в двух источниках практически одинакова, за исключением таких букв как «а» и «о».
Шифрование и дешифрование текста
Далее я выбрал из того же сообщества более развёрнутый комментарий, который найти было не так уж и легко, так как в основном комментарии состоят из 2-4 слов:
дружа слово почти не считается, вар извинилась за неправильное решение, и этого достаточно чтобы сделать вывод и усомниться во многих их решениях, вар вместо того чтобы исключать ошибки делает их, это абсолютно не нормально, народ не такой уже и тупой, не по радио же слушаем транслы а в живую смотрим, по этому я больше чем уверен если бы не было столько пенок для мю они бы подавно в топ не попали, аналогично касается ман с, хотя играют местами захватывающе и красиво
После этого необходимо зашифровать полученный текст с помощью какого-нибудь симметричного алгоритма шифрования. Первое, что приходит на ум — это шифр цезаря, сущность которого заключается в том, чтобы изменить символ на другой с определенным шагом:
жуцйг фосес тсъхл рз фълхгзхфв егу лкелрлогфя кг рзтугелоярсз узызрлз л ахсёс жсфхгхсърс ъхсдю фжзогхя еюесж л цфспрлхяфв ес прсёлш лш узызрлвш егу епзфхс хсёс ъхсдю лфнобъгхя сылднл жзогзх лш ахс гдфсобхрс рз рсупгоярс ргусж рз хгнсм цйз л хцтсм рз тс угжлс йз фоцыгзп хугрфою г е йлецб фпсхулп тс ахспц в дсояыз ъзп цезузр зфол дю рз дюос фхсоянс тзрсн жов пб срл дю тсжгерс е хст рз тстгол гргосёлърс нгфгзхфв пгр ф шсхв лёугбх пзфхгпл кгшегхюегбьз л нугфлес
Затем осталось расшифровать текст с помощью частотного анализа:
двужа лросо мопти не лпитаетлб сав ишсиниралг ша немвасиргное вейение и ютохо долтатопно птоыч лдератг счсод и улокнитглб со кнохиз из вейенибз сав скелто тохо птоыч ильряпатг ойиыьи дерает из юто аылорятно не новкаргно навод не таьоф уже и тумоф не мо вадио же лруйаек тванлрч а с жисуя лкотвик мо ютоку б ыоргйе пек усевен елри ыч не ычро лторгьо меноь дрб кя они ыч модасно с том не момари анарохипно ьалаетлб кан л зотб ихваят келтаки шазсатчсаяэе и ьвалисо
Заключение
Источник
Частотный анализ текста. Пример написания калькулятора
Немного о частотном анализе текста и рассказ о создании калькулятора.
В общем, есть такая тема — частотный анализ текста. Утверждается, что для данного языка частота встречаемости отдельных букв в осмысленном тексте есть устойчивая величина. Устойчивыми также являются комбинации двух, трех (биграммы, триграммы) и четырех букв.
Этот факт, в частности, использовался в криптографии для вскрытия шифров.
Я в криптографии не очень, и единственное, что приходит на ум, это вскрытие шифра прямой замены. Надо сказать, наиболее примитивного шифра, когда символы исходного алфавита, используемого в сообщении, преобразуются в другие символы по определенному правилу. Такие шифры, кстати сказать, можно было вскрывать и без применения статистического анализа (где для уменьшения погрешности, очевидно, требуется наличие довольно больших кусков текста), а просто догадываясь о некоторых словах — см. рассказ «Пляшущие человечки».
Вот тут, впрочем, интересная статья про историю криптографии.
На самом деле частота встречаемости букв также зависит от типа текста. Калькулятор ниже рассчитывает частоты букв для введенного пользователем текста и выводит для сравнения теоретические частоты букв для художественного русского текста. В качестве значения по умолчанию взят научный текст (начало определения дифференциального уравнения из Википедии), и сразу видно, как, например, различается частота встречаемости буквы Ф в художественном и научном текстах.
Частоты букв для художественного текста я взял отсюда, ну а по указанному адресу утверждают, что взяли их из книги «Яглом А. М., Яглом И. М., Вероятость и информация, М.: Наука, 1973».
Этот калькулятор был создан как пример, для того чтобы продолжить рассказ о том, как создавать калькуляторы на этом сайте, начатый здесь — Площадь четырехугольника. Пример написания калькулятора. В данном случае на примере этого калькулятора я расскажу о том, как писать калькуляторы, выводящие таблицы и строящие графики. Как обычно, все что нужно от автора — некоторое знание Javascript, ну или вообще любого алгоритмического языка программирования. Интересующиеся смотрят текст после самого калькулятора.
Источник
Частота слов в тексте
Частота встречаемости слов в тексте
Здравствуйте, потихоньку осваиваю С# нашел задачу : Дан небольшой текст на английском языке.
Частота встречаемости символов в тексте
Привет. Помогите, пожалуйста. Нужно, чтобы программа брала текст из txt файла и подсчитывала.
Частота повторения слов в тексте
Привет всем Помогите пожалуйста с Си: Разработать программу, подсчитывающую частоту повторения.
Решение
Решение
Частота повторения букв в тексте
Доброго дня. Помогите пожалуйста разобраться. Простенькая программка по подсчеты количества букв в.
Частота встречи различных букв в тексте
Ребят, помогите пожалуйста решить вот такую задачку- Задан текст, содержащий не более 255.
В заданном тексте вычислить количество слов в тексте и распечатать их по одному в строку
Всем доброго вечера, заканчиваю практику в университете и осталась последняя задачка, которую надо.
В данном тексте подсчитать количество слов. Слова в тексте отделены пробелами
В данном тексте подсчитать количество слов. Слова в тексте отделены пробелами.
Частота повторений для всех символов в тексте
У меня есть текст, допустим: фывфыв ывфваавв ( на практике тут будет 200 символов ). Мне нужно.
Частота повторений для всех символов в тексте
У меня есть текст, допустим: фывфыв ывфваавв ( на практике тут будет 200 символов ). Мне нужно.
Источник
НАШИ относительная частота это очень важно для анализа статистики, так как показывает, какой процент представляют эти данные по отношению ко всем полученным результатам. Он используется для анализа результатов, полученных в заданном наборе данных.
Для его расчета достаточно разделить абсолютную частоту на суммарные полученные данные, и преобразовать этот результат в процент, умножаем на 100. Для статистического анализа данных очень часто строят таблицу с частотами, и в нее всегда помещается относительная частота каждых данных.
Узнать больше: Что такое статистические меры центральной тенденции?
Сводка по относительной частоте
-
Это тип частоты, изучаемый в статистике.
-
Это процент, который представляют данные данные по отношению к целому.
-
Обычно его представляют в процентах.
-
Для его расчета мы делим абсолютную частоту на общее количество полученных результатов.
-
Абсолютная частота — это количество раз, когда были собраны одни и те же данные.
-
В дополнение к простой относительной частоте существует кумулятивная относительная частота, которая представляет собой накопление относительной частоты.
Не останавливайся сейчас… После рекламы есть еще
Что такое относительная частота?
относительная частота процент, который часть данных представляет по отношению к целому. В повседневной жизни довольно часто встречаются ситуации, когда информация передается через проценты. Этот процент часто является относительной частотой, поскольку он позволяет нам сравнивать поведение одной части данных по отношению к другим.
Например, если мы говорим, что в ходе опроса можно было сделать вывод, что 87% бразильцев против гражданского оружия, это позволяет оценить полученный результат по отношению к целому. Есть и другие ситуации, в которых мы используем относительную частоту, которая по-прежнему очень важна в статистика и в принятии решений. В статистических исследованиях после сбора данных важно рассчитать относительную частоту, чтобы можно было провести анализ полученных результатов.
Как рассчитывается относительная частота?
Чтобы вычислить относительную частоту, вам нужно:
-
найти абсолютную частоту;
-
разделите его на общее количество собранных данных.
Важный: Абсолютная частота — это не что иное, как количество раз, когда были собраны одни и те же данные.
Типы относительной частоты
Существует два типа относительной частоты: простая и кумулятивная. Начнем с первого.
-
простая относительная частота
Вот как рассчитать простую относительную частоту на примере.
Пример:
В классе с 50 учениками учитель физкультуры посоветовал им, какой вид спорта будет их любимым. Полученные ответы регистрировались по их абсолютной частоте:
-
футбол → 20 учеников
-
волейбол → 12 учеников
-
сожжено → 8 студентов
-
гандбол → 6 учеников
-
другие → 4 ученика
Разрешение:
Всего было собрано 50 ответов, поэтому для расчета относительной частоты каждого из них мы разделим количество появлений каждого ответа на 50.
Относительная частота:
-
футбол → 20: 50 = 0,4
-
волейбол → 12: 50 = 0,24
-
сожжено → 8: 50 = 0,16
-
гандбол → 6: 50 = 0,12
-
другие → 4: 50 = 0,08
Относительная частота может быть выражена десятичным числом, но обычно выражается в процентах. Чтобы преобразовать найденные десятичные числа в проценты, просто умножьте на 100, так что мы имеем:
-
футбол → 20: 50 = 0,4 = 40%
-
волейбол → 12: 50 = 0,24 = 24%
-
сожжено → 8: 50 = 0,16 = 16%
-
гандбол → 6: 50 = 0,12 = 12%
-
другие → 4: 50 = 0,08 = 8%
Эти данные обычно представляются в виде таблицы, известной как таблица частот:
Спорт |
абсолютная частота (ВЕНТИЛЯТОР) |
относительная частота (фр.) |
Относительная частота (%) (ФР%) |
Футбольный |
20 |
0,4 |
40% |
Волейбол |
12 |
0,24 |
24% |
Сгорел |
8 |
0,16 |
16% |
Гандбол |
6 |
0,12 |
12% |
Другие |
4 |
0,08 |
8% |
Всего |
50 |
1 |
100% |
-
Накопленная относительная частота
Как следует из названия, кумулятивная относительная частота накопление относительной частоты. Для его расчета необходимо сначала вычислить относительную частоту, как и в предыдущем примере.
С данными, организованными в таблице частот:
-
сначала вставляем в частотную таблицу еще один столбец;
-
затем копируем первую полученную относительную частоту;
-
мы выполняем в этом новом столбце и позже, чтобы найти другие накопленные частоты, сумму относительной частоты строки с накопленной частотой предыдущей строки.
Спорт |
абсолютная частота (ВЕНТИЛЯТОР) |
относительная частота (фр.) |
относительная частота накопленный |
Футбольный |
20 |
0,4 |
0,4 |
Волейбол |
12 |
0,24 |
0,4 + 0,24 = 0,64 |
Сгорел |
8 |
0,16 |
0,64 + 0,16 = 0,80 |
Гандбол |
6 |
0,12 |
0,80 + 0,12 = 0,92 |
Другие |
4 |
0,08 |
0,92 + 0,08 = 1 |
Всего |
50 |
1 |
Тогда мы можем отобразить таблицу частот следующим образом:
Спорт |
абсолютная частота (ВЕНТИЛЯТОР) |
относительная частота (фр.) |
относительная частота накопленный |
Футбольный |
20 |
0,4 |
0,4 |
Волейбол |
12 |
0,24 |
0,64 |
Сгорел |
8 |
0,16 |
0,80 |
Гандбол |
6 |
0,12 |
0,92 |
Другие |
4 |
0,08 |
1,00 |
Всего |
50 |
1 |
Эта кумулятивная относительная частота также может быть выражена в процентах:
Спорт |
Частота абсолютный (ВЕНТИЛЯТОР) |
Частота родственник (фр.) |
Частота родственник накопленный |
Частота родственник % (ФР%) |
Частота родственник накопленный % |
Футбольный |
20 |
0,4 |
0,4 |
40% |
40% |
Волейбол |
12 |
0,24 |
0,64 |
24% |
64% |
Сгорел |
8 |
0,16 |
0,80 |
16% |
80% |
Гандбол |
6 |
0,12 |
0,92 |
12% |
92% |
Другие |
4 |
0,08 |
1,00 |
8% |
100% |
Всего |
50 |
1 |
100% |
В чем разница между абсолютной частотой и относительной частотой?
Мы видим, что абсолютная частота сама по себе не дает нам столько информации, сколько относительная частота, потому что:
-
Абсолютная частота — это количество раз, когда один и тот же ответ появлялся для данного набора.
-
Относительная частота показывает отношение этих данных ко всем собранным данным.
Важный: Стоит отметить, что оба важны, и что можно рассчитать относительную частоту только тогда, когда мы знаем абсолютную частоту набора данных.
Читайте также: Меры разброса — амплитуда и девиация
Решенные упражнения на относительную частоту
Вопрос 1
(EsSA) Определите альтернативу, которая представляет абсолютную частоту (fi) элемента (xi), относительная частота (fr) которого равна 25%, а общее количество элементов (N) в выборке равно 72.
А) 18
Б) 36
В) 9
Г) 54
Д) 45
Разрешение:
Альтернатива А
Поскольку относительная частота составляет 25%, мы знаем, что
фи: 72 = 25%
фи: 72 = 0,25
фи = 0,25 ⋅ 72
фи = 18
вопрос 2
(Cesgranrio) В таблице ниже показана абсолютная частота диапазонов месячной заработной платы 20 сотрудников небольшой компании.
Диапазон заработной платы (BRL) |
Количество |
Менее 1000,00 |
6 |
Больше или равно 1000,00 и меньше 2000,00 |
7 |
Больше или равно 2000,00 и меньше 3000,00 |
5 |
Больше или равно 3000,00 |
2 |
Всего |
20 |
Относительная частота сотрудников, зарабатывающих менее 2000 реалов в месяц, составляет:
А) 0,07
Б) 0,13
В) 0,35
Г) 0,65
Д) 0,70
Разрешение:
Альтернатива D
Всего 6 + 7 = 13 сотрудников, которые зарабатывают менее 2000 реалов. Вычисляя относительную частоту, имеем:
13: 20 = 0,65
Тема:
Частотный анализ текста.
2020
Ведение.
С
распространением письменности в человеческом обществе появилась потребность в
обмене письмами и сообщениями, что вызвало необходимость сокрытия содержимого
письменных сообщений от посторонних.
На
начальном этапе (до начала XVI в.) для защиты информации использовались методы
кодирования и стеганографии. Большинство из используемых шифров сводились к
перестановке или моноалфавитной подстановке.
Этап
формальной криптографии (конец XV – начало XX вв.) связан с появлением
формализованных и относительно стойких к ручному криптоанализу шифров. Важная
роль на этом этапе принадлежит Леону Батисте Альберти, итальянскому
архитектору, который одним из первых предложил многоалфавитную подстановку.
Данный шифр, состоял в последовательном «сложении» букв исходного
текста с ключом (процедуру можно облегчить с помощью специальной таблицы). Его
работа «Трактат о шифре» (1466 г.) считается первой научной работой
по криптологии.
Научная
криптография (1930 – 60-е гг.) обусловлена появлением криптосистем со строгим
математическим обоснованием криптостойкости. К началу 30-х гг. окончательно
сформировались разделы математики, являющиеся научной основой криптологии:
теория вероятностей и математическая статистика, общая алгебра, теория чисел,
начали активно развиваться теория алгоритмов, теория информации, кибернетика.
Своеобразным водоразделом стала работа Клода Шеннона «Теория связи в
секретных системах» (1949), которая подвела научную базу под криптографию
и криптоанализ.
Компьютерная
криптография (с 1970-х гг.) обязана своим появлением вычислительным средствам с
производительностью, достаточной для реализации криптосистем, обеспечивающих
при большой скорости шифрования на несколько порядков более высокую
криптостойкость, чем «ручные» и «механические» шифры. Первым
классом криптосистем стали блочные шифры. В 70-е гг. был разработан
американский стандарт шифрования DES (принят в 1978 г.). Один из его авторов,
Хорст Фейстель (сотрудник IBM), описал модель блочных шифро. В середине 70-х
гг. ХХ столетия появились асимметричные криптосистемы, которые не требовали
передачи секретного ключа между сторонами. Асимметричная криптография открыла
сразу несколько новых прикладных направлений, в частности системы электронной
цифровой подписи (ЭЦП) и электронных денег.
Актуальность работы
заключается в том, что каждый метод криптоанализа добавляет новые требования к
алгоритмам шифрования. Частотный метод, в котором по распределению символов в
шифртексте выдвигаются гипотезы о ключе шифрования, породил требование
равномерного распределения символов в шифртексте. Кроме того, принципы
частотного анализа сегодня широко применяются в программах по поиску паролей,
фильтрации текстов в поисковых системах, в алгоритмах сжатия информации Целью
данной работы является вскрытие текста, зашифрованного шифром моноалфавитной
подстановки, без знания ключа.
Для
достижения цели необходимо решить следующие задачи:
•
Сбор и анализ научной информации о
применении частотного анализа для вскрытия шифров моноалфавитной
подстановки.
•
Определение частотных характеристик
криптограмм.
•
Применение полученных данных для вскрытия
криптограмм.
•
Сделать вывод о возможностях применения
частотного анализа при дешифровке текстов моноалфавитной подстановки и рассмотреть
область применения данного метода в других областях.
При
написании работы использовались следующие методы:
•
Эмпирический – наблюдение,
сравнение.
• Теоретический – обобщение результатов, их анализ и выводы.
Теоретическая
часть
Частотный анализ, частотный криптоанализ — один
из методов криптоанализа, основывающийся на предположении о существовании
нетривиального статистического распределения отдельных символов и их
последовательностей как в открытом тексте, так и в шифротексте, которое, с
точностью до замены символов, будет сохраняться в процессе шифрования и
дешифрования.
Упрощённо, частотный анализ предполагает, что
частота появления заданной буквы алфавита в достаточно длинных текстах одна и
та же для разных текстов одного языка. При этом в случае моноалфавитного
шифрования если в шифротексте будет символ с аналогичной вероятностью
появления, то можно предположить, что он и является указанной зашифрованной
буквой. Аналогичные рассуждения применяются к биграммам (двубуквенным последовательностям),
триграммам и т.д. в случае полиалфавитных шифров.
Метод частотного криптоанализа известен с IX-го
века (работы Ал-Кинди), хотя наиболее известным случаем его применения в
реальной жизни, возможно, является дешифровка египетских иероглифов Ж.-Ф.
Шампольоном в 1822 году. В художественной литературе наиболее известными
упоминаниями являются рассказы «Золотой жук» Эдгара По, «Пляшущие человечки» Конан
Дойля, а также роман «Дети капитана Гранта» Жюль Верна.
Начиная с середины XX века большинство
используемых алгоритмов шифрования разрабатываются устойчивыми к частотному
криптоанализу.
Описание частотного криптоанализа
Утверждается, что вероятность появления отдельных
букв, а также их порядок в словах и фразах естественного языка подчиняются статистическим
закономерностям: например, пара стоящих рядом букв «ся» в русском языке более
вероятна, чем «цы», а «оь» в русском языке не встречается вовсе (зато часто
встречается, например, в чеченском). Анализируя достаточно длинный текст,
зашифрованный методом замены, можно по частотам появления символов произвести
обратную замену и восстановить исходный текст.
Как упоминалось выше, важными характеристиками
текста являются повторяемость букв (количество различных букв в каждом языке
ограничено), пар букв, то есть m (m-грамм), сочетаемость букв друг с другом,
чередование гласных и согласных и некоторые другие особенности. Примечательно,
что эти характеристики являются достаточно устойчивыми.
Идея состоит в подсчете чисел вхождений каждой nm
возможных m-грамм в достаточно длинных открытых текстах T=t1t2…tl, составленных
из букв алфавита {a1, a2, …, an}. При этом просматриваются подряд идущие
m-граммы текста:
t1t2…tm, t2t3… tm+1, …, ti-m+1tl-m+2…tl.
Если L (ai1ai2 … aim) — число появлений m-граммы ai1ai2…aim
в тексте T, а L — общее число подсчитанных m-грамм, то при достаточно больших L частоты L
(ai1ai2… aim)/ L, для данной m-граммы мало отличаются друг от друга.
В силу этого, относительную частоту считают
приближением вероятности P (ai1ai2…aim) появления данной m-граммы в случайно
выбранном месте текста (такой подход принят при статистическом определении
вероятности).
В общем смысле частоту букв в процентном
выражении можно определить следующим образом: подсчитывается сколько раз она
встречается в шифро-тексте, затем полученное число делится на общее число
символов шифро-текста; для выражения в процентном выражении, еще умножается на
100.
Но существует некоторая разница значений частот,
которая объясняется тем, что частоты существенно зависят не только от длины
текста, но и от характера текста. Например, текст может быть технического
содержания, где редкая буква Ф может стать довольно частой. Поэтому для
надежного определения средней частоты букв желательно иметь набор различных
текстов.
В таблице 1 приведены относительные
частоты появления русских букв. [1]
Кроме
того, порядок букв в словах и фразах естественного языка подчиняется
определенным статистическим закономерностям. Частотный анализ также учитывает
частоту появления различных буквосочетаний: например, пара стоящих рядом букв
«ся» в русском языке более вероятна, чем «цы», а «оь» не встречается никогда.
Для большинства естественных языков такая статистика документирована. Эти
принципы широко применяются в распространенных сегодня программах по подбору
паролей. Возможные методы подбора пароля (могут применяться в совокупности)[2]
·
неоптимизированный перебор;
·
перебор, оптимизированный по словарям
вероятных паролей;
·
перебор, оптимизированный на основе
встречаемости символов и биграмм;
·
перебор, ориентированный на информацию о
подсистеме аутентификации ОС. Если ключевая система ОС допускает существование
эквивалентных паролей, при переборе из каждого класса эквивалентности
опробуется всего один пароль;
·
перебор с использованием знаний о пользователе.
Как правило, опробуются пароли, использование которых представляется наиболее
вероятным.
Если программа перебора
вначале подбирает наиболее вероятные пароли, а менее вероятные оставляет на
потом, то перебор сокращается в десятки и сотни раз. В таблице 2 приводится ряд
результатов, полученных при подборе пароля.[3]
Числа, указанные в первой колонке таблицы 2, соответствуют сложности полного
перебора. Однако применялся оптимизированные перебор, а в первом случае пароль
представлял собой два английских слова, записанных без пробела. Таким образом,
время перебора сократилось во много раз. Во втором же случае пароль состоял из
трех строчных английских букв, двух заглавных английских букв и одной цифры и
был абсолютно бессмысленным.
Сложность |
Время |
Тип |
2,08 |
15 |
486DX/4-100 |
5,68*1010 |
8 |
Pentium-120 |
Практическая
часть
Для
определения возможности применения частотного анализа при дешифровке текстов
моноалфавитной подстановки был проведен эксперимент.
В
ходе эксперимента учащимся 8 класса (15 человек) провели урок, посвященный
частотному анализу текста. На данном уроке учащимся рассказали о истории
развития криптографии и в частности о методе частотного анализа. Объяснили
основные принципы и алгоритм использования данного метода дешифровки.
После
этого предложили расшифровать текст, зашифрованный методом моноалфавитной
подстановки. Данный текст был взят из художественной литературы и содержал
около 3400 символов. Для облегчения подсчетов использовалось ПО Excel
2007.
Задание
(приведен не полный текст задания):
Расшифровать текст:
3 j@$jм с?*1jч$jм :j+j@% 90-0 ?j+jтыш?0.
?j+jтыш?*м0 0х $*1ы3*-0 пjтjму, чтj j$0 №ы-0 jч%$ь м*-%$ь?0%. ?*9@ый
?j+jтыш?* №ы- +jстjм с $%№j-ьшjй j:у+%ц. 3 :j+j@% у $0х №ы-j jч%$ь ?+*с03j.
3j?+у: ?*9@j:j @jм* +jс-0 ц3%ты: м*+:*+0т?0, +jм*ш?0, j@у3*$ч0?0. Т*м @*9%
у-0цы $*1ы3*-0сь 0м%$*м0 ц3%тj3: у-0ц* ?j-j?j-ьч0?j3, *—%я +jм*ш%?, №у-ь3*+
3*с0-ь?j3. * с*м :j+j@ $*1ы3*-ся Ц3%тjч$ым :j+j@jм. J$ стjя- $* №%+%:у +учья.
Этjт +уч%й ?j+jтыш?0 $*1ы3*-0 J:у+цj3jй +%?jй, пjтjму чтj пj №%+%:*м +учья
+jс-j м$j:j j:у+цj3.
Спустя
40 минут работы практически все учащиеся (кроме 1) справились с заданием. В
результате получили следующий текст:
В одном
сказочном городе жили коротышки. Коротышками их называли потому, что они были
очень маленькие. Каждый коротышка был ростом с небольшой огурец. В
городе у них было очень красиво. Вокруг каждого дома росли цветы: маргаритки,
ромашки, одуванчики. Там даже улицы назывались именами цветов: улица
Колокольчиков, аллея Ромашек, бульвар Васильков. А сам город назывался Цветочным
городом. Он стоял на берегу ручья. Этот ручей коротышки называли Огурцовой
рекой, потому что по берегам ручья росло много огурцов.[4]
Выводы
•
Метод моноалфавитной подстановки не
маскирует частотные характеристики открытого текста.
•
Даже тексты длиной около 100 символов
поддаются криптоанализу методом частотного анализа, таким образом можно
сказать, что шифр моноалфавитной подстановки не является надежным.
•
Для повышения стойкости шифра
моноалфавитной подстановки при шифровании следует убирать из открытых текстов
пробелы и шифровать сообщение без них.
Применение
данного метода
Алгоритм Хаффмана
Один
из первых алгоритмов эффективного кодирования информации был предложен
Хаффманом в 1952 г. Этот алгоритм стал базой для большого количества программ
сжатия информации. Например, кодирование по Хаффману используется в программах
сжатия ARJ, ZIP, RAR, в алгоритме сжатия графических изображений с
потерями JPEG, а также встроено в современные факс-аппараты.
Эффективное
кодирование по Хаффману состоит в представлении наиболее вероятных (часто
встречающихся) букв двоичными кодами наименьшей длины, а менее вероятных —
кодами большей длины (если все кодовые слова меньшей длины уже исчерпаны). Это
делается таким образом, чтобы средняя длина кода на букву исходного сообщения
была минимальной.[5]
Лучше всего проиллюстрировать этот алгоритм на простом
примере. Имеется пять символов с вероятностями, заданными на рисунке
Рисунок Коды Хаффмана.
Символы объединяются в пары в следующем порядке:
1.
. объединяется с .
, и оба заменяются комбинированным символом .
с вероятностью 0.2;
2.
Осталось
четыре символа, с вероятностью 0.4, а также
и
с вероятностями по 0.2.
3.
Произвольно
выбираем и
, объединяем их и заменяем вспомогательным
символом с вероятностью 0.4;
4.
Теперь
имеется три символа
и
с вероятностями 0.4, 0.2 и 0.4, соответственно. Выбираем и
объединяем символы и
во вспомогательный символ
с вероятностью 0.6;
5.
Наконец,
объединяем два оставшихся символа и
и заменяем на
с вероятностью 1.
Дерево
построено. Оно изображено на рисунке слева, «лежа на боку», с корнем справа и
пятью листьями слева. Для назначения кодов мы произвольно приписываем бит 1
верхней ветке и бит 0 нижней ветке дерева для каждой пары. В результате
получаем следующие коды: 0, 10, 111, 1101 и 1100. Распределение битов по краям
— произвольное.
Средняя
длина этого кода равна бит/символ.
Очень важно то, что кодов Хаффмана бывает много. Некоторые шаги алгоритма
выбирались произвольным образом, поскольку было больше символов с минимальной
вероятностью. На рисунке справа показано, как можно объединить символы
по-другому и получить иной код Хаффмана (11, 01, 00, 101 и
100). Средняя длина равна бит/символ
как и у предыдущего кода.
Если не использовать сжатие информации, то на один символ
приходилось бы 3 бита информации.
Список литературы
1.
Алексеев А. Криптография и криптоанализ:
вековая проблема человечества. // Опубликовано: http://infocity.kiev.ua/hack/content/hack008.phtml
2.
Дориченко С.А., Ященко В.В. 25
этюдов о шифрах – Москва «Теис», 2010
3.
Жельников В. Криптография от
папируса до компьютера – Москва, ABF, 2015
4.
Загнетко А. Информация доступная и
недоступная. // http://pda.cio-world.ru/?action=article&id=273907
5.
Зубов А.Ю. Криптографические методы защиты
информации. Совершенные шифры: Учебное пособие. М.: Гелиос АРВ, 2005.
6.
Иванов М.А. криптографические методы
защиты информации в компьютерных системах и сетях // М.: КУДИЦ-ОБРАЗ, 2001
7.
Николай Носов. Приключения Незнайки и его
друзей //Опубликовано: http://lib.ru/NOSOW/nezn1.txt
8.
Ященко В.В. Введение в
криптографию – Москва, МЦНМО, 2012
Frequency and relative frequency are two fundamental concepts in statistics. They describe how often values or categories appear in a dataset, and what proportion of the dataset they represent.
In this article, we will discuss the difference between frequency and relative frequency, and how to calculate them.
Frequency
Frequency is the number of times a specific value or category appears in a dataset. The formula for frequency is given below in the diagram.
For example, consider the following dataset, 1, 2, 3, 2, 1, 2, 4, 1, 2, 3. To calculate the frequency of the value 2, we count the number of times it appears in the dataset, which is 4.
Steps to Calculate Frequency
Use the step given below to calculate the frequency.
- Identify the value or category you want to calculate the frequency for.
- Count the number of times the value/category appears in the dataset.
- The result is the frequency of that value/category in the dataset.
Relative Frequency
Relative frequency is the proportion or percentage of times a specific value or category appears in a dataset. The formula for relative frequency is given below in the diagram
For example, using the same dataset as before, to calculate the relative frequency of the value 2, we first calculate its frequency (which is 4). The total number of data points in the dataset is 10. Therefore, the relative frequency of the value 2 is:
Relative Frequency of 2 = 4 / 10 = 0.4 or 40%
Steps to Calculate Relative Frequency
Use the step given below to calculate the relative frequency.
- Identify the value or category you want to calculate the relative frequency for.
- Calculate the frequency of that value/category using the formula mentioned earlier.
- Calculate the total number of data points in the dataset.
- Divide the frequency by the total number of data points.
- The result is the relative frequency of that value/category in the dataset.
Learn More about Relative Frequency
Difference Between Frequency and Relative Frequency
The main differences between frequency and relative frequency are,
Frequency | Relative Frequency |
---|---|
Frequency counts the number of times a value or category appears in the dataset | Relative frequency calculates the proportion or percentage of the dataset that value or category represents. |
Frequency uses whole numbers | Relative frequency uses decimal numbers or percentages |
Frequency cannot be greater than the total number of data points in the dataset | Relative frequency can be any value between 0 and 1 or expressed as a percentage between 0% and 100% |
Do Check,
- Mean
- Mean, Median and Mode
Solved Examples
Example 1: In a survey of 50 people, the following data were collected on the number of hours they spend on social media per day,
Hours | Frequency |
---|---|
0-1 | 10 |
1-2 | 15 |
2-3 | 12 |
3-4 | 8 |
4-5 | 5 |
Calculate the relative frequency of each category.
Solution:
The total number of people surveyed is 50.
Hours Frequency Relative Frequency 0-1 10 10 / 50 = 0.20 1-2 15 15 / 50 = 0.30 2-3 12 12 / 50 = 0.24 3-4 8 8 / 50 = 0.16 4-5 5 5 / 50 = 0.10 To calculate the relative frequency of each category, we divide the frequency of each category by the total number of people surveyed.
Example 2: A survey was conducted on the number of cars owned by households in a particular area. The following data was obtained.
Cars | Frequency |
---|---|
0 | 25 |
1 | 50 |
2 | 30 |
3 | 10 |
4 | 5 |
Calculate the total number of households surveyed.
Solution:
Total Number of households surveyed is the sum of all the frequencies.
Total number of Households = 25 + 50 + 30 + 10 + 5 = 120
Example 3: In a class of 40 students, the following marks were obtained in a test,
Marks | Frequency |
---|---|
0-10 | 8 |
10-20 | 12 |
20-30 | 15 |
30-40 | 5 |
What is the percentage of students who scored less than 20 marks?
Solution:
Total number of students is 40.
The frequency of students who scored less than 20 marks is the sum of the frequency of marks ranging from 0-10 and 10-20, which is 8 + 12 = 20.
Percentage of students who scored less than 20 marks = (20/40) × 100%
= 50%
Example 4: In a survey, 60 people were asked about their favourite ice cream flavour. The results were as follows,
Flavour | Frequency |
---|---|
Vanilla | 30 |
Chocolate | 20 |
Strawberry | 5 |
Butter Pecan | 5 |
What is the relative frequency of Vanilla flavour?
Solution:
The total number of responses is 60
The frequency of the Vanilla flavour is 30
The relative frequency of Vanilla flavour is calculated by dividing its frequency by the total number of responses.
Relative frequency of Vanilla flavour = 30/60 = 0.5 or 50%.
Example 5: In a store, 50 customers were surveyed on the amount of money they spent on groceries. The following data was obtained,
Amount | Frequency |
0-100 | 10 |
100-200 | 20 |
200-300 | 15 |
300-400 | 4 |
400-500 | 1 |
What is the total amount spent on groceries by the customers surveyed?
Solution:
We can calculate the total amount spent on groceries by multiplying each category by its frequency and adding the results.
Total amount spent on groceries = (10 × 50) + (20 × 150) + (15 × 250) + (4 × 350) + (1 × 450)
= 1000 + 3000 + 3750 + 1400 + 450
= 9600
Example 6: In a class of 30 students, the following marks were obtained in a test,
Marks | Frequency |
---|---|
0-10 | 6 |
10-20 | 12 |
20-30 | 8 |
30-40 | 4 |
What is the percentage of students who scored between 10 and 30 marks?
Solution:
Total number of students is 30.
The frequency of students who scored between 10 and 30 marks is the sum of the frequency of marks ranging from 10-20 and 20-30, which is 12 + 8 = 20.
Percentage of students who scored between 10 and 30 marks = (20/30) x 100% = 66.67%
FAQs
Question 1: What is the difference between frequency and relative frequency?
Answer:
Frequency counts the number of times a value or category appears in a dataset, while relative frequency calculates the proportion or percentage of the dataset that value or category represents.
Question 2: How do you calculate frequency?
Answer:
The formula to calculate the frequency is,
Frequency = Number of Times Value (Category) Appears in Dataset
Question 3: How do you calculate relative frequency?
Answer:
The formula to calculate the relative frequency is,
Relative Frequency = Frequency / Total Number of Data Points in Dataset
Question 4: What is the range of values for frequency?
Answer:
Frequency can be any whole number between 0 and the total number of data points in the dataset.
Question 5: What is the range of values for relative frequency?
Answer:
Relative frequency can be any decimal number between 0 and 1 or expressed as a percentage between 0% and 100%.
Question 6: Why is frequency important in statistics?
Answer:
Frequency is important in statistics because it provides information on how often specific values or categories appear in a dataset, which can help to identify patterns and trends in the data.