Как написать текст, чтобы его поняли. Получение статистики и уровня читаемости документа Общий вывод по уровням: читаемость средняя
Индекс читабельности
Индекс удобочитаемости - мера определения сложности восприятия текста читателем. Индекс удобочитаемости может вычисляться на основе нескольких параметров: длины предложений, слов, удельного количества наиболее частотных (или редких) слов и т. д.
Индекс удобочитаемости Флеша
Наиболее популярная мера была создана Рудольфом Флешем, изначально для английского языка. Она оценивает сложность текста по следующей формуле:
Либо:
FRE = 206.835 − (1.015 × ASL) − (84.6 × ASW)
ASL - средняя длина предложения в словах (англ. average sentence length).
ASW - средняя длина слова в слогах (англ. average number of syllables per word)
Индекс по шкале FRES (Flesch Reading Ease Scale) распределяется таким образом:
100: Очень легко читается. Средняя длина предложения составляет 12 или менее слов. Нет слов из более чем двух слогов.
65: простой английский язык. Средняя длина предложения составляет от 15 до 20 слов. В среднем слова имеют 2 слога.
Для английского языка значение 90-100 соответствует лёгкому тексту для младших школьников, 60-70 - тексту, который могут читать выпускники школы, тексты с индексом 0-30 предназначены для людей с высшим образованием.
В связи с тем, что в русском языке средняя длина предложения меньше (за счет меньшего использования служебных слов, таких как артикли или вспомогательные глаголы), а слова в среднем длиннее, было предпринято несколько попыток разработать специфическую для русского языка версию меры, например, путём подгонки коэффициентов при сравнении индексов, полученных для оригинальных английских текстов и их переводов. Ниже представлен один из вариантов такой адаптации.
FRE = 206.835 − (1.3 × ASL) − (60.1 × ASW)
В целом, большинство методов оценки сложности текста на основе индексов удобочитаемости для информационно-аналитических документов на русском языке дают оценки, выходящие как за интерпретируемый диапазон значений, так и за эталонные значения. При этом получаемые результаты характеризуются высокой степенью корреляции, так как разработчики используют одну математическую модель линейной регрессии, а также однообразные параметры текста (средняя длина слова, средняя длина предложения). При этом индексы удобочитаемости не адаптированы к тестам для взрослых. У профессионала не должно возникать затруднений с пониманием многосложных слов. В конечном итоге фактором сложности выступает семантика текста и абстрактность его изложения. Индикаторы на основе индексов удобочитаемости недостаточно хорошо интерпретируются, поскольку не могут напрямую быть использованы для прогнозирования времени обработки текста тем или иным человеком.
11. Пропаганда и Public Relations – соотношение терминов.
ПР и пропаганда. Относительно пропаганды существуют два магистральных направления мнений. Согласно первому направлению, пропаганда и ПР практически не отличаются друг от друга: оба понятия означают использование определенных технологий для эффективного внедрения каких-либо тезисов в массовое сознание. Тем не менее большинство ПР-специалистов считают, что называть пропагандой их деятельность неправомерно: пропаганда допускает искажение цифр и фактов в чьих-либо интересах, в то время как ПР основывается на правдивой информации. Пропаганда имеет жесткую установку и стремится заставить людей принять некоторую точку зрения причем не интересуясь, хотят они этого или нет. ПР носят более мелкий характер и лишь предлагают людям воспользоваться некоторой информацией. А затем добровольно принять те или иные мнения и идеи. Пропаганда делает упор на одностороннее воздействие на индивида или группу, ПР в обязательном порядке предполагают налаживание механизма двусторонней связи, получение и учет встречного сигнала со стороны аудитории.
Случайно наткнулся на статью об Индексе Флеша-Кинкейда. Как говорит нам Википедия: «индекс удобочитаемости - мера определения сложности восприятия текста читателем».
Их всего два: Флеша и Флеша — Кинкейда. Первый — показывает легкости чтения, а второй — уровень образованности читающего, нужный для прочтения текста.
Оба показателя рассчитаны исключительно на английский язык и американский уровень образования. В чем разница? В длине слов, предложений и слогов. Но были попытки улучшить этот индекс для русского языка, сравнивая английские тексты с их переводом.
Индекс Флеша
Рассчитывается он по такой формуле:
total words
— количество слов
total sentences
— количество предложений
total syllables
— количество слогов
Все остальные цифры остаются на своих местах.
Либо вот так:
206.835 − (1.015 × ASL) − (84.6 × ASW),
где
ASL — средняя длина предложения в словах,
ASW - средняя длина слова в слогах.
У нас получился показатель удобочитаемости. Измеряется он 0 до 100.
0 — очень сложный текст,
100 — очень легкий текст.
Индекс Флеша — Кинкейда
Существует также, будем его называть так, ИФК. Он позволяет посчитать какой уровень образованности нужен для прочтения текста. Опять же, все это рассчитано на английский язык и уровень образования в США.
Формулы похожи, но постоянные переменные другие.
Вот, например, на AIN, где я и наткнулся на статью об это показателе, есть примеры:
- Проект реформы здравоохранения – 13
- Академическая статья о чтении – 11,5
- Джоан Роулинг – 5,5
- Стивен Кинг – 6,1
Индекс туманности Ганнинга или Фог-индекс (Fog Index) показывает уровень удобочитаемости текста.
Этот метод проверки комфорта восприятия текста назван по имени создателя Роберта Ганнинга. Вначале он предназначался для журналистов, чтобы избежать туманных формулировок в написанном. В настоящее время используется копирайтерами для определения степени простоты текста для читателей.
Индекс Ганнинга рассчитывается по формуле:
Fi = (Nws + Nwt) * 0,4
Nws - количество слов в предложении.
Nwt - количество слов в одном предложении длиной 3 и более слогов.
Исходная формула туманности Ганнинга:
Для текстов на русском языке применяется поправочный коэффициент 0,78.
Число сложных слов — слова с числом слогов больше четырёх.
Расчет определяет с точностью до класса образования, насколько читатель готов к пониманию написанного.
Приняты следующие значения Fog Index:
70 и выше - не требуется специальной подготовки;
- до 70 - среднее образование;
- до 60 - интеллектуальный уровень подготовки;
- до 30 - для понимания нужен научный уровень подготовки.
Проверив текст по данному методу на удобочитаемость, вы определите, не труден ли он для восприятия, не перегружен ли терминами, т.к. простота текста - значимый фактор его успеха. Нужно писать грамотно, со смыслом, но не забывать о «дружелюбности» к читателю.
Рассчитывается индекс так:
- Вычленяется фрагмент текста от 100 до 200 слов.
- Подсчитывается количество слов в предложениях. Как одно слово считаем числа и даты. Сложносочинённые предложения делим на 2 части.
- Численность слов делим на численность предложений и получаем среднюю длину последних.
- Учитываем число слов с 3-мя и более слогами (кроме составных слов, имён собственных, глаголов, усложнённых склонением, падежом, временем).
- Число многосложных слов делим на общую численность слов. Получаем процент многосложных слов в фрагменте текста.
- К полученной цифре прибавляем средний показатель длины предложения.
- Это значение умножаем на 0,4.
- Индекс удобочитаемости Флеша
- Примечания
Индекс удобочитаемости Флеша
Наиболее популярная мера была создана Рудольфом Флешем, изначально для английского языка . Она оценивает сложность текста по следующей формуле
F R E = 206,835 − 1,015 total words total sentences − 84 , 6 total syllables total words , {\displaystyle FRE=206{,}835-1{,}015{\frac {\text{total words}}{\text{total sentences}}}-84{,}6{\frac {\text{total syllables}}{\text{total words}}},}FRE = 206,835 − 1,015 × ASL − 84,6 × ASW,
ASL - средняя длина предложения в словах ( англ. average sentence length ), ASW - средняя длина слова в слогах ( англ. average number of syllables per word ) . FRE = 206,835 − 1,3 × ASL − 60,1 × ASW.
В целом, большинство методов оценки сложности текста на основе индексов удобочитаемости для информационно-аналитических документов на русском языке дают оценки, выходящие как за интерпретируемый диапазон значений, так и за эталонные значения. При этом получаемые результаты характеризуются высокой степенью корреляции, так как разработчики используют одну математическую модель линейной регрессии, а также однообразные параметры текста (средняя длина слова, средняя длина предложения). При этом индексы удобочитаемости не адаптированы к тестам для взрослых. У профессионала не должно возникать затруднений с пониманием многосложных слов. В конечном итоге фактором сложности выступает семантика текста и абстрактность его изложения. Индикаторы на основе индексов удобочитаемости недостаточно хорошо интерпретируются, поскольку не могут напрямую быть использованы для прогнозирования времени обработки текста тем или иным человеком.
Индекс удобочитаемости - мера определения сложности восприятия текста читателем. Индекс удобочитаемости может вычисляться на основе нескольких параметров: длины предложений, слов, удельного количества наиболее частотных (или редких) слов и т. д.
Индекс удобочитаемости Флеша
Наиболее популярная мера была создана Рудольфом Флешем, изначально для английского языка . Она оценивает сложность текста по следующей формуле:
F R E = 206.835 − 1.015 (total words total sentences) − 84.6 (total syllables total words) {\displaystyle FRE=206.835-1.015\left({\frac {\mbox{total words}}{\mbox{total sentences}}}\right)-84.6\left({\frac {\mbox{total syllables}}{\mbox{total words}}}\right)}FRE = 206.835 − (1.015 × ASL) − (84.6 × ASW)
Индекс по шкале FRES (Flesch Reading Ease Scale) распределяется таким образом:
100 : Очень легко читается. Средняя длина предложения составляет 12 или менее слов. Нет слов из более чем двух слогов. 65 : простой английский язык. Средняя длина предложения составляет от 15 до 20 слов. В среднем слова имеют 2 слога. 30 : Немного трудно читать. Предложения содержат до 25-ти слов. Обычно, двусложные слова. 0 : Очень трудно читать. B среднем предложение имеет 37 слов. Слово имеет в среднем более 2-х слоговДля английского яз. значение 90-100 соответствует легкому тексту для младших школьников, 60-70 - тексту, который могут читать выпускники школы, тексты с индексом 0-30 предназначены для людей с высшим образованием.
FRE = 206.835 − (1.3 × ASL) − (60.1 × ASW)
В целом, большинство методов оценки сложности текста на основе индексов удобочитаемости для информационно-аналитических документов на русском языке дают оценки, выходящие как за интерпретируемый диапазон значений, так и за референсные значения. При этом получаемые результаты характеризуются высокой степенью корреляции, так как разработчики используют одну математическую модель линейной регрессии, а также однообразные параметры текста (средняя длина слова, средняя длина предложения). При этом индексы удобочитаемости не адаптированы к тестам для взрослых. У профессионала не должно возникать затруднений с пониманием многосложных слов. В конечном итоге фактором сложности выступает семантика текста и абстрактность его изложения. Индикаторы на основе индексов удобочитаемости недостаточно хорошо интерпретируются, поскольку не могут напрямую быть использованы для прогнозирования времени обработки текста тем или иным человеком.