
Выполнение курсовых и дипломных работ на основе дисперсионного анализа нередко вызывает у студентов страх, ошибки и как следствие – некорректные результаты и выводы. Если дисперсия дается тяжело, то можно найти достойную альтернативу. Например, задействовать непараметрический статистический тест – критерий Краскела-Уоллиса (или так называемый Н-критерий).
СОДЕРЖАНИЕ
Понятие и сфера применения непараметрического статистического теста с использованием критерия Краскела-Уоллиса (H-критерий)
Критерий Краскела-Уоллиса – это один из методов математической статистики. Он предназначен для оценки и соотнесения средних значений в трех и более выборках. То есть рассматриваемый подход ориентирован на изучение нескольких групп, которые могут быть независимыми по отношению друг к другу.
Основная задача этого инструмента состоит в том, чтобы определить и выделить отличия между исследуемыми объектами.

Например, можно рассмотреть три группы студентов, постигающих одну и ту же специальность или разные специальности, но один и тот же предмет. Допустим, что преподаватель применяет в отношении каждой группы разные методы обучения. С помощью Н-критерия можно определить отличия в методике преподавания и оценить влияние метода на успеваемость в группах (в расчет будет браться средняя академическая успеваемость группы).
В основе методики Краскела-Уоллиса лежат следующие категории:
- Нулевая гипотеза. Она представляет собой предложение исследователя, при котором средние значения выборки будут равны. То есть в данном случае будет наблюдаться стабильное или одинаковое состояние во всех рассматриваемых объектах исследования независимо от факторов и пр.
- Альтернативная гипотеза. Она предполагает, что исследователь не исключает изменения в одной из рассматриваемых групп и получение отличного результата. То есть при таком подходе между исследуемыми объектами будут наблюдаться отличия.
- Ранжирование данных. Это процесс по сортировке собранной информации в определенном порядке: от наименьшего к наибольшему значению и др. Чаще всего сортировка значений проводится по возрастанию. Это классическая схема оценки ситуации.
Важно отметить, что собирать информацию для определения критерия Краскела-Уоллиса студенту придется на основе наблюдения. Притом наблюдение будет неоднократным.
Сам по себе Н-критерий считается простейшим подходом к оценке ситуации. Он не подробен, основан на средних значениях, но позволяет получить общие представления о сходстве и отличиях между рассматриваемыми группами. Студенты выбирают этот метод благодаря его простоте и посильности. Он подходит в самых разных ситуациях, когда сложные или узкоспециализированные подходы не работают. Это своего рода «универсальный инструмент».
Непараметрический тест используется в самых разных сферах деятельности для оценки ситуации. Например, он может быть задействован в экономическом исследовании для оценки состояния рынка И поведения покупателей на фоне воздействующих факторов и пр. Также с его помощью можно изучить предпочтение или ожидания людей в отношении схожих товаров на фоне смены производителей и пр. (на базе маркетинговых исследований).
Правила применения критерия Краскела-Уоллиса (H-критерий)
Воспроизведение непараметрических тестов требует соблюдения определённых условий, которые обеспечат корректность и точность, достоверность результатов исследования.
Среди основных функций метода Краскела-Уоллиса (H-критерий) можно выделить:
- Информационная. Она предполагает, что исследователь будет владеть достаточным объемом для оценки ситуации информацией, чтобы выделить сходства и отличия, сформулировать гипотезы и проверить их, обосновать результаты и выводы.
То есть исследователю для проведения исследования, расчетов должен тщательно изучить ситуацию с научной и практической точек зрения. - Сравнительная. Основная задача техники Краскела-Уоллиса состоит в констатации и отражении отличий между рассматриваемыми объектами или параметрами. Поэтому без сравнительного анализа в этом деле не обойтись. Студенту предстоит соотносить сведения о выборках, проводить в отношении них идентичные расчеты и сопоставлять результаты, сортировать и ранжировать данные.
- Доказательная. Она предполагает, что автор проекта благодаря данной методике не только изучит ситуацию, но и соберет определённые факты за или против выдвинутой нулевой гипотезы и сможет обосновать полученные выводы.
Для воспроизведения данного подхода важно соблюдение определенных правил и условий.

Во-первых, эта тактика требует минимум информации и проведение простейших математических операций. То есть для оценки ситуации студенту достаточно располагать минимальным информационным набором, который можно преобразовать в количественный вид. Ранжировать и пр.
Во-вторых, благодаря расчетной части, итоги и выводы, сделанные на основе такой информации, обретают наибольшую точность и достоверность, весомость. Поэтому они могут формировать доказательную базу НИР.
В-третьих, принцип планомерности. Расчет и оценка критерия Краскела-Уоллиса (H-критерий) предполагает предварительную проработку и подготовку: сбор информации, ее сортировку и преобразование в пригодный для расчетов формат и вид, фактчекинг и пр. Благодаря такому способу исследования становится надежным и последовательным, результативным.
Применение Н-критерия требует соблюдения конкретных условий:
- Исследователь принимает во внимание не менее трех выборок испытуемых или объектов. Притом объем этих выборок должен быть небольшим, чтобы не усложнять ход исследования и не загромождать расчеты в перспективе;
- За каждой выборкой автор будет проводить наблюдение. Притом оно, как мы уже отмечали, будет неоднократным. Более того, эксперту предстоит обеспечить их независимость. В отношении одной из выборок ему предстоит провести не менее 4-5 наблюдений, а в отношении все оставшихся – не менее2. Важно соблюдать соотношение 4/2/2.
- Проводимые наблюдения в группах должны быть независимы друг от друга. То есть исследователь должен абстрагировать каждую группу и фиксировать поступающую о них информацию, не обращая внимания на ранее добытые факты, сведения. Сравнивать сразу не нужно. Важно изначально собрать максимум сведений по каждой выборке.
- В ходе НИР допустимо проведение попарное сравнение. Данный метод применим для установления и отражения конкретных отличий между исследуемыми группами. Притом здесь важно соотносить попарно разные значения.
- Оценка результатов проводится на основе предварительно утвержденных таблиц критический значений. То есть студенту нужно изначально продумать, как он будет оценивать результаты, с чем соотносить, чтобы сформулировать свои выводы. Такие таблицы помогают понять, насколько значимые и корректны собранные итоги и отраженные выводы. Универсанты могут полагаться на готовые шаблоны таблиц.
- Зависимая переменная должна быть непрерывной или порядковой. Это значит, что она должна подвергаться стабильной, постоянной оценке на фоне воздействующих факторов без каких-либо пробелов. Как правило, она реагирует на изменение фактора, что подчеркивает сходства/отличия, наличие или отсутствие зависимости, силу влияния и пр.
- Распределения значений в рамках изучаемых выборок схожи по форме: как в численном, так и графическом виде.
Таким образом, чтобы получить достоверные результаты и обоснованные выводы, несмотря на простоту и доступность метода, студенту нужно соблюсти определённые условия и обеспечить достаточность информации, проверив ее качество. Сама по себе процедура по определению критерия Краскела-Уоллиса (H-критерий) – спланированная процедура.
Порядок проведения и оценки непараметрического статистического теста с использованием критерия Краскела-Уоллиса (H-критерий)
Воспроизведение в исследовании Н-критерия – процесс последовательный и тщательно продуманный. Для начала нужно провести наблюдения в отношении заявленных выборок. Каждое наблюдение – обособленное, самостоятельное, обязательно фиксируемое. После сбора информации важно ее систематизировать.
Как только информационная база будет собрана, следует удостовериться, что она достоверна и качественна, соблюдены все условия для применения критерия Краскела-Уоллиса: избранные группы независимы друг от друга, количество проведенных наблюдений соответствует минимальным требованиям и пр.

Но, пожалуй, самым значительным шагом в этом плане является ранжирование данных. Это действие предполагает сортировку материалов по массивам. Следует отметить, что при использовании Н-критерия используют не исходные данные, а преобразованные. Поэтому сначала результаты нужно ранжировать. Это значит. Что исследователю предстоит провести сортировку и перераспределение материалов в порядке возрастания или убывания. Каждому результату нужно присвоить определённый ранг. Отметим, что ранг присваивается для всего массива целиком.
В результате такого структурирования данных исследователь получит целый набор рангов. Именно он будет лежать в основе анализа на базе критерия Краскела-Уоллиса.
Следующим этапом является постановка нулевой и альтернативной гипотезы. В первом случае исследователь утверждает, что все выборки одинаковы. Во втором – что одна или несколько из выборок отличается друг от друга. В этом случае Н-критерий поможет установить, в чем состоит это различие и силу его влияния на результат, установить причины изменений и триггеры (факторы).
Затем универсанту предстоит проведение математических операций по определению средних значений. Первым делом исследователь устанавливает медианное значение рангов в каждой выборке. Сумма всех рангов обозначается Ri.
После этого студент может констатировать Н-критерий. Его рассчитывается по следующей схеме:

N – общее количество элементов во всех выборках (массивах);
Ni – количество элементов в определенной (i-ой) выборке
Ri – сумма всех рангов i-ой группы
K – количество исследуемых выборок. Групп
Затем необходимо скорректировать Н-критерий. Для этого применяют следующую формулу.

Tj — количество повторений j-го уникального значения
Следующий шаг – определение критического значения. В данном случае будет несколько мелких шагов:
- Определение числа степеней свободы.

- Затем исследователю нужно сравнить Н и Нкорр с критическим значением. Критическое значение чаще всего находится на уровне 0,05.
- Рассчитать з-значение по распределению
степенями свободы.

Последний этап по определению критерия Краскела-Уоллиса заключается в принятии или отклонении нулевой гипотезы на основе рассчитанного показателя Н-критерия. Если между выборками присутствуют значимые отличия, то нулевая гипотеза подлежит отвержению. При таком раскладе автор будет иметь выполнение следующего условия:

В случае выполнения обратного условия нулевая гипотеза подтверждается и принимается. При таком раскладе наблюдается следующее требование:
Обратите внимание, что расчете Н-критерия позволяет установить наличие отличия между рассматриваемыми объектами исследования, но конкретизировать, в чем оно заключается этот подход не может в силу обобщённости и простоты. Поэтому для дальнейшей интерпретации студентам следует привлечь дополнительный инструментарий и приемы.
Как расшифровать и описать критерий Краскела-Уоллиса (H-критерий)?
Основным ориентиром при интерпретации критерия Краскела-Уоллиса можно считать р-значение. Если рассчитанный показатель Н-критерий меньше р-значения, то это означает, что между рассматриваемыми выборками присутствуют существенные отличия. Поэтому нулевая гипотеза будет моментально отвергнута.

Но чтобы пояснить, в чем заключаются различия и как они влияют на выборку, ход исследования, можно и привлечь один из следующих дополнительны приемов:
- Тест Данна. Основан на парном сравнении групп между собой. Его задача состоит в том, чтобы понять, какие группы отличаются и чем. Он требует корректировки на множественные сравнения. Притом сохраняет ранги и Н-теста.
- Тест Манна-Уитни. Он призван детально соотнести 2 выборки и установить конкретные отличия между ними. Обязательным условием для его воспроизведения является требование о том, чтобы выборки были разносоставными, то есть не было совпадающих элементов, более того, количество элементов в группах должно быть примерно одинаковым, не сильно расхожим.
- Тест Немени. Его миссия состоит в том, чтобы проверить наличие сдвигов или отличий между выборками, массивами. Устанавливает точнее уровень сходства/отличия и устанавливает конкретные параметры (схожие и отличные).
Прежде чем приступить к описанию результатов критерия Краскела-Уоллиса, важно удостовериться в точности и корректности всех расчетов. Лучше всего оформить собранный материал и результаты в виде таблиц или графиков, где можно подчеркнуть факты, параметры для оценки.
Далее останется провести емкий сравнительный анализ и показать, отличается ли Н-критерий от р-значения, о чем говорит их соотношение. После этого можно уточнить отличительные признаки на базе сравнительного анализа или применения так называемого пост-хок анализа (на основе теста Данна, Манна-Уитни или Немени).
Применение Excel в рамках непараметрического статистического теста Краскела-Уоллиса (H-критерий)
Несмотря на простоту подхода и операций по расчету основных параметров, непосредственно критерия Краскела-Уоллиса, студенты могут упростить ход выполнения курсовой или дипломной работы. Согласитесь, что для получения результата и обоснования выводов им предстоит работать с большим объемом информации. С одной стороны, это материал, собранный в ходе неоднократных (минимум 4-5 раз) наблюдений. С другой стороны – научная и статистическая литература, нормативные значения для сравнения, описания и обоснования итогов и выводов.
Исходные информационные ресурсы ранжируют, но, чтобы корректно представить исходные данные их нужно грамотно скомпоновать и представить в едином виде. Чаще всего универсанты приводят сводные или ранжированные таблицы. Далее все проведенные расчеты и собранные итоги также оформляют в виде графиков или таблиц для отражения ситуации: зависимости, изменчивости, влиятельности и пр.
Упростить работу над исходными материалами и дальнейшими расчетами можно с помощью табличного редактора Excel. Он располагает достаточным инструментарием для воспроизведения Н-критерия:
- Чтобы узнать количество элементов в массиве, можно выделить соответствующий столбец или строку и применить функцию Счет. Она подсчитает количество заполненных числами ячеек. Пустые ячейки в учет не берутся.
Также можно воспользоваться опцией Счет3. Она учитывает все заполненные ячейки. - Автоматизировать ход ранжирования информации можно с помощью функции Ранг (RANG). Программа самостоятельно присвоит ранги по возрастанию. Если значения будут совпадать, то сервис присвоим ему средний ранг.
- Чтобы узнать сумму рангов, достаточно выделить соответствующий диапазон и выбрать функцию Сумма.
Далее для подсчета критерия Краскела-Уоллиса можно в отдельной ячейке набрать формулу вручную.
Также возможно использование специальных настроек табличного редактора. Для автоматического подсчета Н-критерия можно воспользоваться функционалом Данные – Анализ данных — Критерий Краскела-Уоллиса.

Далее все основные манипуляции программа проведем самостоятельно, вычислив данный показатель и р-значение. На их основе пользователь сможет сделать вывод о сходстве и отличиях выборок.
Важно отметить, что результаты расчетов можно представить как в виде таблицы, так и с помощью графиков. Эксель при грамотном управлении создаст соответствующие требованиям пользователя варианты интерпретации.
Возникли сложности?
Нужна помощь преподавателя?
Мы всегда рады Вам помочь!

Рекомендации по применению критерия Краскела-Уоллиса (H-критерий)
Внимательно изучите литературу и разберитесь в исходных правилах, терминах, тонкостях методики и проведения исследования. Важно понимать, с чем и как предстоит работать, какие действия предпринимать, как проводить НИР и пр.
Тщательно планируйте ход проведения исследования. Старайтесь обеспечить себя проверенной и надежной информацией. Удостоверьтесь, что располагаете всем необходимым, все условия и требования в рамках методики Краскела-Уоллиса соблюдены. Только так можно обеспечить высокое качество и точность результатов и выводов.
Подготовьте подробный план действий по проведению НИР с учетом тонкостей применения Н-критерия. Оформите исходные данные качественно: удостоверьтесь, что нет ошибок и описок первоисточники – в достаточном количестве и объеме и пр.
Грамотно выдвигайте нулевую и альтернативную гипотезу. Как правило, они противостоят друг другу: в нулевой утверждают об отсутствии отличий, а в альтернативной наоборот – о наличии отличительных черт.
Используйте различные средства и инструменты визуализации материалов, чтобы упростить подачу результатов и выводов.
Обязательно перепроверяйте все расчеты и результаты. Расчет р-значения – обязателен.
Не бойтесь полагаться на современные инструменты: Эксель, SPSS, специализированные сервисы и пр. С их помощью можно ускорить расчетные моменты и повысить степень точности результатов, качество интерпретации данных и выводов. Также для анализа ситуации универсанты могут задействовать искусственный интеллект. Но все же полностью доверять технике, «автоматике» не стоит. Долю самостоятельной работы, координации и контроля никто не отменял.
Трудности с учебой?
Требуется поддержка?
Помощь в написании студенческих и
аспирантских работ!





