Как правильно провести непараметрический статистический тест? Критерий Краскела-Уоллиса (H-критерий)

Выполнение курсовых и дипломных работ на основе дисперсионного анализа нередко вызывает у студентов страх, ошибки и как следствие – некорректные результаты и выводы. Если дисперсия дается тяжело, то можно найти достойную альтернативу. Например, задействовать непараметрический статистический тест – критерий Краскела-Уоллиса (или так называемый Н-критерий).

Как правильно провести непараметрический статистический тест? Критерий Краскела-Уоллиса (H-критерий)

Выполнение курсовых и дипломных работ на основе дисперсионного анализа нередко вызывает у студентов страх, ошибки и как следствие – некорректные результаты и выводы. Если дисперсия дается тяжело, то можно найти достойную альтернативу. Например, задействовать непараметрический статистический тест – критерий Краскела-Уоллиса (или так называемый Н-критерий).

Понятие и сфера применения непараметрического статистического теста с использованием критерия Краскела-Уоллиса (H-критерий)

Критерий Краскела-Уоллиса – это один из методов математической статистики. Он предназначен для оценки и соотнесения средних значений в трех и более выборках. То есть рассматриваемый подход ориентирован на изучение нескольких групп, которые могут быть независимыми по отношению друг к другу.

Основная задача этого инструмента состоит в том, чтобы определить и выделить отличия между исследуемыми объектами.

База для определения критерия Краскела-Уоллиса
База для определения критерия Краскела-Уоллиса

Например, можно рассмотреть три группы студентов, постигающих одну и ту же специальность или разные специальности, но один и тот же предмет. Допустим, что преподаватель применяет в отношении каждой группы разные методы обучения. С помощью Н-критерия можно определить отличия в методике преподавания и оценить влияние метода на успеваемость в группах (в расчет будет браться средняя академическая успеваемость группы).

В основе методики Краскела-Уоллиса лежат следующие категории:

  • Нулевая гипотеза. Она представляет собой предложение исследователя, при котором средние значения выборки будут равны. То есть в данном случае будет наблюдаться стабильное или одинаковое состояние во всех рассматриваемых объектах исследования независимо от факторов и пр.
  • Альтернативная гипотеза. Она предполагает, что исследователь не исключает изменения в одной из рассматриваемых групп и получение отличного результата. То есть при таком подходе между исследуемыми объектами будут наблюдаться отличия.
  • Ранжирование данных. Это процесс по сортировке собранной информации в определенном порядке: от наименьшего к наибольшему значению и др. Чаще всего сортировка значений проводится по возрастанию. Это классическая схема оценки ситуации.

Важно отметить, что собирать информацию для определения критерия Краскела-Уоллиса студенту придется на основе наблюдения. Притом наблюдение будет неоднократным.

Сам по себе Н-критерий считается простейшим подходом к оценке ситуации. Он не подробен, основан на средних значениях, но позволяет получить общие представления о сходстве и отличиях между рассматриваемыми группами. Студенты выбирают этот метод благодаря его простоте и посильности. Он подходит в самых разных ситуациях, когда сложные или узкоспециализированные подходы не работают. Это своего рода «универсальный инструмент».

Непараметрический тест используется в самых разных сферах деятельности для оценки ситуации. Например, он может быть задействован в экономическом исследовании для оценки состояния рынка И поведения покупателей на фоне воздействующих факторов и пр. Также с его помощью можно изучить предпочтение или ожидания людей в отношении схожих товаров на фоне смены производителей и пр. (на базе маркетинговых исследований).

Правила применения критерия Краскела-Уоллиса (H-критерий)

Воспроизведение непараметрических тестов требует соблюдения определённых условий, которые обеспечат корректность и точность, достоверность результатов исследования.

Среди основных функций метода Краскела-Уоллиса (H-критерий) можно выделить:

  1. Информационная. Она предполагает, что исследователь будет владеть достаточным объемом для оценки ситуации информацией, чтобы выделить сходства и отличия, сформулировать гипотезы и проверить их, обосновать результаты и выводы.
    То есть исследователю для проведения исследования, расчетов должен тщательно изучить ситуацию с научной и практической точек зрения.
  2. Сравнительная. Основная задача техники Краскела-Уоллиса состоит в констатации и отражении отличий между рассматриваемыми объектами или параметрами. Поэтому без сравнительного анализа в этом деле не обойтись. Студенту предстоит соотносить сведения о выборках, проводить в отношении них идентичные расчеты и сопоставлять результаты, сортировать и ранжировать данные.
  3. Доказательная. Она предполагает, что автор проекта благодаря данной методике не только изучит ситуацию, но и соберет определённые факты за или против выдвинутой нулевой гипотезы и сможет обосновать полученные выводы.

Для воспроизведения данного подхода важно соблюдение определенных правил и условий.

Логика применения Н-критерия
Логика применения Н-критерия

Во-первых, эта тактика требует минимум информации и проведение простейших математических операций. То есть для оценки ситуации студенту достаточно располагать минимальным информационным набором, который можно преобразовать в количественный вид. Ранжировать и пр.

Во-вторых, благодаря расчетной части, итоги и выводы, сделанные на основе такой информации, обретают наибольшую точность и достоверность, весомость. Поэтому они могут формировать доказательную базу НИР.

В-третьих, принцип планомерности. Расчет и оценка критерия Краскела-Уоллиса (H-критерий) предполагает предварительную проработку и подготовку: сбор информации, ее сортировку и преобразование в пригодный для расчетов формат и вид, фактчекинг и пр. Благодаря такому способу исследования становится надежным и последовательным, результативным.

Применение Н-критерия требует соблюдения конкретных условий:

  • Исследователь принимает во внимание не менее трех выборок испытуемых или объектов. Притом объем этих выборок должен быть небольшим, чтобы не усложнять ход исследования и не загромождать расчеты в перспективе;
  • За каждой выборкой автор будет проводить наблюдение. Притом оно, как мы уже отмечали, будет неоднократным. Более того, эксперту предстоит обеспечить их независимость. В отношении одной из выборок ему предстоит провести не менее 4-5 наблюдений, а в отношении все оставшихся – не менее2. Важно соблюдать соотношение 4/2/2.
  • Проводимые наблюдения в группах должны быть независимы друг от друга. То есть исследователь должен абстрагировать каждую группу и фиксировать поступающую о них информацию, не обращая внимания на ранее добытые факты, сведения. Сравнивать сразу не нужно. Важно изначально собрать максимум сведений по каждой выборке.
  • В ходе НИР допустимо проведение попарное сравнение. Данный метод применим для установления и отражения конкретных отличий между исследуемыми группами. Притом здесь важно соотносить попарно разные значения.
  • Оценка результатов проводится на основе предварительно утвержденных таблиц критический значений. То есть студенту нужно изначально продумать, как он будет оценивать результаты, с чем соотносить, чтобы сформулировать свои выводы. Такие таблицы помогают понять, насколько значимые и корректны собранные итоги и отраженные выводы. Универсанты могут полагаться на готовые шаблоны таблиц.
  • Зависимая переменная должна быть непрерывной или порядковой. Это значит, что она должна подвергаться стабильной, постоянной оценке на фоне воздействующих факторов без каких-либо пробелов. Как правило, она реагирует на изменение фактора, что подчеркивает сходства/отличия, наличие или отсутствие зависимости, силу влияния и пр.
  • Распределения значений в рамках изучаемых выборок схожи по форме: как в численном, так и графическом виде.

Таким образом, чтобы получить достоверные результаты и обоснованные выводы, несмотря на простоту и доступность метода, студенту нужно соблюсти определённые условия и обеспечить достаточность информации, проверив ее качество. Сама по себе процедура по определению критерия Краскела-Уоллиса (H-критерий) – спланированная процедура.

Порядок проведения и оценки непараметрического статистического теста с использованием критерия Краскела-Уоллиса (H-критерий)

Воспроизведение в исследовании Н-критерия – процесс последовательный и тщательно продуманный. Для начала нужно провести наблюдения в отношении заявленных выборок. Каждое наблюдение – обособленное, самостоятельное, обязательно фиксируемое. После сбора информации важно ее систематизировать.

Как только информационная база будет собрана, следует удостовериться, что она достоверна и качественна, соблюдены все условия для применения критерия Краскела-Уоллиса: избранные группы независимы друг от друга, количество проведенных наблюдений соответствует минимальным требованиям и пр.

Этапы работы над критерием Краскела-Уоллиса
Этапы работы над критерием Краскела-Уоллиса

Но, пожалуй, самым значительным шагом в этом плане является ранжирование данных. Это действие предполагает сортировку материалов по массивам. Следует отметить, что при использовании Н-критерия используют не исходные данные, а преобразованные. Поэтому сначала результаты нужно ранжировать. Это значит. Что исследователю предстоит провести сортировку и перераспределение материалов в порядке возрастания или убывания. Каждому результату нужно присвоить определённый ранг. Отметим, что ранг присваивается для всего массива целиком.

В результате такого структурирования данных исследователь получит целый набор рангов. Именно он будет лежать в основе анализа на базе критерия Краскела-Уоллиса.

Следующим этапом является постановка нулевой и альтернативной гипотезы. В первом случае исследователь утверждает, что все выборки одинаковы. Во втором – что одна или несколько из выборок отличается друг от друга. В этом случае Н-критерий поможет установить, в чем состоит это различие и силу его влияния на результат, установить причины изменений и триггеры (факторы).

Затем универсанту предстоит проведение математических операций по определению средних значений. Первым делом исследователь устанавливает медианное значение рангов в каждой выборке. Сумма всех рангов обозначается Ri.

После этого студент может констатировать Н-критерий. Его рассчитывается по следующей схеме:

Формула для расчета Н-критерия
Формула для расчета Н-критерия

N – общее количество элементов во всех выборках (массивах);

Ni – количество элементов в определенной (i-ой) выборке

Ri – сумма всех рангов i-ой группы

K – количество исследуемых выборок. Групп

Затем необходимо скорректировать Н-критерий. Для этого применяют следующую формулу.

Формула откорректированного значения Н-критерия
Формула откорректированного значения Н-критерия

Tj — количество повторений j-го уникального значения

Следующий шаг – определение критического значения. В данном случае будет несколько мелких шагов:

  1. Определение числа степеней свободы.
Как рассчитать степени свободы?
Как рассчитать степени свободы?
  1. Затем исследователю нужно сравнить Н и Нкорр с критическим значением. Критическое значение чаще всего находится на уровне 0,05.
  2. Рассчитать з-значение по распределению степенями свободы.
Условие отвержения нулевой гипотезы
Условие отвержения нулевой гипотезы

Последний этап по определению критерия Краскела-Уоллиса заключается в принятии или отклонении нулевой гипотезы на основе рассчитанного показателя Н-критерия. Если между выборками присутствуют значимые отличия, то нулевая гипотеза подлежит отвержению. При таком раскладе автор будет иметь выполнение следующего условия:

Условие одобрения нулевой гипотезы
Условие одобрения нулевой гипотезы

В случае выполнения обратного условия нулевая гипотеза подтверждается и принимается. При таком раскладе наблюдается следующее требование:

Обратите внимание, что расчете Н-критерия позволяет установить наличие отличия между рассматриваемыми объектами исследования, но конкретизировать, в чем оно заключается этот подход не может в силу обобщённости и простоты. Поэтому для дальнейшей интерпретации студентам следует привлечь дополнительный инструментарий и приемы.

Как расшифровать и описать критерий Краскела-Уоллиса (H-критерий)?

Основным ориентиром при интерпретации критерия Краскела-Уоллиса можно считать р-значение. Если рассчитанный показатель Н-критерий меньше р-значения, то это означает, что между рассматриваемыми выборками присутствуют существенные отличия. Поэтому нулевая гипотеза будет моментально отвергнута.

Дополнительные инструменты для расшифровки Н-критерия
Дополнительные инструменты для расшифровки Н-критерия

Но чтобы пояснить, в чем заключаются различия и как они влияют на выборку, ход исследования, можно и привлечь один из следующих дополнительны приемов:

  1. Тест Данна. Основан на парном сравнении групп между собой. Его задача состоит в том, чтобы понять, какие группы отличаются и чем. Он требует корректировки на множественные сравнения. Притом сохраняет ранги и Н-теста.
  2. Тест Манна-Уитни. Он призван детально соотнести 2 выборки и установить конкретные отличия между ними. Обязательным условием для его воспроизведения является требование о том, чтобы выборки были разносоставными, то есть не было совпадающих элементов, более того, количество элементов в группах должно быть примерно одинаковым, не сильно расхожим.
  3. Тест Немени. Его миссия состоит в том, чтобы проверить наличие сдвигов или отличий между выборками, массивами. Устанавливает точнее уровень сходства/отличия и устанавливает конкретные параметры (схожие и отличные).

Прежде чем приступить к описанию результатов критерия Краскела-Уоллиса, важно удостовериться в точности и корректности всех расчетов. Лучше всего оформить собранный материал и результаты в виде таблиц или графиков, где можно подчеркнуть факты, параметры для оценки.

Далее останется провести емкий сравнительный анализ и показать, отличается ли Н-критерий от р-значения, о чем говорит их соотношение. После этого можно уточнить отличительные признаки на базе сравнительного анализа или применения так называемого пост-хок анализа (на основе теста Данна, Манна-Уитни или Немени).

Применение Excel в рамках непараметрического статистического теста Краскела-Уоллиса (H-критерий)

Несмотря на простоту подхода и операций по расчету основных параметров, непосредственно критерия Краскела-Уоллиса, студенты могут упростить ход выполнения курсовой или дипломной работы. Согласитесь, что для получения результата и обоснования выводов им предстоит работать с большим объемом информации. С одной стороны, это материал, собранный в ходе неоднократных (минимум 4-5 раз) наблюдений. С другой стороны – научная и статистическая литература, нормативные значения для сравнения, описания и обоснования итогов и выводов.

Исходные информационные ресурсы ранжируют, но, чтобы корректно представить исходные данные их нужно грамотно скомпоновать и представить в едином виде. Чаще всего универсанты приводят сводные или ранжированные таблицы. Далее все проведенные расчеты и собранные итоги также оформляют в виде графиков или таблиц для отражения ситуации: зависимости, изменчивости, влиятельности и пр.

Упростить работу над исходными материалами и дальнейшими расчетами можно с помощью табличного редактора Excel. Он располагает достаточным инструментарием для воспроизведения Н-критерия:

  • Чтобы узнать количество элементов в массиве, можно выделить соответствующий столбец или строку и применить функцию Счет. Она подсчитает количество заполненных числами ячеек. Пустые ячейки в учет не берутся.
    Также можно воспользоваться опцией Счет3. Она учитывает все заполненные ячейки.
  • Автоматизировать ход ранжирования информации можно с помощью функции Ранг (RANG). Программа самостоятельно присвоит ранги по возрастанию. Если значения будут совпадать, то сервис присвоим ему средний ранг.
  • Чтобы узнать сумму рангов, достаточно выделить соответствующий диапазон и выбрать функцию Сумма.

Далее для подсчета критерия Краскела-Уоллиса можно в отдельной ячейке набрать формулу вручную.

Также возможно использование специальных настроек табличного редактора. Для автоматического подсчета Н-критерия можно воспользоваться функционалом Данные – Анализ данных — Критерий Краскела-Уоллиса.

Настройки функции "Анализ данных"
Настройки функции «Анализ данных»

Далее все основные манипуляции программа проведем самостоятельно, вычислив данный показатель и р-значение. На их основе пользователь сможет сделать вывод о сходстве и отличиях выборок.

Важно отметить, что результаты расчетов можно представить как в виде таблицы, так и с помощью графиков. Эксель при грамотном управлении создаст соответствующие требованиям пользователя варианты интерпретации.

Возникли сложности?

Нужна помощь преподавателя?

Мы всегда рады Вам помочь!

disshelp.ru

Рекомендации по применению критерия Краскела-Уоллиса (H-критерий)

Внимательно изучите литературу и разберитесь в исходных правилах, терминах, тонкостях методики и проведения исследования. Важно понимать, с чем и как предстоит работать, какие действия предпринимать, как проводить НИР и пр.

Тщательно планируйте ход проведения исследования. Старайтесь обеспечить себя проверенной и надежной информацией. Удостоверьтесь, что располагаете всем необходимым, все условия и требования в рамках методики Краскела-Уоллиса соблюдены. Только так можно обеспечить высокое качество и точность результатов и выводов.

Подготовьте подробный план действий по проведению НИР с учетом тонкостей применения Н-критерия. Оформите исходные данные качественно: удостоверьтесь, что нет ошибок и описок первоисточники – в достаточном количестве и объеме и пр.

Грамотно выдвигайте нулевую и альтернативную гипотезу. Как правило, они противостоят друг другу: в нулевой утверждают об отсутствии отличий, а в альтернативной наоборот – о наличии отличительных черт.

Используйте различные средства и инструменты визуализации материалов, чтобы упростить подачу результатов и выводов.

Обязательно перепроверяйте все расчеты и результаты. Расчет р-значения – обязателен.

Не бойтесь полагаться на современные инструменты: Эксель, SPSS, специализированные сервисы и пр. С их помощью можно ускорить расчетные моменты и повысить степень точности результатов, качество интерпретации данных и выводов. Также для анализа ситуации универсанты могут задействовать искусственный интеллект. Но все же полностью доверять технике, «автоматике» не стоит. Долю самостоятельной работы, координации и контроля никто не отменял.


Трудности с учебой?

Требуется поддержка?


Помощь в написании студенческих и
аспирантских работ!