Как сделать Т-тест в Excel

Оглавление:

Как сделать Т-тест в Excel
Как сделать Т-тест в Excel
Anonim

T-критерий - это способ определения наличия статистически значимых различий между наборами данных с использованием t-распределения Стьюдента. T-тест в Excel - это T-критерий для двух выборок, сравнивающий средние значения двух выборок. В этой статье объясняется, что означает статистическая значимость, и показано, как выполнить Т-тест в Excel.

Инструкции в этой статье относятся к Excel 2019, 2016, 2013, 2010, 2007; Excel для Microsoft 365 и Excel Online.

Image
Image

Что такое статистическая значимость?

Представьте, что вы хотите узнать, какой из двух кубиков даст лучший результат. Вы бросаете первый кубик и получаете 2; вы бросаете второй кубик и получаете 6. Говорит ли это о том, что второй кубик обычно дает более высокие баллы? Если вы ответили «Конечно, нет», значит, у вас уже есть некоторое представление о статистической значимости. Вы понимаете, что разница возникла из-за случайного изменения счета при каждом броске кости. Поскольку выборка была очень маленькой (всего один рулон), она не показала ничего существенного.

А теперь представьте, что вы бросаете каждый кубик 6 раз:

  • Первый кубик выбрасывает 3, 6, 6, 4, 3, 3; Среднее значение=4,17
  • Второй кубик выбрасывает 5, 6, 2, 5, 2, 4; Среднее=4.00

Доказывает ли это, что первая кость дает больше очков, чем вторая? Возможно нет. Небольшая выборка с относительно небольшой разницей между средними значениями делает вероятным, что разница по-прежнему связана со случайными вариациями. По мере того, как мы увеличиваем количество бросков костей, становится трудно дать здравый смысл ответа на вопрос - является ли разница между результатами результатом случайного изменения или действительно ли один из них с большей вероятностью даст более высокие баллы, чем другой?

Значимость – это вероятность того, что наблюдаемое различие между выборками связано со случайными вариациями. Значимость часто называют альфа-уровнем или просто «α». Доверительный уровень, или просто «с», - это вероятность того, что разница между выборками не является следствием случайной вариации; другими словами, что есть разница между лежащими в основе популяциями. Следовательно: c=1 – α

Мы можем установить 'α' на любой желаемый уровень, чтобы быть уверенными, что мы доказали свою значимость. Очень часто используется α=5% (вероятность 95%), но если мы действительно хотим быть уверены, что какие-либо различия не вызваны случайной вариацией, мы можем применить более высокий уровень достоверности, используя α=1% или даже α=0,1. %.

Для расчета значимости в различных ситуациях используются различные статистические тесты. T-тесты используются, чтобы определить, различаются ли средние значения двух совокупностей, а F-тесты используются, чтобы определить, различаются ли дисперсии.

Зачем проверять статистическую значимость?

При сравнении разных вещей нам нужно использовать тестирование значимости, чтобы определить, лучше ли одно, чем другое. Это относится ко многим полям, например:

  • В бизнесе людям необходимо сравнивать различные продукты и методы маркетинга.
  • В спорте людям нужно сравнивать различное оборудование, технику и конкурентов.
  • В инженерии люди должны сравнивать различные конструкции и настройки параметров.

Если вы хотите проверить, работает ли что-то лучше, чем что-то другое, в любой области, вам нужно проверить статистическую значимость.

Что такое Т-распределение Стьюдента?

Распределение Стьюдента похоже на нормальное (или гауссовское) распределение. Оба распределения имеют форму колокола, и большинство результатов близки к среднему, но некоторые редкие события довольно далеки от среднего в обоих направлениях, называемые хвостами распределения..

Точная форма t-распределения Стьюдента зависит от размера выборки. Для выборок более 30 это очень похоже на нормальное распределение. По мере уменьшения размера выборки «хвосты» становятся больше, отражая повышенную неопределенность, связанную с выводами, основанными на небольшой выборке.

Как сделать Т-тест в Excel

Прежде чем вы сможете применить T-тест, чтобы определить, есть ли статистически значимая разница между средними значениями двух выборок, вы должны сначала выполнить F-тест. Это связано с тем, что для T-теста выполняются разные расчеты в зависимости от того, есть ли значительная разница между дисперсиями.

Для выполнения этого анализа вам понадобится надстройка Analysis Toolpak.

Проверка и загрузка надстройки Analysis Toolpak

Чтобы проверить и активировать пакет инструментов анализа, выполните следующие действия:

  1. Выберите вкладку ФАЙЛ >выберите Опции.
  2. В диалоговом окне «Параметры» выберите Надстройки на вкладках с левой стороны.
  3. В нижней части окна выберите раскрывающееся меню «Управление», затем выберите Надстройки Excel. Выберите Перейти.

    Image
    Image
  4. Убедитесь, что флажок Пакет инструментов анализа установлен, затем выберите OK..
  5. Пакет анализа теперь активен, и вы готовы применить F-тесты и Т-тесты.

Выполнение F-теста и T-теста в Excel

  1. Введите два набора данных в электронную таблицу. В данном случае мы рассматриваем продажи двух товаров в течение недели. Также рассчитывается средний дневной объем продаж для каждого продукта вместе со стандартным отклонением.

    Image
    Image
  2. Выберите вкладку Данные > Анализ данных

    Image
    Image
  3. Выберите F-Test Two-Sample for Variances из списка, затем выберите OK..

    Image
    Image

    F-тест очень чувствителен к отклонениям от нормы. Поэтому может быть безопаснее использовать тест Уэлча, но в Excel это сложнее.

  4. Выберите диапазон переменной 1 и диапазон переменной 2; установите Альфа (0,05 дает 95% уверенности); выберите ячейку для верхнего левого угла вывода, учитывая, что это заполнит 3 столбца и 10 строк. Выберите OK..

    Image
    Image

    Для диапазона переменной 1 должна быть выбрана выборка с наибольшим стандартным отклонением (или дисперсией).

  5. Просмотрите результаты F-теста, чтобы определить, есть ли существенная разница между дисперсиями. Результаты дают три важных значения:

    • F: Отношение между дисперсиями.
    • P(F<=f) one-tail: Вероятность того, что переменная 1 на самом деле не имеет большей дисперсии, чем переменная 2. Если она больше, чем альфа, которая обычно составляет 0,05, то существенной разницы между дисперсиями нет.
    • F Критический односторонний вариант: значение F, необходимое для получения P(F<=f)=α. Если это значение больше, чем F, это также указывает на отсутствие существенной разницы между дисперсиями.

    P(F<=f) также можно рассчитать, используя функцию FРАСП, используя F и степени свободы для каждой выборки в качестве входных данных. Степени свободы - это просто количество наблюдений в выборке минус один.

  6. Теперь, когда вы знаете, есть ли разница между дисперсиями, вы можете выбрать соответствующий Т-тест. Выберите вкладку Данные > Анализ данных, затем выберите либо t-Test: Two-Sample Assisting Equal Variancesor t-тест: две выборки, предполагающие неравные дисперсии

    Image
    Image
  7. Независимо от того, какой вариант вы выбрали на предыдущем шаге, вам будет представлено одно и то же диалоговое окно для ввода сведений об анализе. Для начала выберите диапазоны, содержащие образцы для Диапазон переменной 1 и Диапазон переменной 2..

    Image
    Image
  8. Предполагая, что вы хотите проверить отсутствие различий между средними значениями, установите Hypothesized Mean Difference равным нулю.
  9. Установите уровень значимости Alpha (0,05 дает достоверность 95%) и выберите ячейку для верхнего левого угла вывода, учитывая, что это заполнит 3 столбца и 14 строк. Выберите OK..
  10. Просмотрите результаты, чтобы решить, есть ли существенная разница между средними значениями.

    Как и в случае с F-тестом, если значение p, в данном случае P(T<=t), больше альфа, то существенной разницы нет. Однако в этом случае даны два p-значения, одно для одностороннего теста, а другое для двустороннего теста. В этом случае используйте двустороннее значение, поскольку любая переменная, имеющая большее среднее значение, будет существенной разницей.

Рекомендуемые: