Pruebas de hipótesis: Qué, cómo y por qué [ 5 Recursos didácticos]

La comprobación de hipótesis es un método utilizado por muchos analistas de los sectores privado y gubernamental para hacer afirmaciones o suposiciones probables sobre datos de población.

Si ha tratado o estudiado datos de población, seguro que se ha topado con esta herramienta vital que es la prueba de hipótesis.

Se pueden emplear muchos métodos para hacer suposiciones, pero no todos proporcionan una mayor precisión.

Y si no está seguro de sus datos pero aun así quiere utilizarlos, podría ser arriesgado para su organización.

La prueba de hipótesis es una buena estrategia para lograr un mayor nivel de precisión. Ha sido fundamental en el análisis de poblaciones.

En este artículo, hablaré de qué es la comprobación de hipótesis, cómo funciona, sus ventajas y sus casos de uso.

Así que, sin más preámbulos, ¡comencemos!

¿Qué es la prueba de hipótesis?

La comprobación de hipótesis es un método de inferencia estadística que utilizan los analistas para comprobar si los datos de población disponibles apoyan suficientemente una hipótesis dada y hacer suposiciones a partir de ella.

Mediante este método, los analistas pueden evaluar fácilmente una hipótesis y determinar hasta qué punto es exacta la suposición basándose en los datos de que disponen.

https://www.youtube.com/watch?v=joNb67F1UbY&t=71s

En palabras sencillas, se trata de un proceso de prueba basado en la estadística inferencial que permite llegar a un veredicto sobre los datos de la población a partir de los datos de la muestra recopilados.

En general, es casi imposible que los analistas encuentren propiedades o algún parámetro concreto de toda la población. Pero a través de las pruebas de hipótesis, puede hacer una predicción informada y tomar una decisión basada en los datos de la muestra y su exactitud.

Tipos de pruebas de hipótesis

Los diferentes tipos de prueba de hipótesis son:

Hipótesis nula: Las estadísticas muestran que los datos de la muestra son abruptos y que no hay correlación entre las dos variables en los datos de la muestra dada.
Hipótesis alternativa: Demuestra la tesis principal y se opone a la hipótesis nula. Es la principal fuerza motriz del proceso de prueba porque muestra una correlación entre dos variables en los datos de la muestra.
Hipótesis no direccional: Este tipo de prueba de hipótesis sirve como hipótesis de dos colas. Describe que no hay dirección entre dos variables en los datos de la muestra y que el valor verdadero no es el mismo que el valor predicho.
Hipótesis direccional: La hipótesis direccional describe alguna relación entre dos variables. En este caso, una variable de los datos de la muestra puede influir en las otras variables.
Hipótesis estadística: Ayuda a los analistas a evaluar si los datos y el valor satisfacen una determinada hipótesis. Es muy útil para hacer afirmaciones y suposiciones sobre el resultado de un parámetro de la población de la muestra.

A continuación, analicemos los métodos de comprobación de hipótesis.

Métodos de comprobación de hipótesis

Para evaluar si una hipótesis específica es cierta o no, como analista, necesitará muchas pruebas plausibles para llegar a una conclusión. En este proceso de prueba, se establece una hipótesis nula y otra alternativa antes de iniciar la evaluación.

La comprobación de hipótesis no implica un único método, sino muchos para evaluar si los datos de la muestra son favorables. Como analista, tiene que considerar los datos y el tamaño de la muestra y elegir qué método de prueba de hipótesis le conviene.

Prueba de normalidad

Es un método estándar de prueba de hipótesis para analizar la distribución regular en los datos de la muestra. Durante el proceso de prueba, se comprueba si los puntos de datos agrupados en torno a la media están por debajo o por encima de la media.

En esta prueba estadística, la probabilidad de que los puntos estén por encima o por debajo de la media es igual de probable. Se forma una curva de campana que se distribuye por igual a ambos lados de la media.

Prueba Z

Es otro tipo de prueba de hipótesis que se utiliza cuando los datos de la población se distribuyen normalmente. Prueba que la media de dos parámetros de población separados son diferentes cuando se conoce la varianza de los datos.

Durante el análisis de datos de población, es muy probable que utilice este tipo cuando el tamaño de la muestra de datos sea superior a treinta. Además, el teorema del límite central es otra razón que hace que la prueba Z sea adecuada, ya que el teorema afirma que cuando el tamaño de la muestra aumenta, las muestras se distribuyen normalmente.

Prueba T

La prueba de hipótesis T-Test la utilizará cuando el tamaño de la muestra sea limitado y se distribuya normalmente. En general, se aplica principalmente cuando el tamaño de la muestra es inferior a 30 y desconoce la desviación típica del parámetro.

Cuando realice una prueba T, lo hará para calcular los intervalos de confianza de datos específicos de la población.

Prueba Chi-cuadrado

La prueba chi-cuadrado es un popular proceso de comprobación de hipótesis que se utiliza a menudo para evaluar la idoneidad e integridad de una distribución de datos.

Sin embargo, la razón principal por la que utilizará este tipo de hipótesis es cuando desee probar la varianza de la población frente a una varianza de la población de un valor supuesto o conocido. Se realizan diferentes pruebas Chi-Cuadrado, pero el tipo más común es la prueba Chi-Cuadrado de varianza e independencia.

Prueba ANOVA

Abreviado como análisis de la varianza, es un método de prueba estadística que ayuda a comparar los conjuntos de datos de dos muestras. Sin embargo, permite comparar más de dos medias a la vez.

También explica una variable dependiente y una variable independiente de los datos de la muestra. El uso del ANOVA es bastante similar al uso de la prueba Z y la prueba T, pero estas dos últimas se limitan a sólo dos medias.

¿Cómo funciona la prueba de hipótesis?

Todo analista que utiliza la prueba de hipótesis utiliza datos de muestras aleatorias para el análisis y la medición. Durante la prueba, los datos de la muestra aleatoria se utilizan para probar la hipótesis nula y la hipótesis alternativa.

Como hemos comentado antes, la hipótesis nula y la hipótesis alternativa son totalmente excluyentes entre sí y, durante el resultado de la prueba, sólo una puede ser cierta.

Sin embargo, hay algunos casos en los que se rechaza la hipótesis nula; la hipótesis alternativa no siempre es cierta.

hypothesistestingwork — **Fuente:** Analytics Steps

valor p: Cuando comienza el proceso de prueba, interviene el valor p o valor de probabilidad, que muestra si el resultado es significativo o no. No sólo eso, sino que el valor p también muestra la probabilidad de que se produzca un error al descartar o no una hipótesis nula durante la prueba. El valor p resultante es 0 ó 1, que se compara a continuación con el nivel de significación o nivel alfa.

El nivel de significación define aquí el riesgo aceptable al rechazar una hipótesis nula durante la prueba. Es importante recordar que el resultado de la prueba de hipótesis puede dar lugar a dos tipos de errores:

El error de tipo1 se produce cuando el resultado de la prueba rechaza la hipótesis nula aunque sea cierta.
El error de tipo 2 aparece cuando el resultado de la muestra acepta la hipótesis nula a pesar de ser falsa.

Todos los valores que provocan el rechazo de la hipótesis nula se almacenan en la región crítica. Y es el valor crítico el que separa las regiones críticas de las demás.

Pasos para realizar la prueba de hipótesis

La prueba de hipótesis implica principalmente cuatro pasos:

Definir las hipótesis: En el primer paso, su trabajo como analista consiste en definir las dos hipótesis de modo que sólo una pueda ser cierta. La hipótesis nula indicará que no hay diferencia en la media del IMC, mientras que la hipótesis alternativa afirmará que hay una diferencia significativa en la media del IMC.
Planifique: En el siguiente paso, deberá diseñar un plan de análisis sobre cómo puede analizar los datos de la muestra. Es vital que realice el muestreo y recoja los datos de la muestra para asegurarse de que está diseñada para probar su hipótesis.
Analice los datos de la muestra: Después de decidir cómo evaluará los datos, es hora de comenzar con el proceso. Tendrá que analizar los datos de la muestra físicamente para que no haya redundancia. Mientras analiza los datos, deberá comprobar que las muestras son independientes entre sí y que ambos tamaños de muestra son lo suficientemente grandes.
Calcule las estadísticas de la prueba: En esta etapa, deberá calcular las estadísticas de la prueba y hallar el valor p. El valor p se determinará suponiendo que la hipótesis nula es cierta.
Evalúe el resultado: En la etapa final, tendrá que evaluar el resultado de la prueba de hipótesis. Aquí decidirá si rechaza la hipótesis nula o declara su verosimilitud basándose en los datos de la muestra.

A continuación, exploraremos los beneficios de la prueba de hipótesis.

Beneficios de la prueba de hipótesis

Los beneficios de la prueba de hipótesis son:

Le ayuda a analizar la solidez de su afirmación sobre una decisión de datos.
Como analista, le permite crear un entorno fiable para decidir sobre los datos de la muestra.
Le permite determinar si los datos de la muestra implicados en la prueba de hipótesis son estadísticamente significativos.
Es beneficioso para evaluar la fiabilidad y la validez de los resultados de las pruebas en cualquier proceso de prueba sistemático.

Le ayuda a extrapolar los datos de una etapa de muestra a una población mayor en función de las necesidades.

Casos de uso de las pruebas de hipótesis

La prueba de hipótesis se utiliza en varios sectores para adivinar adecuadamente la exactitud de los datos de la muestra. Algunos ejemplos reales de comprobación de hipótesis son:

#1. Ensayos clínicos

Las pruebas de hipótesis se utilizan mucho durante los ensayos clínicos porque ayudan a los profesionales médicos a decidir si un nuevo fármaco, tratamiento o procedimiento será eficaz o no basándose en los datos de la muestra.

Un médico puede pensar que un tratamiento podría aliviar los niveles de potasio en algunos pacientes. El médico puede medir el nivel de potasio de un grupo de pacientes antes de realizar el tratamiento y volver a comprobar el nivel.

A continuación, el médico realiza una prueba de hipótesis donde H0: Uafter = Ubefore, y denota que el nivel de potasio es el mismo que antes tras aplicar el tratamiento. Otra hipótesis indica Ha: Uafter < Ubefore, y significa que el nivel de potasio ha disminuido tras aplicar el tratamiento.

Por lo tanto, si el valor p es inferior al nivel de significación, el médico puede concluir que el tratamiento puede reducir el nivel de potasio.

#2. Fabricación

Las pruebas de hipótesis se utilizan en las plantas de fabricación para ayudar a los supervisores a decidir si el nuevo método o técnica es eficaz o no.

Por ejemplo, algunas unidades de fabricación pueden utilizar las pruebas de hipótesis para averiguar si el nuevo método les ayuda a reducir el número de productos defectuosos por lote. Supongamos que el número de productos defectuosos es de 300 por lote.

El fabricante tiene que determinar la media del número total de productos defectuosos producidos antes y después de utilizar el método. Pueden realizar pruebas de hipótesis y utilizar la hipótesis H0: Udespués = Uantes, donde la media de productos defectuosos producidos después de aplicar un nuevo método es la misma que antes.

Otra hipótesis es HA: Uafter no es igual a Ubefore, lo que significa que el número total de productos defectuosos producidos tras aplicar el nuevo método no es el mismo.

Tras la prueba, si el valor p es inferior al nivel de significación, la unidad de fabricación puede concluir que el número de productos defectuosos producidos ha cambiado.

#3. Agricultura

Las pruebas de hipótesis se utilizan a menudo para averiguar si un fertilizante o un pesticida provocan crecimiento e inmunidad en las plantas. Los biólogos pueden utilizar las pruebas para demostrar que una determinada planta podría crecer más de 15 pulgadas tras aplicar el nuevo fertilizante.

El biólogo podría aplicar el fertilizante durante un mes para recoger datos de la muestra. Cuando el biólogo realiza una prueba, una hipótesis es H0 U=15 pulgadas, lo que indica que el fertilizante no causa ninguna mejora en el crecimiento medio de la planta.

Otra hipótesis es HA: U>15 pulgadas, lo que significa que el abono causa una mejora en el crecimiento medio de la planta. Tras realizar la prueba cuando el valor p es inferior al nivel de significación, el biólogo puede demostrar que los fertilizantes causan un mayor crecimiento que antes.

Recursos de aprendizaje

#1. Estadística: Una introducción paso a paso de Udemy

Udemy ofrece un curso sobre estadística en el que aprenderá una introducción paso a paso a la estadística, que abarca la comprobación de hipótesis. Este curso tiene ejemplos y lecciones de un ex-científico de datos de Google para ayudarle a dominar los intervalos de confianza, las pruebas de hipótesis y más.

#2. Estadística esencial para el análisis de datos por Udemy

Este curso de Udemy sobre estadística esencial para el análisis de datos le ayudará a aprender estadística con proyectos del mundo real, actividades divertidas, pruebas de hipótesis, distribuciones de probabilidad, análisis de regresión y mucho más.

#3. Estadística para la ciencia de datos y el análisis empresarial

Este curso sobre estadística para la ciencia de datos y el análisis empresarial ofrecido por Udemy le ayudará a aprender las pruebas de hipótesis. Cubre diferentes temas de estadística, permitiendo a los científicos de datos y a los analistas empresariales aprenderlos y dominarlos. Cubre la estadística inferencial y descriptiva junto con el análisis de regresión.

#4. Pruebas de hipótesis por Jim Frost

Este libro está disponible en Amazon y es una guía intuitiva para ayudar a los analistas a tomar decisiones basadas en datos.

Vista previa	Producto	Valoración
	Hypothesis Testing: An Intuitive Guide for Making Data Driven Decisions		Buy on Amazon

Cubre el funcionamiento de las pruebas de hipótesis, por qué las necesita, cómo utilizar eficazmente los intervalos de confianza, los valores p, los niveles de significación y muchos temas más.

#5. Pruebas de hipótesis, de Scott Hartshorn

Este libro es único por sus ejemplos visuales y es el mejor para los principiantes que buscan una guía rápida sobre las pruebas de hipótesis.

Vista previa	Producto	Valoración
	Hypothesis Testing: A Visual Introduction To Statistical Significance		Buy on Amazon

Le introducirá en el significado de la estadística, los tipos y su funcionamiento. No necesita que tenga conocimientos previos profundos de estadística, sino que lo explica todo de forma intuitiva.

Palabras finales

La comprobación de hipótesis ayuda a verificar una suposición y, a continuación, a desarrollar datos estadísticos basados en la evaluación. Se utiliza en muchos sectores, desde la fabricación y la agricultura hasta los ensayos clínicos y la informática. Este método no sólo es preciso, sino que también le ayuda a tomar decisiones basadas en datos para su organización.

A continuación, consulte los recursos de aprendizaje para convertirse en analista empresarial.