Fórmulas de Desviación Estándar

La desviación simplemente significa qué tan lejos de lo normal

Desviación Estándar

La Desviación Estándar es una medida de cuán separados están los números.

Tal vez quieras leer primero esta página más simple sobre Desviación Estándar.

Pero aquí explicamos las fórmulas.

El símbolo de Desviación Estándar es σ (la letra griega sigma en minúscula).

Esta es la fórmula de Desviación Estándar:

raíz cuadrada de [(1 / N) veces Sigma i = 1 a N de (xi - mu) ^ 2]

¿Pero qué..? ¡Por favor explica!

Okay. Vamos a explicarlo paso a paso.

Digamos que tenemos un montón de números como 9, 2, 5, 4, 12, 7, 8, 11.

Para calcular la desviación estándar de esos números:

La fórmula de verdad dice todo eso, y te mostraré cómo.

La fórmula desglosada y explicada

Primero, tengamos algunos valores de ejemplo para trabajar:

rosa

Ejemplo: Roberto tiene 20 rosales.

El número de flores en cada rosal es

9, 2, 5, 4, 12, 7, 8, 11, 9, 3, 7, 4, 12, 5, 4, 10, 9, 6, 9, 4

Calcula la Desviación Estándar.

 

Paso 1. Calcula la media

En la fórmula de arriba μ (la letra griega "mu") es la media de todos nuestros valores ...

Ejemplo: 9, 2, 5, 4, 12, 7, 8, 11, 9, 3, 7, 4, 12, 5, 4, 10, 9, 6, 9, 4

La media es:

9+2+5+4+12+7+8+11+9+3+7+4+12+5+4+10+9+6+9+4 20

= 140 20 = 7

Entonces:

μ = 7

 

Paso 2. Luego, para cada número: resta la media y eleva al cuadrado el resultado

Esta es la parte de la fórmula que dice:

(xi - mu)^2

¿Y qué significa xi ? Son los valores individuales de x: 9, 2, 5, 4, 12, 7, etc.

En otras palabras, x1 = 9, x2 = 2, x3 = 5, etc.

Entonces dice "para cada valor, resta la media y eleva al cuadrado el resultado", así

Ejemplo (continuación):

(9 - 7)2 = (2)2 = 4

(2 - 7)2 = (-5)2 = 25

(5 - 7)2 = (-2)2 = 4

(4 - 7)2 = (-3)2 = 9

(12 - 7)2 = (5)2 = 25

(7 - 7)2 = (0)2 = 0

(8 - 7)2 = (1)2 = 1

... etc ...

Y tenemos estos resultados:

4, 25, 4, 9, 25, 0, 1, 16, 4, 16, 0, 9, 25, 4, 9, 9, 4, 1, 4, 9

 

Paso 3. Luego calcula la media de esas diferencias al cuadrado.

Para calcular la media, suma todos los valores y luego divídelos por cuántos son.

Primero suma todos los valores del paso anterior.

Pero, ¿cómo decimos "sumarlos todos" en matemáticas? Usamos "Sigma": Σ

La útil Notación Sigma nos sirve para indicar la suma de cuántos términos queramos:

Notación Sigma
Sigma Notation

Queremos sumar todos los valores de 1 a N, donde N = 20 en nuestro caso porque hay 20 valores:

Ejemplo (continuación):

sigma i=1 a N de (xi - mu)^2

Lo que significa: Suma todos los valores de (x1-7)2 a (xN-7)2

 

Ya calculamos (x1-7)2=4, etc. en el paso anterior, así que ahora solo sumamos:

= 4+25+4+9+25+0+1+16+4+16+0+9+25+4+9+9+4+1+4+9 = 178

Pero aún no es la media, debemos dividir por cuántos son, lo que se hace multiplicando por 1/N (es lo mismo que dividir por N):

Ejemplo (continuación):

(1/N) veces sigma i=1 a N de (xi - mu)^2

Media de las diferencias al cuadrado = (1/20) × 178 = 8.9

(Nota: este valor se llama "Varianza")

 

Paso 4. Toma la raíz cuadrada de eso:

Ejemplo (conclusión):

raíz cuadrada de [(1 / N) veces Sigma i = 1 a N de (xi - mu) ^ 2]

σ = √(8.9) = 2.983...

¡LISTO!

 

Desviación Estándar de una Muestra

Pero espera, hay más...

... a veces los datos son solo una muestra de toda la población.

rosa

Ejemplo: ¡Roberto tiene 20 rosales, pero solo contó las flores en 6 de ellos!

La "población" son los 20 rosales,

y la "muestra" son los 6 arbustos de los que Roberto contó las flores.

Digamos que los recuentos de flores de Roberto son:

9, 2, 5, 4, 12, 7

Todavía podemos estimar la Desviación Estándar.

Pero cuando usamos la muestra como una estimación de toda la población, la fórmula de Desviación Estándar cambia a esto:

Esta es la fórmula para Desviación Estándar Muestral:

raíz cuadrada de [(1 / (N-1)) veces Sigma i = 1 a N de (xi - xbarra) ^ 2]

El cambio importante es "N-1" en lugar de "N" (que se llama "corrección de Bessel").

Los símbolos también cambian para reflejar que estamos trabajando con una muestra en lugar de toda la población:

  • La media es ahora x (para media muestral) en lugar de μ (la media de la población),
  • Y la respuesta es s (para Desviación Estándar Muestral) en lugar de σ.

Pero eso no afecta los cálculos. Solo N-1 en lugar de N es lo que cambia en los cálculos.

 

OK, calculemos ahora la Desviación Estándar de la Muestra:

Paso 1. Calcula la media

Ejemplo 2: Usando los valores de la muestra 9, 2, 5, 4, 12, 7

La media es (9+2+5+4+12+7) / 6 = 39/6 = 6.5

Así que:

x = 6.5

 

Paso 2. Luego, para cada número: resta la media y eleva al cuadrado el resultado

Ejemplo 2 (continuación):

(9 - 6.5)2 = (2.5)2 = 6.25

(2 - 6.5)2 = (-4.5)2 = 20.25

(5 - 6.5)2 = (-1.5)2 = 2.25

(4 - 6.5)2 = (-2.5)2 = 6.25

(12 - 6.5)2 = (5.5)2 = 30.25

(7 - 6.5)2 = (0.5)2 = 0.25

 

Paso 3. Luego calcula la media de esas diferencias al cuadrado.

Para calcular la media, suma todos los valores y luego divídelos por cuántos son.

Pero espera ... estamos calculando la Desviación Estándar de la Muestra, así que en lugar de dividir por cuántos (N), dividiremos por N-1

Ejemplo 2 (continuación):

Suma = 6.25 + 20.25 + 2.25 + 6.25 + 30.25 + 0.25 = 65.5

Divide entre N-1: (1/5) × 65.5 = 13.1

(Este valor se llama "Varianza de la Muestra")

 

Paso 4. Calcula la raíz cuadrada de eso:

Ejemplo 2 (conclusión):

raíz cuadrada de [(1 / (N-1)) veces Sigma i = 1 a N de (xi - xbarra) ^ 2]

s = √(13.1) = 3.619...

¡LISTO!

Comparar

Cuando utilizamos toda la población obtuvimos: Media = 7, Desviación Estándar = 2.983 ...

Cuando usamos la muestra obtuvimos: Media muestral = 6.5, Desviación Estándar de la muestra = 3.619 ...

Nuestra Media muestral estaba equivocada en un 7%, y nuestra Desviación Estándar Muestral estaba equivocada en un 21%.

¿Por qué una muestra?

Principalmente porque es más fácil y más barato.

Imagina que quieres saber qué piensa todo el país ... no puedes preguntarle a millones de personas, así que en lugar de eso le preguntas a quizás 1,000 personas.

Hay una buena cita (posiblemente por Samuel Johnson):

"No es necesario comer todo el animal para saber que la carne es dura".

Esta es la idea esencial del muestreo. Para obtener información sobre la población (como la media y la desviación estándar), no necesitamos mirar a todos los miembros de la población; solo necesitamos una muestra.

Pero cuando tomamos una muestra, perdemos algo de precisión.

Resumen

La Desviación Estándar de la Población:

  raíz cuadrada de [(1 / N) veces Sigma i = 1 a N de (xi - mu) ^ 2]
La Desviación Estándar de la Muestra:   raíz cuadrada de [(1 / (N-1)) veces Sigma i = 1 a N de (xi - xbarra) ^ 2]

 

¡Refuerza tu aprendizaje resolviendo los siguientes retos sobre este tema! (Nota: están en inglés).