domingo, 29 de mayo de 2016

  CETIS #54 “GUADALUPE VICTORIA”


ALUMNAS:
ABIGAIL GUERRERO ARAIZA
EVELYN YAZBETH MORA ALVAREZ

6°F


PROBABILIDAD Y ESTADISTICA


PROFA. MARIA DE LOS ANGELES RUIZ SANTIAGO

TIPOS DE GRAFICAS


Gráfica creciente


Una gráfica es creciente si al aumentar la variable independiente aumenta la otra variable.








Gráfica decreciente


Una gráfica es decreciente si al aumentar la variable independiente disminuye la otra variable.




Gráfica constante


Una gráfica es constante si al variar la variable independiente la otra permanece invariable.




Una gráfica puede tener a la vez partes crecientes y decrecientes.



TIPOS DE ESTADISTICAS


La estadística es una técnica basada en la recolección, recuento, clasificación, e interpretación de un conjunto de datos obtenidos a partir de la observación, con el propósito de poder llevar a cabo comparaciones y realizar estimaciones.

Existen distintos tipos de estadística:


DESCRIPTIVA O DEDUCTIVA: esta clase de estadística se utiliza con el propósito de recolectar, describir y resumir un conjunto de datos obtenidos. Estos pueden visualizarse de manera numérica y gráfica. Sin embargo, su uso se acota sólo al uso de la información obtenida. Es decir, que a partir de loa misma no se puede realizar ningún tipo de generalización.

INFERENCIAL O INDUCTIVA: de manera contraria a la anterior, esta clase de estadística tiene la particularidad de que a partir de los datos muestrales que maneja, es posible realizar conclusiones y predicciones que incluyan a toda la población. Es decir, que los resultados obtenidos a partir del análisis y conclusión podrán ser extrapolados, y de esta forma realizar  un pronóstico inclusivo. Las inferencias pueden presentarse a través de respuestas a preguntas del tipo si/no, relaciones entre una serie de variables, estimaciones numéricas, entre otras.

APLICADA: Está conformada por las dos clases de estadísticas anteriores. Su objetivo consiste en deducir resultados sobre un universo, a partir de una muestra determinada. Este tipo de estadística puede ser aplicada en cualquier área que no pertenezca a ella, tal como historia, psicología, etc.

ESTADÍSTICA MATEMÁTICA: se refiere al empleo de la estadística pero desde un punto de vista formal, a través del uso de distintas ramas propias de la matemática y de la teoría de la probabilidad. Su uso es necesario debido a que los datos que maneja la estadística matemática son aleatorios e inciertos.

jueves, 26 de mayo de 2016

DESVIACION ESTANDAR

La Desviación Estándar

La desviación estándar es un índice numérico de la dispersión de un conjunto de datos (o población). Mientras mayor es la desviación estándar, mayor es la dispersión de la población. La desviación estándar es un promedio de las desviaciones individuales de cada observación con respecto a la media de una distribución. Así, la desviación estándar mide el grado de dispersión o variabilidad. En primer lugar, midiendo la diferencia entre cada valor del conjunto de datos y la media del conjunto de datos. Luego, sumando todas estas diferencias individuales para dar el total de todas las diferencias. Por último, dividiendo el resultado por el número total de observaciones (normalmente representado por la letra “n”) para llegar a un promedio de las distancias entre cada observación individual y la media. Este promedio de las distancias es la desviación estándar y de esta manera representa dispersión.

Matemáticamente, la desviación estándar podría, a primera vista, parecer algo complicada. Sin embargo, es en realidad un concepto extremadamente simple. En realidad no importa si usted no sabe calcular con exactitud la desviación estándar, siempre y cuando usted comprenda claramente el concepto.



La desviación estándar es un indicador en extremo valioso con muchas aplicaciones. Por ejemplo, los estadísticos saben que cuando un conjunto de datos se distribuye de manera “normal”, el 68% de las observaciones de la distribución tiene un valor que se encuentra a menos de una desviación estándar de la media. También saben que el 96% de todas las observaciones tiene un valor no es mayor a la media más o menos dos desviaciones estándar (la Figura 18 grafica esta información).
La desviación estándar de una población es normalmente representada por la letra griega (sigma), cuando se calcula sobre la base de toda la población; por la letra s (minúscula) cuando se infiere de una muestra; y por la letra S (mayúscula) cuando simplemente corresponde a la desviación estándar de una muestra. La fórmula de la desviación estándar es  , donde representa la suma de las diferencias al cuadrado entre cada observación y la media y N representa el número total de observaciones. La aparente complicación de la fórmula surge del hecho de que al restar la media a los valores de cada observación individual para calcular las diferencias ( ), los valores de las observaciones que están bajo la media producirán diferencias negativas, mientras que los valores de las observaciones que son mayores que la media proporcionarán valores positivos. Así, las diferencias positivas y negativas se compensarán entre sí y, en el caso de una distribución simétrica, producirán una suma igual a cero para la suma de las desviaciones individuales. Para evitar este problema, las desviaciones se elevan al cuadrado, de modo que todas las desviaciones sean positivas y se puedan sumar. Después, se calcula la raíz cuadrada para ‘compensar’, por decirlo así, la elevación al cuadrado anterior de los valores. Cuando no se incluye la raíz cuadrada, el resultado es otro famoso indicador de dispersión conocido como la “varianza”.

VARIANZA

VARIANZA


La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística.
La varianza se representa por signo.
varianza
varianza

Varianza para datos agrupados

varianzavarianza

Para simplificar el cálculo de la varianza vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.
varianzavarianza

Ejercicios de varianza

Ejercicio 1:
Calcular la varianza de la distribución:
9, 3, 8, 8, 9, 8, 9, 18
media
varianza
Ejercicio 2:
Calcular la varianza de la distribución de la tabla:
 xifixi · fixi2 · fi
[10, 20)15115225
[20, 30)2582005000
[30,40)351035012 250
[40, 50)45940518 225
[50, 6055844024 200
[60,70)65426016 900
[70, 80)75215011 250
  421 82088 050
media
varianza

Propiedades de la varianza

La varianza será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales.
Si a todos los valores de la variable se les suma un número la varianza no varía.
3 Si todos los valores de la variable se multiplican por un número la varianza queda multiplicada por el cuadrado de dicho número.
Si tenemos varias distribuciones con la misma media y conocemos sus respectivas varianzas se puede calcular la varianza total.
Si todas las muestras tienen el mismo tamaño:
varianzas
Si las muestras tienen distinto tamaño:
varianzas

Observaciones sobre la varianza

La varianza, al igual que la media, es un índice muy sensible a las puntuaciones extremas.
En los casos que no se pueda hallar la media tampoco será posible hallar la varianza.
La varianza no viene expresada en las mismas unidades que los datos, ya que las desviaciones están elevadas al cuadrado.

INTERSECCIÓN DE CONJUNTOS



Intersección de conjuntos definición y ejemplos


Definición
La intersección de conjuntos de dos conjuntos A y B se define como el conjunto de los elementos que están en el conjunto A y en el conjunto B. La intersección de dos conjuntos A y B se denota como A ∩ B. También, se puede escribir como A ∩ B = {x|x∈A y x∈B}
Ejemplos:
  1. Dados A={a, b, 1, 2, 3} y B={3, 4}; se tiene que A ∩ B={3}
  2. Dados A={a, b} y B={a, b, u, v}; se tiene que A ∩ B={a, b}
  3. Dados A={a, b, c, d, e, f, g} y B={d, e, f, g, h, i}; se tiene que A ∩ B={d, e, f, g}
  4. Dados A={♠, ♣} y B={♠, ♣, ♦}; se tiene que A ∩ B={♠, ♣}
  5. Dados A={x, y, ♦, ◊} y B={y, z, ♠, ♣, ♥, ♦, ◊}; se tiene que A ∩ B={y, ♦, ◊}
  6. Dados A={lunes, martes} y B={martes, viernes, sábado, domingo}; se tiene que A ∩ B={martes}
  7. Dados A={a, o} y B={a, e, i, o, u}; se tiene que A ∩ B={a, o}
  8. Dados A={primavera, verano, otoño} y B={verano, otoño};  se tiene que A ∩ B={verano, otoño}
  9. Dados A={Venus, Tierra, Saturno, Urano, } y B={Marte, Júpiter, Saturno, Urano, Neptuno}; se tiene que A ∩ B={Saturno, Urano}
  10. Dados A={2x|2<x<10, x∈N} y B={todos los números enteros};  se tiene que  A ∩ B={6, 8, 10, 12, 14, 16, 18}
La intersección de conjuntos tiene las siguientes propiedades:
  • A ∩ B ⊂ A. La intersección de dos conjuntos A y B es subconjunto de A.
  • A ∩ B ⊂ B. La intersección de dos conjuntos A y B es subconjunto de B.
  • A ∩ B = B ∩ A. La intersección de dos conjuntos A y B es igual a la intersección de los conjuntos B y A.
  • A ∩ Ø ⊂ Ø. La intersección de A con el conjunto vacío Ø es subconjunto del conjunto vacío Ø.

UNION DE CONJUNTOS

Unión de conjuntos


La unión de los conjuntos A y B es otro conjunto A  B que contiene todos los elementos de A y de B.
En la teoría de conjuntos, la unión de dos (o más) conjuntos es una operación que resulta en otro conjunto, cuyos elementos son los elementos de los conjuntos iniciales. Por ejemplo, el conjunto de los números naturales es la unión del conjunto de los números pares positivos P y el conjunto de los números impares positivos I:
P = \{ 2, 4, 6, \ldots \}
I = \{ 1, 3, 5, \ldots \}
\mathbb{N} = \{ 1, 2, 3, 4, \ldots \}
La unión de conjuntos se denota por el símbolo , de modo que por ejemplo, N = P  I.

TIPOS DE CONJUNTOS

TIPOS DE CONJUNTOS

Un conjunto es una colección o agrupación de objetos o elementos que responden a una misma categoría o grupo. Haciendo un análisis de los miembros que lo conforman pueden existen los siguientes tipos:

Conjunto finito: en este conjunto los elementos o miembros que los conforman pueden ser enumerados o contados. Por ejemplo, el agrupamiento de todas las letras del abecedario confirmaría un conjunto de esta clase.
Conjunto infinito: en estos conjuntos, los miembros que lo conforman no pueden ser enumerados ni contados. Un ejemplo de conjunto infinito sería todos los granos de arena del planeta.
Conjunto unitario: estos conjuntos están conformados por un solo miembro o elemento, por ejemplo, la letra A.
Conjunto vacío: estos conjuntos carecen de elementos o bien, estos son inexistentes, por ejemplo un unicornio, en el caso del elemento inexistente.
Conjunto referencial: a este conjunto también se la conoce como universal y se caracterizan por estar conformados por los miembros de todos los elementos que forman parte de la caracterización. Por ejemplo: el conjunto A esta compuesto de 1,3, 5, 7 y el B por 2, 4, 6. Mientras que el conjunto universal es 1, 2, 3, 4, 5, 6, 7.
Conjuntos disyuntivos: estos conjuntos no poseen ningún elemento o miembro que coincida. Esto también se lo puede expresar diciendo que la intersección entre los conjuntos disyuntivos es el conjunto vacío. Por ejemplo el grupo A contiene los elementos a, b, c, d mientras que el B e, f, g, h. Los conjuntos A y B entonces no tienen ningún elemento en común.
Conjuntos equivalentes: son aquellos conjuntos que poseen el mismo número cardinal, lo que significa que contienen la misma cantidad de elementos. Por ejemplo el conjunto A es 1, 2, 3, 4 y el B a, b, c, d, por tanto A y B son equivalentes.
Conjuntos iguales: esto se da cuando dos o más conjuntos contienen iguales elementos. Por ejemplo el conjunto A es 2, 4, 6, 8 y el B es 8, 6, 4, 2. Ambos conjuntos son iguales por que poseen los mismos elementos, sin importar su orden.
Conjuntos congruentes: aquí pertenecen aquellos conjuntos numéricos cuyos respectivos miembros se corresponden uno a uno de modo que la distancia entre ellos se conserve, por ejemplo: el conjunto A es: 2, 4, 6, 8, 10 mientras que B es 7, 9, 11, 13, 15. De esta manera, 10 y 15, 8 y 13, 6 y 11, 4 y 9, 2 y 7 mantienen entre sí una distancia de 5.
Conjuntos no congruentes: en estos conjuntos, en cambio, no se establece correspondencia alguna entre sus miembros, por lo que la distancia entre los elementos es inconstante. Por ejemplo, el conjunto A es 2, 4, 6, 8, 10 mientras que B es 4, 5, 6, 7, 8.
Conjuntos homogéneos: en estos conjuntos los elementos o miembros que los componen responden al mismo género o tipo. Por ejemplo el conjunto A que contiene los elementos 1, 5, 3, 7, 6, 8. Aquí todos sus elementos son números por lo que conforman un conjunto homogéneo.
Conjuntos heterogéneos: estos conjuntos están compuestos por elementos que corresponden a distintos tipos, géneros o clases, por ejemplo, el conjunto A es 2, j, perro, azul.


SUBCONJUNTOS-DEFINICION Y EJEMPLOS

SUBCONJUNTOS 

Definición
Un conjunto A es subconjunto de un conjunto B, si todo elemento del conjunto A es un elemento del conjunto B. La notación A ⊂ B se lee “A es subconjunto de B”. La notación A ⊄ B se lee “A no es subconjunto de B”.
Si A no es subconjunto de B, A ⊄ B, significa que por lo menos un elemento de A no está en B.
Ejemplos:
  1. Dados A={1, 2, 3} y B={1, 2, 3, 4, 5}, se puede decir que A es subconjunto de B, A ⊂ B.
  2. Dados A={0, 1, 2, 3} y B={1, 2, 3, 4, 5}, se puede decir que A no es subconjunto de B, A ⊄ B.
Si A es subconjunto de B y B es subconjunto de A, esto es, A ⊂ B y B ⊂ A; entonces el conjunto A es igual al conjunto B. Esto quiere decir que todo elemento de A es elemento de B y viceversa. Esto implica que todo conjunto es subconjunto de sí mismo.

Ejemplos:
  1. Dados A={a, b, c, d} y B={a, b, c, d}, se puede decir que A es subconjunto de B, A ⊂ B; y que B es subconjunto de A, B ⊂ A; entonces A=B.
  2. Dados A={a, b, 1, 2} y B={a, b, 1, 2}, se puede decir que A es subconjunto de B, A ⊂ B; y que B es subconjunto de A, B ⊂ A; entonces A=B.
También, se puede establecer que los subconjuntos de un conjunto A={a, b, c} son: {a, b, c}, {a, b}, {a, c}, {b, c}, {a}, {b}, {c}, ∅. (∅ es el conjunto vació).
Ejemplos de subconjuntos:
  1. Dados A={a, b, 1, 2, 3} y B={a, b, c, 1, 2, 3, 4}, se puede decir que A ⊂ B.
  2. Dados A={a, b} y B={1, a, b}, se puede decir que A ⊂ B.
  3. Dados A={a, b, c} y B={a, b, c, d}, se puede decir que A ⊂ B.
  4. Dados A={♠, ♣} y B={♠, ♣, ♥}, se puede decir que A ⊂ B.
  5. Dados A={x, y} y B={x, y, z}, se puede decir que A ⊂ B.
  6. Dados A={lunes, martes, viernes} y B={lunes, martes, miércoles, jueves, viernes, sábado, domingo}, se puede decir que A ⊂ B.
  7. Dados A={a, o} y B={a, e, i, o, u}, se puede decir que A ⊂ B.
  8. Dados A={primavera, otoño} y B={primavera, verano, otoño, invierno}, se puede decir que A ⊂ B.
  9. Dados A={Venus, Tierra} y B={Mercurio, Venus, Tierra, Marte, Júpiter, Saturno, Urano, Neptuno}, se puede decir que A ⊂ B.
  10. Dados A={todos los números naturales} y B={todos los números enteros}, se puede decir que A ⊂ B.
A=B se lee “A es igual a B”; y A≠B se lee “A no es igual a B”. A≠B implica que existe un elemento de A que no está en B, o un elemento de B que no está en A. Pero no permite identificar si A es subconjunto de B, o si B es subconjunto de A.

RANGO

Rango
El rango da la idea de proximidad de los datos a la media. Se calcula restando el dato menor al dato mayor.
Este dato permite obtener una idea de la dispersión de los datos, cuanto mayor es el rango, más dispersos están los datos de un conjunto.
Ejemplo:
Se preguntó a 9 familias cuántas bicicletas tenían en total, dieron las respuestas ordenadas en la siguiente tabla:
rango_estadistico_1.jpg (384×67)

- ¿Cómo hallarías el rango?
Se resta el dato mayor al dato menor:  3 - 0 = 3;  Por lo tanto el rango sería 3 en este caso.
Si el conjunto de datos que se recolecta es muy numeroso, o bien, si el rango es muy amplio, es conveniente agruparlos y ordenarlos en intervalos o clases.
La amplitud o tamaño de cada intervalo se puede calcular dividiendo el valor del rango por la cantidad de intervalos que se desean obtener.
4- Ejercicios:
1- Se le pregunta a un grupo de personas acerca de la cantidad de libros que leyó durante el año 2015, y las respuestas son: 4; 3; 2; 7; 10; 8; 2; 9; 3; 6; 8; 1; 1; 9; 2. La moda de la muestra es:
a) 2        b) 3         c) 4        d) 5         e) 9
2- Halla la mediana de las siguientes series estadísticas.
a) 1, 7, 3, 2, 4, 6, 2, 5, 6
b) 4, 2, 1, 3, 8, 5, 3, 1, 6, 7
3- Se tienen dos distribuciones cuyos datos son los siguientes:
Distribución A: 9, 5, 3, 2, 1, 2, 6, 4, 9, 8, 1, 3, 5, 4, 2, 6, 3, 2, 5, 6, 7
Distribución B: 1, 1, 3, 2, 5, 6, 7, 2, 5, 4, 3, 1, 2, 1, 5, 7, 8, 9, 9, 2, 1
a) Halla el rango de ambas distribuciones.
4- Se tiene el siguiente conjunto de datos:
10, 13, 4, 7, 8, 11, 10, 16, 18, 12, 3, 6, 9, 9, 4, 13, 20, 7, 5, 10, 17, 10, 16, 14, 8, 18
a) Obtén la mediana
Respuestas:
1- a
 2- a) 1, 2, 2, 3, 4, 5, 6, 6, 7        M = 4
b) 1, 1, 2, 3, 3, 4, 5, 6, 7, 8;   La mediana es la media aritmética de los dos valores centrales, M = 3,5.
3- Rango de A: 9 - 1 = 8
     Rango de B: 9- 1 =8
4- a) Ordenamos los datos de menor a mayor:
3, 4, 4, 5, 6, 7, 7, 8, 8, 9, 9, 10, 10, 10, 10, 11, 12, 13, 13, 14, 16, 16, 17, 18, 18, 20
Como hay 26 valores, la mediana es la media de los dos valores centrales: M= 10 + 10 / 2 = 10

MEDIA, MODA Y MEDIANA

Media aritmética
 
La media aritmética es la suma de todos los datos dividida entre el número total de datos. Se calculan dependiendo de cómo vengan ordenados los datos.
 
Ejemplo:
 
¿Cuál es la media de las edades de Andrea y sus primos?
 
Media aritmética
 
La media aritmética de un grupo de datos se calcula así:
 
Se debe multiplicar cada dato con su respectiva frecuencia, sumar todos estos productos, y el resultado dividirlo por la suma de los datos.
 
 
Ejemplo:
Se ha anotado el número de hermanos que tiene un grupo de amigos. Los datos obtenidos son los siguientes:
 
Hermanos:  1, 1, 1, 1, 2, 2, 2, 3, 3, 4
 
Si hacemos el recuento de los datos y seguimos los pasos anteriormente descritos, tenemos:
 
media_aritmetica.jpg (491×375)
 



Moda
La moda de un conjunto de datos es el dato que más veces se repite, es decir, aquel que tiene mayor frecuencia absoluta. Se denota por Mo. En caso de existir dos valores de la variable que tengan la mayor frecuencia absoluta, habría dos modas. Si no se repite ningún valor, no existe moda.
- Ejemplo1:
 
¿Cuál es el dato que más se repite en el ejemplo anterior?
El dato que más se repite es el 1,  es el que tiene mayor frecuencia absoluta (4 veces).
La moda del número de hermanos es 1
- Ejemplo 2:
2, 3, 4, 5 , 6 , 9
En este conjunto de datos no existe ningún valor que se repita, por lo tanto, este conjunto de valores no tiene moda.
- Ejemplo 3:
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9    Mo= 1, 5, 9
Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la máxima, tiene varias modas.

 La mediana 
La mediana es el valor que ocupa el lugar central entre todos los valores del conjunto de datos, cuando estos están ordenados en forma creciente o decreciente. 
La mediana se representa por  Me.
Calculo de la mediana:
1° Ordenamos los datos de menor a mayor.
- La mediana de un conjunto con un número impar de datos es, una vez ordenados los datos, el dato que ocupa el lugar central.
Ejemplo:
Calcular la mediana del conjunto de datos:
mediana_aritmetica_impar.jpg (386×426)
- También podemos usar la siguiente fórmula para determinar la posición del dato central:
(n + 1) /2  = mediana datos impares.
- La mediana de un conjunto con un número par de datos es, una vez ordenados, la media de los dos datos centrales.
Ejemplo:
Calcular la mediana del conjunto de datos:
mediana_aritmetica_par.jpg (392×505)

MEDIDAS DE FORMA

MEDIDAS DE FORMA
EL SESGO: Mide las desviaciones de las MTC., Ya que el sesgo es el grado de asimetría o falta de asimetría, de una distribución, si el polígono de frecuencias visualizado de una distribución tiene una cola más larga a la derecha del máximo central que a la izquierda, se dice que la distribución esta sesgada a la derecha o que tiene sesgo positivo(asimetría positiva) y si al contrario se dice que tiene sesgo (asimetría negativa) en la asimetría encontramos si es:
a)asimétricamente + = cuando el sg es mayor a 0
b)normal= cuando el sg = 0
c)simétricamente - cuando el sg es menor a 0

Formula:
_
Sg= __X -Md__ = S
esgo es igual a: media menos la moda partido o dividida desviación.       S
los datos más utilizados son los sig:
moda, media, desviación.
Pero si existen dos o más modas se utilizara otra formula:
Sg=_x-Md__= sesgo es igual a: media menos la mediana partido o dividido desviación
si la asimetría es NORMAL se aplicara la curtosis : si y solo si la asimetría es normal.


CURTOSIS:Es la agudeza de la curva normal , esta agudeza puede ser alta , baja, o intermedia dando lugar a diferentes tipos de curvas como: plato, meso, leptocúrtica,



k<0.263>

k=0.263 = mascotica.
k>0.263 = leptocurtica.
la fórmula a utilizar el la siguiente:
1/2 (Q3-Q1)
K= __________
P90-P10

curtosis igual a un medio entre cuartil 3 menos cualtil 1 dividido percentil de 90 menos percentil de 10

las medidas de forma son complejas´ pero la cual nos facilitan a detectar las asimetrías del fenómeno estudiado...

MEDIDA DE CORRELACION
la realidad muestra con más frecuencia situaciones en las que una variable depende más o menos intensamente de la otra, pero sin que sea posible encontrar una expresión matemática que relacione ambas exactamente. Se trata entonces de una relación o dependencia estadística. Cuando ambas variables son cuantitativas, esa dependencia recibe el nombre de correlación.
El punto de partida de un estudio de correlación es la representación gráfica de los pares de valores relacionados en un sistema cartesiano: se obtiene así el diagrama de dispersión o nube de puntos
COEFICIENTE DE CORRELACIÓN
Frecuentemente denominado correlación. Una medida estadística ampliamente utilizada que mide el grado de relación lineal entre dos variables aleatorias. El coeficiente de correlación debe situarse en la banda de -1 a +1. El coeficiente de correlación se calcula dividiendo la covarianza de las dos variables aleatorias por el producto de las desviaciones típicas individuales de las dos variables aleatorias

Recta de Regresión
La regresión estadística o regresión a la media es la tendencia de una medición extrema a presentarse más cercana a la media en una segunda medición.

Error estándar
El error estándar de la media (llamado en inglés "standard error of the mean" (SEM)) cuantifica[4] las oscilaciones de la media muestral (media obtenida en los datos) alrededor de la media poblacional (verdadero valor de la media). El EEM o SEM se estima generalmente dividiendo la desviación estándar de la población entre la raíz cuadrada del tamaño de la muestra (asumiendo independencia estadística de los valores en la muestra):

donde
s es la desviación estándar (es decir, la estimación basada en la muestra de la desviación estándar de la población).
n es el tamaño (número de individuos de la muestra)


Esta estimación puede ser comparada con la fórmula de la verdadera desviación estándar de la media de la muestra:

donde
σ es la verdadera desviación estándar de la población.
Esta fórmula puede alcanzarse desde lo que ya conocemos sobre la varianza de la suma de variables independientes aleatorias.[5]
Si son Descripción: nobservaciones independientes de una población que tiene una media y una desviación estándar , entonces la varianza del total es 
La varianza de debe ser 
Y la desviación estándar de debe ser .
Por supuesto, es la media de la muestra .
Nota: El error estándar y la desviación estándar de muestras pequeñas tienden a infravalorar sistemáticamente el error estándar y la desviación estándar de la población: el error estándar de la media es un parámetro sesgado del error estándar de la población. Con n=2 la infravaloración puede ser del 25%, pero para n=6 la infravaloración es sólo del 5%.[6]


¿QUÉ ES LA PROBABILIDAD Y LA ESTADÍSTICA?

La Probabilidad y la Estadística se encargan del estudio del azar desde el punto de vista de las matemáticas:
  • La Probabilidad propone modelos para los fenómenos aleatorios, es decir, los que se pueden predecir con certeza, y estudia sus consecuencias lógicas.
  • La Estadística ofrece métodos y técnicas que permiten entender los datos a partir de modelos.
De esta manera, el Cálculo de las Probabilidades es una teoría matemática y la Estadística es una ciencia aplicada donde hay que dar un contenido concreto a la noción de probabilidad.

PROBABILIDAD

En este sentido, el cálculo científico de probabilidades puede ayudarnos a comprender lo que en ocasiones la intuición nos indica de manera errónea. Un ejemplo típico es la denominada "paradoja de los cumpleaños". Supongamos que estamos en un grupo de 23 personas. Los cálculos nos dicen que la probabilidad de que dos personas celebren el mismo día su cumpleaños es del 50%, algo que a simple vista parece increíble (Paradoja del Cumpleaños »). No es de extrañar por tanto que la Teoría de Probabilidad se utilice en campos tan diversos como la demografía, la medicina, las comunicaciones, la informática, la economía y las finanzas.

ESTADÍSTICA

Cuando hablamos de estadística, se suele pensar en un conjunto de datos numéricospresentada de forma ordenada y sistemática. Esta idea es debida a la influencia de nuestro entorno, ya que hoy día es casi imposible que cualquier medio de communicación, periódico, radio, televisión, etc, no nos aborde diariamente con cualquier tipo de información estadística.
Sólo cuando nos adentramos en un mundo más específico como es el campo de la investigación de las Ciencias Sociales: Medicina, Biología, Psicología, ... empezamos a percibir que la Estadística no sólo es algo más, sino que se convierte en la única herramienta que, hoy por hoy, permite dar luz y obtener resultados, y por tanto beneficios, en cualquier tipo de estudio, cuyos movimientos y relaciones, por su variabilidad intrínseca, no puedan ser abordadas desde la perspectiva de las leyes determistas.
La Estadística se ocupa de los métodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos (Estadística Descriptiva), siempre y cuando la variabilidad e incertidumbre sea una causa intrínseca de los mismos; así como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones (Estadística Inferencial).