jueves, 25 de noviembre de 2010

MEDIDAS DE TENDENCIA CENTRAL : MEDIA, MEDIANA Y MODA Y MEDIDAS DE VARIABILIDAD, RANGO,DESVIACION ESTANDAR Y VARIANZA

Media
Es la medida de tendencia central mas utilizada, también llamada promedio el símbolo que se utiliza para representarla es  X( equis barra) 

En datos no agrupados es igual a la suma de los valores dividida entre el numero de ellos.
 La media es un estadístico y seria una aproximación del parámetro poblacional.
En algunas ocaciones  la formula para calcular la media sufre algunas modificaciones
Esta se utiliza cuando se tienen los datos ya utilizados en una tabla de frecuencia simple a la que se le puede agregar una columna con el encabezado fX(la multiplicación de la frecuencia del dato por su valor) y se suman los resultados obteniendo con ello FX, lo cual se dividirá entre el valor de n .
Cuando la variable incluye valores muy dispares o extremos la media pierde representatividad.

En datos agrupados:
1.- Se hallan las marcas de clases de todos los intervalos ( para sacar la marca de clases se suman ambos limites de los intervalos y se divide entre dos).
2.- Para cada intervalo se multiplica la frecuencia absoluta por la marca de clase.
3.- Se suman todos los resultados de las multiplicaciones anteriores.
4.- La suma anterior se didvide entre le numero de datos.
Su formula es la siguiente :
En donde :
X* = a media o promedio
f = a frecuencia absoluta
X= Marca de clase
N = numero de datos


Mediana

Es el valor que divide el grupo de datos en dos partes iguales, 50% por debajo de el y 50% por arriba del mismo se utiliza el símbolo Me.

En datos no agrupados :
1.- Se ordenan los datos de mayor a menor
2.- Se indentifica el valor que se ubica en medio de los datos:
a) Cuando el numero de datos n es impar la mediana conincidirá con uno de los valores quedando justamente en medio de ellos.
b) Cuando n es par la mediana es el promedio de los dos valores centrales
Para conocer la posición de la mediana existe una formula muy útil que es la siguiente:
Esta nos indica el lugar que ocupa la mediana adentro de los datos ya ordenados de menor a mayor pero no calcula de manera directa el valor de la misma.
En los datos agrupados  se denomina ampliutud o anchura del intervalo al tamaño de este y se calcula obteniendo la diferencia entre los limites reales del intervalo estos e obtienne de restar y sumar media unidad a los limites inferior y superior del intervalo.

Datos agrupados :
1.- se identifica el intervalo que contiene el valor de la mediana para ello conocer que lugar ocupa esta mediante la formula
  
Al ubicar donde recae la mediana podemos tener una idea aproximada de su valor conociendo los limites del intervalo.
2.- Se calcula la frecuencia acumulada fa ( correspondiente al intervalo que contiene a mediana)
3.- Se indentifica la frecuencia abosoluta f del intervalo que contiene la mediana
4.- Se mide la amplitud o anchura que contiene la mediana
5.-Se indentifica el limite real inferior L del intervalo que contiene la mediana.
6.- Teniendo los valores ateriores se aplica la siguiente formula

Moda 

En datos no agrupados:
La moda es el dato o valor de la variable que ocurre con mayor frecuencia el símbolo que se utiliza es Mo.
Los datos que tengan la misma frecuencia y esta sea la mas alta entonces decimos que se tiene dos modas o que le conjunto de dota es BIMODAL, si fueran 3 o mas datos los que representaran dichas características el conjunto es MULTIMODAL.

Pasos para hallar la moda:
1.   Organiza los datos en una tabla de frecuencia simple
2.   Identifica el dato con la mayor frecuencia y ese será la moda

Importante: el valor de la moda lo encontramos dentro de los valores de la variable
La moda puede hallarse cuando se trata de variables medidas en cualquier escala: nominal, ordinal, de intervalo o de razón.

Para los datos agrupados en intervalos tendremos que la moda será la marca de clase de ese intervalo.
 Decimos que se presentan una asimetría positiva cuando la mayor parte de los datos se concentran en los valores menores (hacia la izquierda) del eje horizontal. Por otro lado, en la asimetría negativa la mayor parte de los datos se concentran en los valores mayores (hacia la derecha) del mismo.
El coeficiente de asimetría es positivo cuando justamente la forma del histograma presenta una asimetría positiva, es negativo cuando la asimetría es negativa y es cero cuando la forma es simétrica 

Para poder proceder a sacar la moda se utiliza la siguiente formula


en donde

L1 = Limite inferior de la clase modal
fi = frecuencia absoluta de la clase modal
fi -1 =frecuencia inmediata inferior de la clase modal
 fi1= frecuencia absoluta inmediata a la clase modal

Medidas de variabilidad
Rango, varianza y desviación estándar

Las medidas de variabilidad también llamadas de dispersión indican ciertos aspectos del conjunto de datos que no nos lo dicen las medidas de tendencia central
Una medida de tendencia central se emplea para ubicar el centro de un conjunto de datos a esta dimensión se le conoce comúnmente como variación o dispersión
Calculo de las medidas de variabilidad para datos no agrupados

Rango
Se calcula hallando la diferencia (resta) entre los valores máximo y mínimo
Rango= R= Valor máximo—Valor Mínimo

Desviación estándar
Es la medida de variabilidad mas adecuada por sus propiedades algebraicas, se le conoce también como desviación típica
La desviación estándar es la medida de la variación de los valores con respecto a la media.
Es una especie de desviación promedio con respecto  a la media, la desviación estándar se calcula de la siguiente forma:
  
Donde:
X= valores de los datos
X=media
n= numero de datos
para calcula la desviación estándar se procede de la siguiente manera:
1.calcular el valor de la media
2. restar la media de cada valor individual para tener una lista de desviaciones de la forma    (x
3. elevar al cuadrado cada una de las diferencias obtenidas en el paso anterior. Recuerda que al elevar al cuadrado un numero negativo este se vuelve positivo
4. sumar todos los resultados obtenidos. Este valor es el de
)
5. divide el total del paso 4 entre el numero de los datos n
6. calcular la raíz cuadrada del resultado anterior

La varianza 
Es una medida de variabilidad que se obtiene elevando al cuadrado la desviación estándar.
Se simboliza por
 Así que una vez obtenida la desviación estándar , solo hay que elevar al cuadrado su valor y con ello obtendremos el valor de la varianza
Calculo de la desviación estándar y la varianza de datos agrupados
Para calcular la desviación estándar y la varianza en datos agrupado se aplica la misma formula cuando se tenían los datos en una tabla de frecuancias simple, esta es cuando, se aplica la formula:
   


Solo que ahora x es la marca de clase del intervalo, recuerda que en este caso aplicamos 7 pasos, una vez ya calculadas las marcas de clase ya respectivas
Relacion entre la desviación estándar y el rango
Para obtener una estimación de la desviación estándar cuando se conoce el rango de los datos existe una forma sencilla  s=

EJEMPLOS

Problema para datos No Agrupados 


Hallar las medidas de tendencia central y de variabilidad a la siguiente situación se encuesto a 300 personas preguntándoles el numero de hijos que tienen:
No. Hijos
No. Personas


X
f
fx
fA
0
78
78
78
1
90
90
168
2
32
64
200
3
25
75
225
4
50
200
275
5
15
75
290
6
10
60
300

=300
642




 = = 2.14
*La media correspondiente a 2.14
*El 50% de las personas tiene de 0 a 1 hijo y el otro 50% de 2 a 6 hijos
*La moda es igual a 1 hijo
Desviación estándar
78 – 2.14 = 75.86
5754.7
448866.6
90 – 2.14 = 87.86
7719.3
694737
64– 2.14 = 61.86
3826.6
122451.2
75– 2.14 = 72.86
5308.5
265425
200– 2.14 =197.86
39148.5
1957425
75– 2.14 = 72.86
5308.5
79627.5
60– 2.14 = 57.86
3347.7
334477


3602009.3



S= 109.57
S2= 12006.6



Problema para Datos Agrupados

En un hospital se tomo la temperatura de 100 pacientes ,hallar las medidas de tendencia central y variabilidad :

Intervalos
Frecuencia
X
fx
fa
10-11
3
15.5
46.5
3
12-13
2
18.5
37
5
14-15
15
21.5
322.5
20
16-17
12
24.5
294
32
18-19
23
27.5
632.5
55
20-21
14
30.5
427
69
22-23
23
33.5
770.5
92
24-25
3
36.5
109.5
95
26-27
3
39.5
118.6
98
28-29
2
42.5
85
100

100
290
2843




 

Mo= bimodal

15.5 - 28.43 = -12.93
167.18
501.5
18.5 - 28.43 = -9.93
98.6
197.2
21.5 – 28.43 = -6.93
48.02
720.3
24.5 – 28.43 = -3.93
15.44
185.25
27.5 - 28.43 = -.93
.86
19.7
30.5 - 28.43 = 2.7
7.29
102.06
33.5 - 28.43 = 5.7
32.49
747.27
36.5 - 28.43 = 8.07
65.12
195.36
39.5 - 28.43 = 11.07
122.5
367.5
42.5 - 28.43 = 14.07
197.9
395.8


= 3431.9



S = 5.8
Varianza
S2= 34.31

2 comentarios:

  1. Play Slots at a Casino - Gambling Gods Guide & Review
    You can play slots for free and for real money in nba betting odds real money at the best casinos. Play 야구분석 slot machines for 뱃365 free online 탱글다희 정지 in 카라 포커 casinos, and enjoy a

    ResponderEliminar