se actuario

ESTADISTICA DESCRIPTIVA: ANÁLISIS DE LOS DATOS

Menú Probabilidad y Estadística Tema anterior Tema Siguiente

2. Ordenación y presentación de los datos

Ahora veremos cómo estructurar los datos obtenidos en la observación de una muestra o población.

Distribución de frecuencia: Frecuencias absoluta, relativay acumuladas


La distribución de frecuencia es la representación estructurada, en forma de tabla, de toda la información que se ha recogido sobre la variable que se estudia.

 

Definición 2.1. Sea X una variable estadística con valores x1, x2 ,...xk ,que pueden aparecer repetidos más de una vez en el conjunto de observaciones realizadas, y sea N el número de tales observaciones.
Recorrido R es la diferencia entre el mayor y el menor de los valores que toma la variable: R = xk−x1.
Frecuencia absoluta ni del valor xi es el número de veces que aparece repetido dicho valor en el total de observaciones.

Frecuencia relativa fi de un valor xi es el cociente entre la frecuencia absoluta ni correspondiente a ese valor y el número N de observaciones:

Frecuencia absoluta acumulada Ni en elvalor xi es la suma de las frecuencias absolutas de los valores inferiores o iguales a él:
Frecuencia relativa acumulada Fi en el punto xi es el cociente entre la frecuencia absoluta acumulada Ni en ese valor y el número N de observaciones realizadas:


2.2 Tabla de Frecuencias

Nos ocupamos a continuación de la tabulación de los datos extraídos de una muestra o población. Con independencia del número de observaciones realizadas, pueden darse dos casos: o bien la variable estadística tiene pocos valores distintos, o, por el contrario, presenta muchos valores diferentes.

2.2.1 Variables con pocos valores distintos

En este caso la tabla de frecuencias se confecciona ordenando los valores de menor a mayor y disponiéndolos en una columna. En las demás columnas vamos anotando las correspondientes frecuencias ni, fi, Ni, Fi:
Variable Frecuencias absolutas Frecuencias relativas
(Valor) Simple Acumulada Simple Acumulada
         
X1 n1 N1 = n1 f1 = n1 / n F1 = f1
X2 n2 N2 = n1 + n2 f2 = n2 / n F2 = f1 + f2
... ... ... ... ...
Xn-1 nn-1 Nn-1 = n1 + n2 + ... nn-1 fn-1 = nn-1 / n Fn-1=f1 + f2 + ... + fn-1
Xn nn Σ ni = n fn = nn / n Fn =Σ fi =1 o 100%
Siendo X los distintos valores que puede tomar la variable.
Siendo n el número de veces que se repite cada valor.
Siendo f la razón expresada entre 0 y 1 o el porcentaje que la repetición de cada valor supone sobre el total.

Tabla 1. Distribución de frecuencia

Propiedades de las frecuencias

Se tienen las siguientes propiedades de las frecuencias:
viii) El porcentaje correspondiente a un valor xi de la variable se obtiene multiplicando la frecuencia relativa por 100:

(%) = 100 fi:

Veamos un ejemplo:
Medimos la altura de los niños de una clase y obtenemos los siguientes resultados (m):
 

Id Alumno Estatura Alumno Estatura Alumno Estatura
1 1,25 11 1,23 21 1,21
2 1,28 12 1,26 22 1,29
3 1,27 13 1,30 23 1,26
4 1,21 14 1,21 24 1,22
5 1,22 15 1,28 25 1,28
6 1,29 16 1,30 26 1,27
7 1,30 17 1,22 27 1,26
8 1,24 18 1,25 28 1,23
9 1,27 19 1,20 29 1,22
10 1,29 20 1,28 30 1,21

Tabla 2. Población de estudiantes

La variable estatura representa un tipo de dato continuo. Luego se puede presentar deforma agrupada en intervalos de clase, lo cual es apropiado cuando hay muchos datos distintos, o en este caso como hay muchos datos repetidos, en una tabla de frecuencias para cada magnitud de dato. Así, al presentar esta información estructurada se obtiene la siguiente tabla de frecuencia. En la Frecuencia absoluta simple  vemos que por ejemplo solamente el alumno 19 tiene una estatura de 1,20 m, los alumnos que tienen una estatura de 1,21 son los 4, 14, 21 y 30, luego son en total 4 y así sucesivamente. La frecuencia absoluta acumulada es la suma de las frecuencias simples hasta esa fila en particular, observamos que debe terminar con el total de individuos (alumnos). Para la frecuencia relativa simple y según vemos en la tabla 1, n = 30 para este caso, por lo cual para el valor de estatura de 1,20 tenemos f= 1/30 que expresado en forma porcentual es 3,3%, para la estatura de 1,21 tenemos f = 3/30 o 13,3% y así sucesivamente. La frecuencia relativa acumulada es la suma de las frecuencias relativas simples hasta una fila en particular, así para la última siempre deberá ser 100%

 

Variable Frecuencias absolutas Frecuencias relativas
(Valor) Simple Acumulada Simple Acumulada
         
1,20 1 1 3,3 % 3,3 %
1,21 4 5 13,3 % 16,6 %
1,22 4 9 13,3 % 30,0 %
1,23 2 11 6,6 % 36,6 %
1,24 1 12 3,3 % 40,0 %
1,25 2 14 6,6 % 46,6 %
1,26 3 17 10,0 % 56,6 %
1,27 3 20 10,0 % 66,6 %
1,28 4 24 13,3 % 80,0 %
1,29 3 27 10,0 % 90,0 %
1,30 3 30 10,0 % 100,0 %
Tabla 3. Frecuencias Relativas y Acumuladas para la población de estudiantes

Ejemplo 2

Se tienen los salarios diarios en miles de pesos de 50 operarias en el taller "Confecciones El Carnaval", como se muestra en la figura

datos

Ingresando los datos en nuestra aplicación Análisis de Datos con Tablas de Frecuencias, o en Excel como se iustrará paso a paso en el siguiente ejercicio, se obtiene:

datos

Con lo cual podemos sacar algunas conclusiones como:

- Sólo el 4% de las operarias gana el máximo salario/día de la fabrica, el cual corresponde a $60.000.00
- El salario diario mínimo ($48.000.00) lo gana únicamente una obrera, lo que constituye el 2% del personal asalariado.
- El 58% de las operarias tiene un salario diario entre $53.000.00 y $55.000.00
- El 22% de las obreras tiene un salario/día de $52.000.00 o menos.
- El 40% tiene un ingreso/día de $55.000.00 o más.
- El 24% de las operarias devengan in ingreso diario de $54.000

Al dar estos análisis en forma de porcentaje, es claro que se están observando las frecuencias relativas y acumuladas. Así, al observar Fi = 96% que corresponde a un Xi = 58, se concluye que el 96% de las operarias obtienen un salario diario igual o inferior a $58.000 diarios, y por consiguiente que el otro 4% gana más de $58.000 que corresponde a $60.000 diarios (primera conclusión). Luego se están analizando porcentajes dados por Fi y fi. Unos valores muy importantes son precisamente los llamados percentiles, y algunos de estos suelen ser de mucho interés como cada 10% (deciles), cada 25% (cuartiles). Así, en Excel como se mostrará luego en más detalle, se pueden obtener los cuartiles 1 (primeros 25% de los datos), cuartil 2 (primeros 50%) y cuartil 3 (primeros 75% de los datos), que para el ejemplo son:

datos

Observe que algunos valores difieren ligeramente, ya que Excel aplica algoritmos para su cálculo.

Ejercicio con Aplicación Análisis de Datos con Tablas de Frecuencias

Se tienen los siguientes datos

datos

Abra la aplicación Análisis de Datos con Tablas de Frecuencias, en el cuadro No. total de Datos = ingrese 20. Luego ingrese los datos, uno por cada caja de texto, en el orden en que se encuentran, ya que el aplacativo tiene un algoritmo que ordena los datos. Para pasar de una caja de texto a la siguiente, puede presionar los botones ALT + INTRO.

datos

Después de que haya ingresado todos los 40 datos, dé click en el botón "Procesar los datos". Con lo cual se ordenan los datos y se genera la tabla de frecuencias, con una salida como la siguiente

datos

Si los valores que toma la variable son muy diversos y cada uno de ellos se repite muy pocas veces, entonces conviene agruparlos por intervalos, ya que de otra manera obtendríamos una tabla de frecuencia muy extensa que aportaría muy poco valor a efectos de síntesis. (tal como se verá en la siguiente lección).

Realice un ejercicio con la Aplicación de tablas de Frecuencias y un Cuestionario Interactivo

Ahora practique otros ejercicios con la Aplicación de Análisis de Datos con Tablas de Frecuencias de seactuario.com

Menú Probabilidad y Estadística Tema anterior Siguiente