Pie de winmates
cabecera de winmates
Winmates

Frase de winmates
Frase del día

Winmates. Libro de Consulta

Derechos Reservados © Juan A Cordero, 2015

Introducción a la Estadística |

Concepto de variable estadística y tipos; Datos de la variable en la muestra; Representación de datos (Variables cualitativas y cuantitativas discretas; Variables cuantitativas continuas)

Concepto de variable estadística y tipos

La variable estadística es la característica o el rasgo que estudiamos en una población, representada por la muestra, y su valor se representa por x
i
. Dentro de un mismo estudio estadístico podemos analizar varias variables estadísticas.
Las variables estadísticas pueden ser:
 . Variables cualitativas, si no pueden tomar valores numéricos.
  Ejemplos: color del pelo, libro preferido.
 . Variables cuantitativas, cuando toman valores numéricos. Según el intervalo de valores que puedan tomar, las clasificamos en
    . discretas, si toman un número determinado de valores entre dos números. (año de nacimiento, número de libros leídos).
    . continuas, si pueden tomar cualquier valor comprendido entre dos números. (altura, metros cuadrados de un piso).

Datos de la variable en la muestra

El análisis de una variable en una muestra de tamaño n, da lugar a los siguientes datos:
 . Frecuencia absoluta (f) de un valor es el número de veces que encontramos ese valor en la muestra. La suma de las frecuencias de todos los valores es el tamaño n de la muestra.
f(x
i
) = n
i
; f = n
 . Frecuencia relativa (fr) de un valor es el resultado de dividir la f del valor entre el tamaño n de la muestra. La suma de las frecuencias relativas de todos los valores da siempre 1.
fr(x
i
) = n
i
/n
f
r
= 1
 . Frecuencia acumulada (fa) de un valor , es la suma de las f de los valores iguales o menores al dado.
f
a
(x
i
) = f(x
b
) para b <= i

Representación de datos

Hay varios métodos para representar y agrupar los datos de una muestra referentes a una variable, como tablas de frecuencia o diversas representaciones gráficas. Dependiendo de si la variable es cualitativa o cuantitativa, se podrán usar unas representaciones u otras.

 . Variables cualitativas y cuantitativas discretas


Con estas variables utilizaremos principalmente tablas de frecuencia, diagramas de barras y de sectores, aunque existen otras formas de representación como los pictogramas o los cartogramas.
Estos métodos son muy prácticos cuando trabajamos con distribuciones con pocos valores, como suelen ser las variables cualitativas y cuantitativas discretas. Sin embargo, existen también algunas variables discretas que poseen un gran número de valores. En casos como ese, se recomienda utilizar los métodos de representación pensados para las variables cuantitativas continuas.

Tablas de frecuencia

Suponemos una distribución formada por 100 alumnos de 6° de Primaria, en la que estudiamos la nota media a final de curso redondeada a enteros. La tabla de frecuencia de esa distribución podría ser la siguiente:


Diagrama de barras

El diagrama de barras de frecuencia absoluta correspondiente a la tabla anterior es el siguiente:

De la misma forma se pueden obtener sendos diagramas de barras de frecuencia relativa, acumulada y acumulada relativa.

Diagrama de sectores


Los datos anteriores presentarían el siguiente aspecto en forma de diagrama de sectores.

 . Variables cualitativas y cuantitativas continuas


El rasgo principal de estas variables es que pueden tomar prácticamente cualquier valor. Esta característica hace que no utilicemos los mismos métodos de representación que con las variables cualitativas y cuantitativas discretas. En su lugar, hacemos uso de tablas de intervalos, histogramas y polígonos de frecuencia.
Estos métodos tienen una mayor flexibilidad a la hora de representar frecuencias de distribuciones con muchos valores diferentes, de forma que sirve tanto para las variables cuantitativas continuas como para aquellas discretas cuyo elevado número de valores desaconseje el uso de los métodos vistos en el apartado anterior.

Tablas de intervalos

Cuando trabajamos con variables que puedan tomar muchos valores, como es el caso del peso en gramos de una persona, resulta imposible listar todos los valores posibles en una tabla normal de frecuencias. Por ello, agrupamos los valores en unos cuantos intervalos de clase. Al trabajar con estos intervalos, disminuye significativamente los elementos a analizar (puesto que se hallan agrupados) y resulta más fácil trabajar con ellos.
Ejemplo:
Tenemos una distribución en la que estudiamos la altura en cm de una muestra de n individuos. La mínima altura registrada es 157 cm y la máxima, 198 cm. Para representar los datos obtenidos, como no podemos listar todos los valores, los agrupamos en 5 intervalos de clase:
[150, 160), es decir, desde 150 cm inclusive hasta 160 cm exclusive.
[160, 170), [170, 180), [180, 190), [190, 200)

El número de intervalos a colocar en una distribución depende del investigador. Sin embargo, en general se considera que más de 14 intervalos es excesivo.
Para referirse a cada intervalo existe la marca de clase. Este valor, que es la semisuma de los extremos del intervalo, sirve para representar a todos los valores integrados en el mismo en los cálculos pertinentes.

Ejemplo
En la anterior distribución, los intervalos estarían representados por las siguientes marcas de clase:
Intervalo     Marca de clase
[150, 160)           155
[160, 170)           165
[170, 180)           175
[180, 190)           185
[190, 200)           195

A continuación construiremos una tabla de intervalos correspondiente a una distribución que estudia el peso en kilogramos de una muestra de 25 personas, con los siguientes valores:

Para ello, y dado que el mínimo valor es 38,7 y el máximo es 195,87, agruparemos los valores en los siguientes intervalos:

IntervaloMarca de clase
[35, 65) 50
[65, 95)80
[95, 125)110
[125, 155)140
[155, 185)170
[185, 215)200

Ahora ya podemos confeccionar la tabla:


Histograma
Un histograma es un sistema complejo de representación a base de rectángulos yuxtapuestos que representan las frecuencias de los valores de la variable. La base de cada rectángulo es el intervalo de valores, y su área o superficie es proporcional a la frecuencia.
Si los intervalos de valores tienen amplitud constante, la altura también será proporcional a la frecuencia.
Ejemplo:

Para ilustrar la forma de construir un histograma, supondremos una distribución que estudia el precio del alquiler de una muestra de 1000 viviendas situadas en una provincia española. Esta distribución cuenta con la siguiente tabla de intervalos:


Para realizar un histograma de esta distribución, se procederá de la siguiente manera:
En la distribución existen 7 ítems, por lo que haremos 7 rectángulos.
El primero tendrá un área de 48 unidades cuadradas (u2), y su base tendrá 15 unidades (u), que corresponden a la longitud del intervalo (15 es a 3000, 1 es a 200). Por tanto, su altura será la siguiente:
Altura = Superficie / Anchura
Altura = 48 / 15
Altura = 3,2 u

El segundo tendrá un área de 53 u2 y su base será de 10 u, siguiendo la relación establecida. Su altura, por tanto, será:
Altura = 53 / 10 = 5,3 u
El resto de rectángulos, procediendo de la misma manera, tendrá los siguientes valores:

El histograma tendrá el siguiente aspecto:


Polígono de frecuencias
El polígono de frecuencias es aquél delimitado por la unión de los puntos medios de las barras del histograma. Para cerrar este polígono, al histograma se le añade una clase inicial y una final de valor cero, de forma que la figura resultante empieza y acaba en el eje horizontal (OX).
Ejemplo:
Para realizar un polígono de frecuencias, debemos partir de un histograma, que en este caso será el del apartado anterior. A ese histograma debes añadir una clase inicial y otra final y unir los puntos medios de las clases.


La unión de esas líneas constituye, junto con el eje OX, el contorno de la figura, que tendría en nuestro caso el siguiente aspecto aproximado:

IV.1.2