Agrupación de los valores de la variable estadística en intervalos con igual amplitud:
Denotaremos por $\ell$ a la amplitud común a todos los intervalos, por $N$ el número de valores de la variable estadística que hemos medido, y por $n_c$ al número de intervalos ( o clases ). Para establecer los extremos inferior y superior de cada uno de los $n_c$ intervalos, procederemos de la siguiente manera:
1.º) Tomaremos como $n_c$ el número entero más próximo a $|\sqrt{N}|$
2.º) Establecemos la amplitud de los intervalos ( la misma para cada uno ), $\ell$, tomando el número entero que resulta de la aproximación por exceso de $\dfrac{\text{rango}}{n_c}$, donde $\text{rango}=|x_{\text{máx}}-x_{\text{mín}}|$
3.º) Teniendo en cuenta que, al haber aproximado por exceso en el paso anterior, $n_c \cdot \ell \ge \text{rango}$; con lo cual, en buena lógica dividiremos la diferencia en dos mitades, $\dfrac{n_c\cdot \ell -\text{rango}}{2}$, y asignaremos al valor inferior del primer intervalo el siguiente valor: $e_{1}^{\text{inf}}:=x_{\text{mín}}-\dfrac{n_c\cdot \ell -\text{rango}}{2}$, con lo cual $e_{1}^{\text{sup}}:=e_{1}^{\text{inf}}+\ell$, y, así, iremos construyendo los intervalos que siguen: $e_{2}^{\text{inf}}=e_{1}^{\text{sup}}$ y $e_{2}^{\text{sup}}=e_{2}^{\text{inf}}+\ell$, etcétera. Convendremos además que los intervalos sean cerrados por la izquierda y abiertos por la derecha:
$I_1=[e_{1}^{\text{inf}}\,,\,e_{1}^{\text{sup}})$, $I_2=[e_{2}^{\text{inf}}\,,\,e_{2}^{\text{sup}})$, ..., $I_{n_c}=[e_{n_c}^{\text{inf}}\,,\,e_{n_c}^{\text{sup}})$
Ejemplo:
ENUNCIADO. Durante el mes de abril se han registrado ( en una estación meteorológica ) las siguientes temperaturas máximas:
15 15 13 17 18 19 14 12 11 9
13 15 16 18 20 18 16 15 15 14
17 15 12 13 15 16 15 17 18 15
Agrupar los valores en clases ( intervalos ) y elaborar una tabla de frecuencias absolutas
SOLUCIÓN.
En primer lugar vamos a aplicar el criterio explicado para decidir cuántos intervalos ( de la misma amplitud $\ell$ ), $n_c$, vamos a utilizar. Recordemos que $n_c:=$entero más próximo a $|\sqrt{N}|$, donde $N$ es el número de valores. Como los valores dados están en disposición rectangular, de $3$ filas por $10$ columnas, $N=3\cdot 10=30$, así pues $n_c:=6$
Ahora vamos a calcular la amplitud de los intervalos ( haremos que sea la misma para todos ). De acuerdo con lo que hemos expuesto arriba, $\ell:=$entero por exceso máx próximo a $\dfrac{|\text{rango}|}{n_c}$. Recordemos que $\text{rango}\overset{\text{def}}{=}|x_{\text{máx}}-x_{\text{mín}}|=|20-9|=11$; así pues, $\ell:=2$, pues el entero máx próximo a $11/6$, por exceso, es $2$
A continuación, calcularemos el extremo inferior del primer intervalo, que, tal como se ha explicado se calcula así: $$e_{1}^{\text{inf}}:=x_{\text{mín}}-\dfrac{\ell \cdot n_c - \text{rango}}{2}$$ Entonces $$e_{1}^{\text{inf}}:=9-\dfrac{2\cdot 6 -11}{2}=8'5$$
En consecuencia los intervalos que emplearemos en la agrupación -- recordemos que han de ser cerrados por la izquierda y abiertos por la derecha -- son los siguientes:
$I_1=[8'5,8'5+2)=[8'5,10'5)$
$I_2=[10'5,10'5+2)=[10'5,12'5)$
$I_3=[12'5,12'5+2)=[12'5,14'5)$
$I_4=[14'5,14'5+2)=[14'5,16'5)$
$I_5=[16'5,16'5+2)=[16'5,18'5)$
$I_6=[18'5,18'5+2)=[18'5,20'5)$
Y, finalmente, ubicamos cada valor en el correspondiente intervalo y encontramos los valores de las frecuencias:
-----------------------
i|intervalo | n_i |N_i|
-----------------------
1|8'5,10'5) | 1 |1 |
-----------------------
2|10'5,12'5)| 3 |4 |
-----------------------
3|12'5,14'5)| 5 |9 |
-----------------------
4|14'5,16'5)| 12 |21 |
-----------------------
5|16'5,18'5)| 7 |28 |
-----------------------
6|18'5,20'5)| 2 |30 |
-----------------------
|N=30 |
-------
$\square$