Para estimar información sobre una población (es decir, el grupo completo), podemos usar las estadísticas de una muestra (es decir, una parte del grupo completo). Si la muestra tiene gran variabilidad (si es muy dispersa), no debemos confiar en la estimación tanto como confiaríamos si los datos fueran cercanos unos a otros. Por ejemplo, sería más fácil estimar la estatura promedio de todas las personas de 3 años de edad que estimar la estatura de todas las personas de 40 años de edad, porque el rango de estaturas de los adultos es más amplio.
Usar muestras nos puede ayudar a predecir si hay una diferencia significativa entre dos poblaciones o si, por el contrario, los datos de ambas poblaciones se sobreponen bastante.
Esta es una tarea para que trabajen en familia:
Algunos estudiantes de séptimo y noveno grado son seleccionados al azar para responder la pregunta: “¿Cuántos lápices llevas contigo en este momento?”. Estos son los resultados:
Número de lápices que lleva consigo cada estudiante de séptimo grado:
4
1
2
5
2
1
1
2
3
3
Número de lápices que lleva consigo cada estudiante de noveno grado:
9
4
1
14
6
2
0
8
2
5
Usen los datos de la muestra para estimar la media (el promedio) del número de lápices que lleva consigo:
Un estudiante cualquiera de séptimo grado.
Un estudiante cualquiera de noveno grado.
¿Qué muestra tiene más variabilidad? ¿Qué les dice esto sobre sus estimaciones de la pregunta anterior?
Un estudiante que no hizo parte de la encuesta, llevaba 5 lápices consigo. Si esa es toda la información que tienen, ¿pueden predecir de qué grado es ese estudiante?
Solución:
Como las muestras son seleccionadas aleatoriamente, predecimos que van a representar bastante bien a toda la población.
Aproximadamente 2.4 lápices para los estudiantes de séptimo grado. La media de la muestra puede calcularse así: , es decir, 2.4 lápices.
Aproximadamente 5.1 lápices para los estudiantes de noveno grado. La media de la muestra puede calcularse así: , es decir, 5.1 lápices.
Los resultados de la encuesta a los estudiantes de noveno grado tienen más variabilidad. Esos resultados están más dispersos. Por lo tanto, la estimación para estudiantes de séptimo es más confiable que la estimación para estudiantes de noveno.
Hay varias respuestas posibles. Por ejemplo:
Puesto que solo entrevistaron a 10 estudiantes de cada grado, es difícil predecir. Ayudaría si pudiéramos entrevistar a más estudiantes.
Probablemente el estudiante está en noveno grado, porque 5 está más cerca de la media de noveno que de la de séptimo. Pero es posible que el estudiante esté en séptimo grado, porque hay al menos un estudiante en séptimo que tiene 5 lápices.