DATOS Y AZAR EJERCICIOS RESUELTOS DE MATEMATICA 1 SECUNDARIA – MEDIA PDF

Share Button

Histogramas, polígonos de
frecuencia y de frecuencias
acumuladas, construidas
manualmente y con
herramientas tecnológicas.
CLICK AQUI PARA VER PDF    ****
Medidas de tendencia tentral:
media, moda y mediana.
Medidas de posición: quintil,
cuartil y percentil.

Muestra aleatoria y error
muestral

Medidas de variabilidad y
dispersión de una muestra.
Gráfico de Caja.

Ley de los Grandes Números
Frecuencia relativa –
probabilidad de un suceso.

Fórmula de Laplace

Al fi nalizar
esta Unidad serás capaz de:
Interpretar información de contextos diversos presentadas
en gráfi cos cuyos datos están agrupados en intervalos.
Utilizar información presente en histogramas y polígonos de
frecuencia para producir información en diversos contextos.
Grafi car histogramas y polígonos de frecuencias a partir de
información datos agrupados en intervalos.
Utilizar un programa computacional para análisis estadístico
y grafi car información
Calcular las medidas de tendencia central y de posición, e interpretarlas
para obtener información pertinente respecto al
conjunto de datos de donde fueron obtenidas.
Caracterizar conjunto de datos provenientes de diversos contextos,
aplicando medidas de tendencia central y de posición.
Conocer distintos tipos de muestra aleatoria y el concepto de
error muestral
Medir la variabilidad de una muestra a través del rango.
Representar gráfi camente la variabilidad de una muestra a
través de un gráfi co de caja.
Conocer empíricamente la Ley de los Grandes Números y
relacionarla la frecuencia relativa con la probabilidad de un
suceso.
Utilizar la fórmula de Laplace para resolver problemas en contextos
de incertezatextos, aplicando medidas de tendencia
central y de posición.
Esta unidad en una primera parte retoma las formas de representación y obtención de información que
se venían estudiando en cursos anteriores, pero esta vez usando histogramas, polígonos de frecuencia
y de frecuencia acumulada. En esta parte se profundiza en la construcción de tablas de distribución con
datos agrupados en intervalos de clases, considerando las frecuencias absolutas, relativas y acumuladas,
y con ello dar paso a la estructuración y elaboración de ellas. En una segunda parte incorpora la determinación
de medidas de tendencia central y posicional de un grupo de datos agrupados y no agrupados.
Se ahonda en la representación de las medidas de tendencia central para un grupo de datos. En una
tercera etapa se trabaja el tema de la representatividad de las muestras tomadas de poblaciones para la
elaboración de estudios concluyentes, focalizándose en los tipos de muestreo deteniéndonos brevemente
en los errores muestrales que se pueden cometer, considerando la validez y confiablidad de los datos
extraídos de la población. Por último se trabaja en ley de los grandes de números de manera exploratoria,
indicando sitios Web con simuladores de experimentos.
Objetivos fundamentales
verticales
– Interpretar y producir
información, en contextos
diversos, mediante gráficos
que se obtienen desde
tablas de frecuencia, cuyos
datos están agrupados en
intervalos.
– Interpretar y producir
información, en contextos
diversos, mediante el uso
de medidas de tendencia
central, aplicando criterios
referidos al tipo de datos
que se están utilizando.
– Comprender el concepto
de muestra representativa
en diferentes situaciones,
argumentar acerca de su
importancia en las conclusiones
de encuestas y estudios
estadísticos.
– Seleccionar la forma de
obtener la probabilidad de
un evento, ya sea teórica o
experimentalmente, dependiendo
de las características
del experimento aleatorio.
– Obtención de información, a partir de datos
presentados en histogramas, polígonos de
frecuencia y frecuencia acumulada.
– Organización y representación de datos,
extraídos desde diversas fuentes, usando
histogramas, polígonos de frecuencia y de
frecuencias acumuladas, construidas manualmente
y con herramientas tecnológicas.
– Obtención de información por medio de
la lectura de medidas de tendencia central
y posición a partir de conjuntos de datos
obtenidos desde diversas fuentes.
– Caracterización de un conjunto de datos
agrupados en intervalos, mediante el cálculo
de medidas de tendencia central y medidas
de posición, en diversos contextos y
situaciones.
– Justificación de la representatividad de una
muestra a partir de la población estudiada
y la manera en que dicha muestra ha sido
escogida.
– Caracterización de un conjunto de datos de
una muestra, mediante el análisis gráfico de
la dispersión de ella.
– Exploración de la ley de los grandes números,
a partir de la repetición de experimentos
aleatorios, con apoyo de herramientas
tecnológicas y su aplicación a la asignación
de probabilidades.
– Resolución de problemas en contextos de
incerteza, aplicando el cálculo de probabilidades
mediante el modelo de Laplace,
probabilidad complementaria, árbol de
probabilidades.
– Interpretan información de contextos diversos presentadas
en gráficos cuyos datos están agrupados
en intervalos.
– Utilizan información presente en histogramas y
polígonos de frecuencia para producir información
en diversos contextos.
– Grafican histogramas y polígonos de frecuencias
a partir de información con datos agrupados en
intervalos.
– Usan un programa computacional para análisis
estadístico y graficar información.
– Conocen las medidas de tendencia central y de
posición, y las interpretan obteniendo información
pertinente respecto al conjunto de datos de donde
fueron obtenidas.
– Aplican las medidas de tendencia central y de posición
para caracterizar conjunto de datos provenientes
de diversos contextos.
– Conocen distintos tipos de muestra aleatoria y el
concepto de error muestral.
– Reconocen el tipo de sesgo en la representación
gráfica de una muestra. Reconocen la dispersión
de una muestra.
– Miden la variabilidad de una muestra a través del
rango.
– Representan gráficamente la variabilidad de una
muestra a través de un Gráfico de Caja.
– Conocen empíricamente la Ley de los Grandes
Números y relacionan la frecuencia relativa con la
probabilidad de un suceso.
– Relacionan la noción de probabilidad con la información
estadística que deriva de la repetición de
un fenómeno aleatorio y explican qué diferencia a
éstos de los fenómenos determinísticos.
– Utilizan la fórmula de Laplace para resolver problemas
en contextos de incerteza.
– Utilizan probabilidad del complemento y árbol de
probabilidades para resolver problemas en contextos
de incerteza.

¿Qué dice?
Como ya sabemos la actividad sísmica volcánica es la que permite obtener información
del estado del volcán y con ello poder tomar decisiones que protejan a las
poblaciones. Así existen dos medidas principales para determinar el “tamaño” de
un sismo: la intensidad y la magnitud, ambas expresadas en grados. Aunque a
menudo son confundidas, expresan propiedades muy diferentes.
La intensidad es una medida de los efectos causados por un sismo en un lugar determinado
de la superficie terrestre. La escala más común en América es la escala
modificada de Mercalli que data de 1931. Esta, va del grado I (detectado sólo con
instrumentos) hasta el grado XII (destrucción total), y corresponde a daños leves
hasta el grado V.
Por otra parte, la magnitud permite conocer la cantidad energía liberada en el hipocentro
o foco, que es aquella zona del interior de la Tierra donde se inicia la fractura
o ruptura de las rocas, la que se propaga a través de ondas sísmicas. Esta medida
se calcula mediante una expresión logarítmica (expresión que ya conocerás), cuyos
datos se obtienen del análisis de los registros instrumentales. Es una medida mucho
más precisa que la intensidad, la que está basada sólo en observaciones subjetivas
de la destrucción en cada lugar. La magnitud de un sismo se expresa usando la escala
de Richter, que arbitrariamente asigna grado cero a los límites bajos de detección,
y no tiene un límite superior. Cada grado de la escala representa, respecto al
grado que le precede, un incremento en la amplitud de onda por un factor de 10.
Observemos las siguientes representaciones gráficas de las magnitudes de los sismos
el 27 y 28 de julio del 2008:
Fuente: Información extraída de los informes realizados por el Servicio Nacional de Geología y Minería.
¿Qué información puedes obtener de los gráficos anteriores? ¿De que magnitud son la
mayoría de los sismos presentados en los dos días? ¿Puedes calcular la cantidad total de
sismos el día 27 de julio? ¿Qué magnitud es la que mayor frecuencia presenta el día 28
de julio? ¿Se puede responder estas interrogantes sólo observando el gráfico?
Los gráficos nos muestran la frecuencia de los sismos de una determinada magnitud,
la cual esta dada en intervalos, como por ejemplo de 3,1 a 3,5 en la escala de Richter,
y tienen una frecuencia de 70 sismos el día 28 de julio del 2008.
1. Observando los gráficos anteriores, ¿cuál de los días hubo más actividad sísmica?
2. ¿Podrías estimar la cantidad sismos que están por sobre los 3,5 grados en los dos días?
120
100
80
60
40
20
0
1,0-2,5 2,5-3,0 3,1-3,5 3,6-4,0
Magnitud
Número de sismos
Número de sismos VT v/s magnitud
27 de julio 2008
80
70
60
50
40
30
20
10
0
Magnitud
Número de sismos
Número de sismos VT v/s magnitud
28 de julio 2008
1,0-2,5 2,5-3,0 3,1-3,5 3,6-4,0
nota n
El hipocentro es el punto
al interior de la Tierra,
donde se inició el movimiento
sísmico.
actividades
188
Datos y azar
Los gráficos de la página anterior representan un tabla de frecuencia de datos agrupados
en intervalos o recorridos, a estos gráficos les denominamos histogramas.
Los histogramas son la representación más común de distribuciones de una variable
cuantitativa como se puede apreciar en los informes económicos, políticos,
sociales y muchos más.
Básicamente, un histograma no es más que un conjunto de rectángulos representativos,
cada uno de ellos, de un intervalo de agrupación o clase. Las bases de dichos
rectángulos son equivalentes a la amplitud del intervalo y la altura se calcula de
manera que su área sea proporcional a la frecuencia de cada clase.
Como puedes observar en algunos histogramas se muestra una línea poligonal
abierta la cual une los centros de clases de los rectángulos de frecuencia. La siguiente
gráfica muestra las exportaciones chilenas en los ultimos 8 años en miles de
millones, ¿qué información nos entrega la línea poligonal del gráfico derecho?
recuerda r
En lugar de utilizar frecuencias
absolutas, los
histogramas también se
pueden contruir considerando
frecuencias relativas
o porcentajes.
nota n
La palabra histograma
es griega:
histos = trama o textura,
grama = escritura.
Como podemos ver en los dos gráficos el comportamiento de las exportaciones
de Chile ha aumentado considerablemente. Así la línea poligonal del gráfico derecho
nos facilita observar el comportamiento de las exportaciones, por ejemplo:
$70 000 000 000
$56 000 000 000
$42 000 000 000
$28 000 000 000
$14 000 000 000
$0
2003 2004 2005 2006 2007 2008
70
56
42
28
14
0
2000 2001 2002 2003 2004 2005 2006 2007 2008
4
Unidad
observamos que el mayor incremento en las exportaciones se presentó entre los
años 2006 y 2007, ya que el segmento que los une presenta una mayor pendiente
positiva.
La línea poligonal abierta del gráfico anterior recibe el nombre de polígono de
frecuencia y se utiliza para observar el comportamiento más suave de una distribución
de frecuencias. Así por ejemplo en el siguiente polígono de frecuencia
podemos ver que los promedios de puntajes de Lenguaje y Matemáticas PSU del
2008 tuvieron el siguiente comportamiento. ¿Cuál fue el puntaje más obtenido?
1. Observa el gráfico de la derecha y responde:
a) ¿Cuáles son las diferencias entre los gráficos de los
hombre y las mujeres?
b) ¿En qué periodo de edad existe mayor cantidad de
personas con discapacidad?
c) ¿Quiénes son más proclives a tener algún tipo de
discapacidad?
2. Observa el gráfico de la derecha y determina:
a) Los vértices del polígono de frecuencia, los cuales
son determinados por las marcas de clase de cada
intervalo y la frecuencia dada por la altura del rectángulo.
b) El área de cada rectángulo y súmalos.
c) El área debajo del polígono de frecuencia.
d) ¿Las áreas son iguales?
nota n
Las marcas de clase, son
los puntos medios de los
periodos o intervalos de
clase.
85 y +
80-84
75-79
70-74
65-69
60-64
55-59
50-54
45-49
40-44
35-39
30-34
25-29
20-24
15-19
10-14
5-9
0-4
MIL 140 120 100 80 60 40 20 0 0 20 40 60 80 100 120 140 MIL
Hombres Mujeres
Pirámide poblacional de las personas con discapacidad según edad y sexo.
Chile 2004.
6
5
4
3
2
1
0
65 75 85 95 105 115 125
150-199,5
200-249,5
250-299,5
300-349,5
350-399,5
400-449,5
450-499,5
550-599,5
500-549,5
650-699,5
600-649,5
750-799,5
700-749,5
800-850
30 000
25 000
20 000
15 000
10 000
5 000
0
Cantidad de alumnos
Puntaje promedio PSU 2008 Lenguaje y Matemáticas
Puntaje
actividades
190
Datos y azar
2 Acumulando
La siguiente tabla muestra la distribución de los resultados de los alumnos en
la PSU, proceso de admisión 2009, promedio lenguaje y matemáticas considerando
el ingreso familiar, los cuales se han clasificados en 12 tramos, como lo
detalla la tabla de la izquierda.
Si nos centramos en los alumnos que obtuvieron más de 700 puntos, ¿qué cantidad
de alumnos tiene un ingreso familiar mayor a 720 000? o mejor aún, ¿cuál es el tramo
donde se encuentra la mitad de los alumnos con puntajes mayores 700 puntos?
Para poder dar respuestas a estas preguntas debemos sumar las frecuencias de los
tramos. Observa la siguiente tabla y gráfico:
A medida que sumamos las frecuencias de alumnos, vamos obteniendo los valores
de columna de la tabla de frecuencia acumulada, por ejemplo a la cantidad de
alumnos del tramo 1 se le sumó la cantidad de alumnos del tramo 2 y obtuvimos
la cantidad de alumnos que teniendo un puntaje superior a 700 puntos en la PSU,
el ingreso familiar bruto esta bajo los $ 288 001.
1. En el gráfico de polígonos de frecuencia, ¿cuál es el mayor incremento que sufre el polígono de frecuencia
de un vértice a otro?
2. En los alumnos que tuvieron puntajes entre 601 y 700 en la PSU. ¿Cuántas familias tienen un ingreso bruto
menor a $ 432 001? Desarrolla las tablas de frecuencia y grafica los polígonos de frecuencia acumulada.
importante i
Al polígono de frecuencia
acumulado se le denomina
ojiva.
Tramo Fr. Absoluta Fr. Acumulada
1 263 263
2 635 898
3 617 1 515
4 450 1 965
5 421 2 386
6 388 2 774
7 453 3 227
8 575 3 802
9 170 3 972
10 158 4 130
11 196 4 326
12 2 271 6 597
7 000
6 000
5 000
4 000
3 000
2 000
1 000
0
1 2 3 4 5 6 7 8 9 10 11 12
Frecuencia de alumnos
Tramo
Fr. Absoluta
Fr. Acumulada
Tramo Descripción
1 Menos de 144 000
2 144 001 a 288 000
3 288 001 a 432 000
4 432 001 a 576 000
5 576 001 a 720 000
6 720 001 a 864 000
7 864 001 a 1 008 000
8 1 008 001 a 1 152 000
9 1 152 001 a 1 296 000
10 1 296 001 a 1 440 000
11 1 440 001 a 1 584 000
12 1 584 001 ó más
PUNTAJE T1 T2 T3 T4 T5 T6 T7 T8 T9 T10 T11 T12 SI TOTAL
Menos de 450 29 041 30 346 10 282 3 892 1 863 1 009 733 330 139 109 99 423 42 78 308
450 – 600 26 997 41 545 21 060 10 298 6 606 3 733 3 656 2 215 813 745 735 3 724 27 122 154
601 – 700 3 336 6 925 5 124 3 409 2 719 2 027 2 246 2 078 634 636 668 5 252 5 35 059
Más de 700 263 635 617 450 421 388 453 575 170 158 196 2 271 0 6 597
TOTAL 59 637 79 451 37 083 18 049 11 609 7 157 7 088 5 198 1 756 1 648 1 698 11 670 74 242 118
Fuente: DEMRE.
actividades
4
Unidad
Si tengo información,
¿cómo la presento?
Lautaro realizó una encuesta a sus compañeros sobre las horas de estudio que
habían realizado la semana anterior, obteniendo los siguientes datos: 18, 60, 72,
58, 20, 15, 12, 26, 16, 29, 26, 41, 45, 25, 32, 24, 22, 55, 30, 31, 55, 39, 29, 44,
29,14, 40, 31, 45, 62, 36, 52, 47, 38, 36, 23, 33, 44, 17 y 24.
¿Cómo podrá Lautaro presentar estos datos a sus compañeros de curso? Vamos a
usar el histograma, el polígono de frecuencia y frecuencia acumulada para ayudar
a Lautaro. Primeramente debemos crear una tabla de distribución de frecuencia.
Si contamos los datos, nos podemos dar cuenta que hay 40 datos, los cuales varían
de un mínimo de 12 horas a un máximo de 72 horas de estudio. Debemos determinar
en cuantas clases queremos distribuir los datos. Tenemos 40 datos, por lo tanto
tenemos que el número más cercano a 40 se aproxima al número entero 6, luego
restamos el dato mayor que es 72 al dato menor 12 y lo dividimos por 6.
X X
k
max − min = 72 − 12 =
6
10
Siendo 10 la amplitud de las clases. Ahora tenemos que la primera clase esta dada
por el intervalo [12-22], luego como las clases deben ser excluyentes tenemos que
la segunda clase va de 23 a 33 y así sucesivamente, obteniendo la siguiente tabla:
Clase Frecuencia Fr. acumuladas
12 a 22 8 8
23 a 33 14 22
34 a 44 8 30
45 a 55 6 36
56 a 66 3 39
67 a 77 1 40
Ya habíamos visto como se obtenía la frecuencia acumulada. Para generar el histograma
debemos generar un gráfico donde el eje horizontal representa las clases y el
eje vertical representa la frecuencia de cada clase. Como observamos los datos son
enteros, por lo tanto es bueno que los ejes tomen valores enteros. Así obtenemos el
siguiente histograma:
3
18
14
12
10
8
6
4
2
0
Horas de estudio
12 a 22
23 a 33
34 a 44
45 a 55
56 a 66
67 a 77
45
40
35
30
25
20
15
10
5
0
12 a 22
23 a 33
34 a 44
45 a 55
56 a 66
67 a 77
192
Datos y azar
1. Las siguientes son las distancias que 30 estudiantes elegidos al azar de una
escuela recorren diariamente de ida y vuelta para ir a la escuela (en cuadras).
a) Elabora la tabla de distribución de frecuencia y frecuencia acumulada.
b) Elabora un histograma.
c) Elabora el polígono de frecuencia y frecuencia acumulada.
2. Observa la tabla de distribución de frecuencia de la derecha.
a) Desarrolla el histograma y el polígono de frecuencia.
b) Determina la columna de frecuencia acumulada y la de marcas de clase.
Luego grafica el polígono de frecuencia acumulada asociado.
12 30 10 11 18 26 34 18 8 12
26 14 5 22 4 25 9 10 6 21
18 18 9 16 44 23 4 13 36 8
Puntaje estándar Total
150-199,5 13
200-249,5 521
250-299,5 3 485
300-349,5 12 008
350-399,5 21 841
400-449,5 32 317
450-499,5 38 905
500-549,5 38 568
550-599,5 31 342
600-649,5 20 874
650-699,5 11 074
700-749,5 4 348
750-799,5 1 348
800-850 248
Total 216 892
actividades
Ahora para obtener los polígonos de frecuencia y frecuencia acumulada debemos
determinar las marcas de clase. Como recordamos, las marcas de clase son el punto
medio entre los extremos de los intervalos de las clases. Así tenemos que la marca
de clase para el primer intervalo es
12 22
2
17
+ =
Siendo 17 la marca de clase del primer intervalo. Luego considerando las mismas
frecuencias de los rectángulos, obtenemos los siguientes gráficos de polígonos de
frecuencia y frecuencia acumulada.
¿Qué información me entregan tanto los histogramas como los polígonos de frecuencia
con respecto a las horas de estudio?
HORAS DE ESTUDIO
HORAS DE ESTUDIO
CLASE DE EDADES
CLASE DE EDADES
16
14
12
10
8
6
4
2
0
45
40
35
30
25
20
15
10
5
0
12 a 22 23 a 33 34 a 44 45 a 55 56 a 66 67 a 77
12 a 22 23 a 33 34 a 44 45 a 55 56 a 66 67 a 77
4
Unidad
¿Se puede con Excel?
Excel es un software que viene incluido en los programas de Microsoft Office.
Excel permite desarrollar los histogramas y polígonos de frecuencia de manera
más fácil y rápida.
Recordemos los datos de la encuesta de Lautaro, los cuales ordenamos en la tabla.
Desarrollemos estas tablas de frecuencia en Excel.
Lo primero que debemos hacer es colocar los nombres a las columnas de la tabla
de frecuencia: el número de la clase, descripción de la clase y la frecuencia, para
luego completar la tabla.
Luego de completar la tabla nos dirigimos al asistente para gráficos, donde nos
aparecerá un cuadro como el que se muestra en la página siguiente.
El asistente nos ofrece una gran cantidad de tipos de gráficos para desarrollar, pero
sólo vamos a realizar un gráfico de columna agrupada, el primero que se muestra
en el asistente.
4
importante i
Un modelo matemático
ampliamente utilizado para
representar distribuciones
de frecuencias es el de la
llamada “Curva de Gauss”.
Para visualizar dicha curva,
en el área de matemática
del Museo de Ciencia y
Tecnología de París (Francia)
se dispone de la “Plancha
de Galton” presente en la
fotografía.
194
Datos y azar
Como puedes observar el recuadro de asistente para gráfico destaca el que vamos a
usar. Seleccionamos siguiente y aparecerá otro recuadro el que pide los rangos de
los datos y los rótulos o nombres de las columnas, en este caso la descripción de las
clases y la frecuencia de cada clase.
Además en el segundo paso se debe cambiar el nombre de las series, las cuales,
como ya sabes, son la descripción de cada clase. Así seleccionamos la segunda
hoja del recuadro y seleccionamos la serie 1 y luego vamos a donde se encuentra
el nombre de la serie 1, en nuestro caso columna B y fila 4. También podemos
agregar el nombre del eje, que en nuestro caso es clases. Luego se continúa con
las demás series.
4
Unidad
Ahora en el tercer paso podemos colocar el nombre a los ejes, tanto horizontal
como vertical. También podemos colocar el título del gráfico. Hay otras posibilidades
para el gráfico, pero te dejamos que investigues tu solo.
El cuarto paso nos pide que le digamos donde queremos el gráfico, en la hoja 1, en
la que estamos trabajando o en otra.
Para el polígono de frecuencia, debemos elegir el gráfico tipo líneas y para observar
mejor los marcadores de cada clase, seleccionamos el gráfico de líneas con
marcadores en cada valor de datos. Los pasos 3 y 4 son exactamente los mismos
que para un histograma.
196
Datos y azar
1 El gráfi co presenta la prevalencia de último año
de consumo de marihuana y cocaína según
rendimiento escolar, en porcentajes.
Fuente CONACE
a) ¿Existe alguna relación entre el porcentaje
de consumo y las califi caciones?
b) ¿Cuál es la razón entre los porcentajes de
alumnos que obtuvieron califi caciones entre
6,0 y 7,0 y los que obtuvieron califi caciones
entre 4,9 y menos?
c) ¿Qué conclusiones sacas tu de esta información?
2 Los siguientes datos corresponden a las precipitaciones
de la Isla de Juan Fernández en un año
en milímetros cúbicos.
23,3 23,8 60,0 36,3
243,2 299,3 168,1 194,8
57,2 100,4 38,6 39,2
a) Elabora la tabla de distribución de frecuencia
con datos agrupados en clases, indicando
la frecuencia absoluta, frecuencia relativa,
frecuencia acumulada y por último la marca
de clase.
b) Elabora un histograma y el polígono de frecuencia.
c) Elabora el polígono de frecuencia acumulada.
aplicando lo aprendido
3 La siguiente tabla muestra el porcentaje de chilenos
con discapacidad por rango etáreo.
Fuente INE
a) Sabiendo que la población total de discapacitados
es de 2 068 072 personas. Determina
la tabla de distribución de frecuencia
que dio origen al gráfi co.
b) Luego determina la frecuencia acumulada
y elabora el polígono de frecuencia acumulada.
4 El siguiente cuadro representa el consumo de
carne de Chile en el periodo 1980-1990.
a) ¿Cuáles fueron los periodos de baja en el
consumo per cápita de carne que hubo
entre1980-1990?
b) ¿En qué periodos se encuentran las variaciones
con mayor alza de consumo?
c) ¿En qué año se produjo el menor consumo
y el mayor consumo de carne?
30
25
20
15
10
5
0
24
6
17
3
9
1
4,9 o menos Entre 5,0 y 5,9 Entre 6,0 y 7,0
Marihuana Cocaína
60
50
40
30
20
10
0
1,1
4,6
8,3
51,0
35,1
0 a 5 años 6 a 14 años 15 a 29 años 30 a 64 años 65 años y más
C o n s u m o a n u a l p e r c á p i ta d e c a rn e e n C h i l e
1 7
1 4
1 5 ,6
1 7 ,6
1 8 ,5
2 0
1 5
1 4 ,7
1 7 ,3
1 8 ,5 1 8 ,1
1 0
1 5
2 0
2 5
1 9 8 0 1 9 8 1 1 9 8 2 1 9 8 3 1 9 8 4 1 9 8 5 1 9 8 6 1 9 8 7 1 9 8 8 1 9 8 9 1 9 9 0
A ñ o s
4
Unidad
¿Quién debe representar a los datos?
Amaru obtuvo las siguientes calificaciones en matemáticas.
1 4 7 5 4 6 4
¿Cuál debería ser la calificación final en matemática para Amaru? ¿Qué calificación
representa mejor a todas las calificaciones de Amaru? ¿Qué podemos hacer?
Lo que necesitamos es una calificación, tal que las demás calificaciones estén a su
alrededor, es decir, estén cerca de ese valor. Necesitamos un número intermedio,
necesitamos una medida de tendencia central.
Cuando los profesores obtienen los promedios de las notas, usan una medida de
tendencia central, es decir están obteniendo una calificación que represente a las
calificaciones obtenidas en la asignatura. Esta medida de tendencia central recibe
el nombre de media.
La media de n datos x1, x2, . . . , , xn, se calcula por medio de la fórmula
x x x x
n
= 1 + 2 + …+ n
En el caso de Amaru la media se obtiene
1 4 7 5 4 6 4
7
4 4
+ + + + + + ≈ , ≈ 4,4
¿Crees que la calificación final representa a las calificaciones de Amaru? ¿Amaru
debió tener mayor o menor calificación final del curso? ¿Qué crees tú?
Lautaro opina que Amaru debió haber tenido la nota que más se sacó en la asignatura,
es decir, un 4, ¿qué piensas tú al respecto? Lautaro esta usando otra medida
de tendencia central, ésta medida recibe el nombre de moda. Es cierto, al parecer
ya habíamos escuchado esta palabra en el mundo comercial, cuando una prenda de
ropa o anteojos es muy usado se dice que esta de moda. En nuestro caso la calificación
4 es la que más reiterada, por lo cual corresponde a la calificación con mayor
frecuencia.
La moda de un conjunto de datos, es el valor que aparece con mayor frecuencia.
5
importante i
x se lee x barra.
1. Si las calificaciones de Amaru fueran: 1, 1, 7, 7. ¿Qué medida de tendencia central escogerías para representar
al conjunto de calificaciones?
2. Hay 10 personas en un ascensor, 4 mujeres y 6 hombres. El peso medio de las mujeres es de 58 Kg. y el de
los hombres de 72. ¿Cuál es el peso medio de las 10 personas del ascensor?
3. La media en fluidez verbal de una clase de un colegio es de 400. Si extraemos una muestra aleatoria de 5
estudiantes y resulta que la puntuación de los 4 primeros es de 380, 420, 600, 400. ¿Cuál sería aproximadamente
la puntuación esperada para el quinto estudiante?
nota n
La realización de los censos
originó la necesidad
de mejorar los métodos
de recolección y análisis
de datos, apoyándose en
herramientas matemáticas
y en el cálculo de
probabilidades. Mediante
el uso de cuadros, tablas
y gráficos se organizaron
y redujeron datos. La Estadística
Descriptiva se
ocupa de organizar, reducir
los datos y calcular los
principales descriptores
estadísticos, tales como:
las medidas de tendencia
central, dispersión, asimetría
y kurtosis.
actividades
198
Datos y azar
Lautaro es un alumno que siempre al final de los cursos se esfuerza para cambiar
y elevar la media de la calificación final. Las primeras 4 calificaciones de Lautaro
son las siguientes:
3 4 3 4
En la última prueba Lautaro obtuvo una calificación 7 y estaba feliz, pero el profesor
viendo que Lautaro podía esforzarse más durante el año, no uso la media
para estimar su calificación final. El profesor ordenó las calificaciones de menor a
mayor
3 3 4 4 7
Observó que tendría dificultad al aplicar la moda a las calificaciones, así que escogió
la nota que estaba al medio de las calificaciones, es decir, escogió el 4 como
calificación.
¿Qué medida de tendencia central uso el profesor? El profesor uso la medida de
tendencia central llamada mediana. Como puedes observar la mediana no se ve
afectada por los valores de los datos extremos.
Para determinar la mediana de un grupo de datos debemos:
1. Distribuir los datos en orden numérico (del más pequeño al más grande o del
más grande al más pequeño).
2. Si el número de datos es impar, la mediana es el dato que se encuentra a mitad
de la lista.
3. Si el número de datos es par, la mediana es la media de los dos datos que se
encuentran a la mitad de la lista.
En la siguiente tabla de distribución, ¿cómo obtendrías los valores de la media,
moda y mediana?
nota n
Estimar la media en datos
agrupados, puede
que no resulte muy confiable,
ya que usamos
sólo un representante
de cada clase, la marca
de clase.
Tramo Descripción Fr. Absoluta Fr. Acumulada
1 Menos de 144.000 263 263
2 144.001 a 288.000 635 898
3 288.001 a 432.000 617 1 515
4 432.001 a 576.000 450 1 965
5 576.001 a 720.000 421 2 386
6 720.001 a 864.000 388 2 774
7 864.001 a 1.008.000 453 3 227
8 1.008.001 a 1.152.000 575 3 802
9 1.152.001 a 1.296.000 170 3 972
10 1.296.001 a 1.440.000 158 4 130
11 1.440.001 a 1.584.000 196 4 326
12 1.584.001 o más 2 271 6 597
7 000
6 000
5 000
4 000
3 000
2 000
1 000
0
1 2 3 4 5 6 7 8 9 10 11 12
Frecuencia de alumnos
Tramo
Fr. Absoluta
Fr. Acumulada
Para datos agrupados en clases, la media se estima con la siguiente expresión:
x m n m n m n
n
= 1 1 + 2 2 + …+ k k
donde m1, m2, . . . , mk son las marcas de clase y n1,n2, . . . , nk son las frecuencia de
cada clase y el n del denominador indica la cantidad de datos.
4
Unidad
Para datos agrupados, la mediana se estima determinando primeramente la posición
de esta en el conjunto de datos ordenados. Entonces para n datos tenemos que
la posición de la mediana (Me) esta dada por la expresión
Me L A nF
NI
= inf + ⋅ 2
Luego de determinar la posición determinamos el intervalo cuya frecuencia absoluta
acumulada supera inmediatamente a la posición de la mediana pos(me). Así
tenemos la siguiente expresión:
Me L A nF
NI
= inf + ⋅ 2
donde Lin f es el límite inferior del intervalo, F es la frecuencia acumulada del intervalo
de clase, nI es la frecuencia absoluta del intervalo mediano y por último A es
la amplitud del intervalo mediano.
Para datos agrupados, la moda (Mo) se determina primero identificando la clase
con la mayor frecuencia. Luego aplicamos la siguiente expresión:
Mo L F
F F
s
a s
= +
inf +
donde Lin f es el límite inferior del intervalo modal, Fs es la frecuencia absoluta
siguiente a la modal y Fa es la frecuencia absoluta anterior a la modal.
1. Si las calificaciones de Ayinko son las siguientes: 4 5 6 7 5 6 3.
a) Determina todas las medidas de tendencia central de las calificaciones
de Ayinko.
b) Decide cuál de las medidas de tendencia central, le conviene a Ayinko
para la calificación final.
2. Determina las medidas de tendencia central de la tabla de distribución de
la página anterior.
3. La tabla de la derecha, muestra la cantidad de empleos por región en
miles de personas.
a) ¿Cuál es el promedio de empleos que se ofrece a nivel nacional?
b) ¿Qué región tiene la mayor cantidad de empleos? ¿A qué medida de
tendencia central corresponde este valor?
c) ¿Cuál es la mediana en la cantidad de empleos?
4. ¿Cómo sería el histograma, si la media, moda y mediana coinciden en un
mismo valor? ¿Y si la moda va primero, la mediana después y por último
la media? ¿Y si la media va primero, la mediana después y por último la
moda?
Región Total
Total 6 740,4
Tarapacá 132,0
Antofagasta 220,0
Atacama 113,9
Coquimbo 251,5
Valparaíso 663,1
O’Higgins 331,4
Maule 381,8
Bío-Bío 705,7
Araucanía 355,2
Los Lagos 323,6
Aysén 47,0
Magallanes 62,6
Metropolitana 2 930,9
Los Ríos 141,1
Arica Parinacota 80,3
actividades
200
Datos y azar
Medidas de posición
Observa la siguiente tabla:
La tabla muestra los gastos e ingresos mensuales de hogares de ciudades capitales
de Chile, según grupo de quintil de hogares.
¿Qué significado tiene la palabra quintil? Un quintil corresponde a la quinta parte
del grupo total. Como puedes observar, el numero total de hogares del estudio es
de 2 650 757, al numero total de hogares lo dividieron en 5 partes iguales, así podemos
ver que hay 5 grupos de 530 151 hogares cada uno.
Para el primer quintil, ¿cuál es el gasto mensual? ¿Cuál es la cantidad de personas
promedio que hay en los hogares pertenecientes al primer quintil?
El quintil es una medida de posición, pero también se les conoce como medidas
de distribución, ya que indica la cantidad de datos que se encuentra bajo o sobre
cierto porcentaje, por ejemplo en los hogares pertenecientes al primer quintil, ellas
representan al 20% del total de hogares.
Así como la mediana, divide al total de los datos en dos partes equivalentes y el
quintil divide en partes equivalentes existen otras medidas de posición, como por
ejemplo, el cuartil y el percentil. ¿En cuántas partes divide el cuartil al total de
datos? ¿Y el percentil?
El cuartil particiona a una distribución de frecuencias en 4 partes mediante los puntos
Q1, Q2 y Q3 llamados primer cuartil, segundo cuartil y tercer cuartil respectivamente,
tal que el primer cuartil corresponde al 25% inferior de la distribución de frecuencia,
el segundo cuartil corresponde al 50% inferior de la distribución de frecuencia y el
tercer cuartil corresponde al 75% inferior de la distribución de frecuencia.
El percentil particiona a una distribución de frecuencia en 100 partes, mediante los
puntos P1, P2,…, P99, llamados primer percentil, segundo percentil y así sucesivamente
hasta el 99avo percentil. Así tenemos que P1 concentra al 1% inferior de la
distribución de frecuencia, así con los demás percentiles.
¿Con qué percentil coincide la mediana? ¿Con qué percentil coincide el tercer cuartil?
6
importante i
El percentil k, se denota
y calcula de la siguiente
forma Pk n
k
= ( + 1)
100
Total de ciudades capitales
Hogares, personas, gastos e ingreso mensual por hogar, según grupo de quintil de hogares
EPF noviembre 2006 – octubre 2007
Grupo de
quintiles de
hogares
Hogares Nº de
personas
por hogar
Personas Gasto mensual
(Pesos abril 2007)
Ingreso mensual
(Pesos abril 2007)
Participación
en el ingreso
Número Porcentaje Número Porcentaje Por hogar Per cápita Por hogar Per cápita total
Total 2 650 757 100,00 3,56 9 433 750 100,00 652 967 191 905 659 050 185 184 100,00
1 530 151 20,00 4,24 2 245 306 23,80 304 042 71 789 177 103 41 817 5,38
2 530 151 20,00 3,88 2 058 416 21,82 404 702 104 232 312 497 80 485 9,48
3 530 151 20,00 3,68 1 949 335 20,66 515 934 140 316 453 217 123 259 13,75
4 530 151 20,00 3,26 1 725 660 18,29 697 700 214 345 670 936 206 123 20,36
5 530 151 20,00 2,74 1 455 033 15,42 1 492 456 543 787 1 681 500 612 666 51,03
Hogares ordenados de acuerdo al ingreso Per Cápita. Ingreso, excluye arriendo imputado por vivienda propia o cedida gratuitamente. Deflactado por IPC General.
4
Unidad
problema resuelto
En este diagrama de barras se ha representado el número de hermanos que tienen los alumnos
y alumnas del Primero medio de un colegio.
A partir del gráfi co determina la tabla de distribución de frecuencia y determina la moda,
mediana y media del número de hermanos del curso. Además determina cuál es el número de
hermanos tal que el 75% de alumnos del curso tenga un numero igual o inferior.
Solución
Para realizar la tabla de distribución primero debemos determinar el nombre de cada clase o
rango. Las clases están dadas por el número de hermanos.
Como observamos hay 45 alumnos en el curso. Para determinar
la media de hermanos del curso debemos dividir
la suma de los hermanos en el curso por la cantidad de
alumnos, es decir
0 7 1 20 2 13 3 4 4 1 5 0
45
1,38
× + × + × + × + × + × ≈
Como no puede haber 1,38 hermanos, ya que las unidades
son enteros, tenemos que la media de hermanos es de 1,
ya que es el valor que más se le acerca. La moda de hermanos,
como lo puedes observar es 1.
Como recordarás la mediana es el valor que se encuentra en la mitad de los datos ordenados.
Para determinar la mediana lo primero que debemos determinar es su posición al interior
de los datos, y como son 45 datos tenemos que la pos(me) =
45 +1
2
. Entonces observando la
tabla tenemos que el valor que se encuentra en esa posición es el número 1, ya que esta en la
frecuencia acumulada de 1 hermano, hacia abajo.
Para determinar el percentil 75 P75 o tercer cuartil Q3 debemos determinar su posición al interior
de los datos ordenados. Para ello usamos la regla P75 = (45 +1)
75
100
= 46
3
4
= 34,5 ≈ 35 , así
la posición es la 35, luego observando la tabla tenemos que el numero de hermanos es 2, tal
que el 75% de alumnos del curso tienen igual o menor número de hermanos.
Clase Frecuencia Fr. Acumulada
0 7 7
1 20 27
2 13 40
3 4 44
4 1 45
5 0 45
20
18
16
14
12
10
8
6
4
2
0
0 1 2 3 4 5
202
Datos y azar
1 Los siguientes datos son los pesos de los alumnos
de un curso:
Hombres
55 64 70 74 75 70
64 93 60 62 70 80
61 60 62 68 65 65
66 68 70 72 72 71
56 56 56 53 60 65
Mujeres
60 45 46 50 47 55
49 52 50 46 50 52
52 48 52 63 53 54
54 54 53 55 57 44
67 61 68 55 64 60
a) Determina la media, moda y mediana de los
pesos de los alumnos.
b) Elabora una tabla de distribución de frecuencia.
c) Elabora el histograma y polígono de frecuencia.
d) Determina cual es el valor del peso tal que el
80% de alumnos tenga igual peso o inferior.
e) Determina cuál es el valor del peso tal que
el 45% de los alumnos tenga un peso mayor
al determinado.
f) Determina el tercer cuartil.
2 La edad media de los 175 alumnos de una escuela
es de 8 años, y la de los 12 adultos (profesores
y personal) es de 40 años. ¿Cuál es la edad
media de todas las personas de esa escuela?
3 Si se conoce que el salario medio mensual de 5
hermanos, es de $120 000, y la mediana es de
$100 000.
a) ¿Cuánto dinero llevan mensualmente a la
casa los cinco hermanos?
aplicando lo aprendido
b) Si Juan, el mejor pagado de los cinco hermanos
recibe un aumento de $10 000,
¿cuál es la nueva media y cuál es la nueva
mediana?
4 En un banco comercial se desea estudiar el
tiempo de atención necesario para que un
cliente realice una transacción entre las 12:00
horas y las 14:00 horas. Durante una semana se
tomaron los tiempos de atención de 10 clientes
diariamente, obteniéndose los siguientes datos
tabulados:
Tiempo de atención
en minutos
Cantidad
de clientes
0,25 – 1,65 17
1,65 – 3,05 11
3,05 – 4,45 7
4,45 – 5,85 7
5,85 – 7,25 4
7,25 – 8,65 2
8,65 – 10,65 2
TOTAL 50
a) Determina qué porcentaje de clientes demoraron
a lo más 3 minutos en su atención.
b) Determina cuántos minutos a lo más demorará
en su transacción el 84%.
c) Construya un gráfi co adecuado que permita
mostrar (aproximadamente) la ubicación
de la mediana y el percentil de orden 0,75.
5 Un alumno registra el tiempo de espera de pasajeros
del transporte, obteniendo los siguientes
resultados en minutos:
14 12 10 5 55
a) Calcula todas las medidas de tendencia central.
b) Si el alumno se equivocó al anotar 55, el
debió anotar 5,5, ¿qué medida se vio más
afectada?
4
Unidad
¿Se cumple para toda la población?
Cuando Lautaro encuestó a sus compañeros de curso sobre las horas de estudio que
había realizado la semana anterior, obtuvo que el promedio de horas de estudio de
su curso era 34,8 horas. Ya que la encuesta la había hecho en un sólo curso del colegio,
¿pudo Lautaro haber dicho que los alumnos del colegio tenían un promedio
de estudio 34,8 horas? ¿Qué piensas tú?
Un estudio dice que por cada 10 personas una de ellas es zurda. ¿Este estudio
se cumple en tu curso? ¿Cómo podemos saber si este estudio se cumple para
todo el colegio? ¿Cómo podemos saber si se cumple para toda la población
chilena? Si dices que el 50% de los alumnos de tu colegio son fanáticos de
un equipo de fútbol y el otro 50% es de otro equipo. ¿Cómo podrías probar
esto? Y aun más, si afirmas que el 50% de la población chilena es hincha
del primer equipo, ¿cómo lo podrías probar?, ¿realizando una encuesta a
todos los chilenos?
Realizar estudios que representen a toda la población es muy difícil, ya que por
diferentes razones a veces es muy complejo acceder a toda la población:
a) Establecer contacto con toda la población requeriría mucho tiempo, en el caso
de Lautaro sería preguntarle a toda la escuela.
b) El costo de estudiar todos los elementos de una población resultaría fuera de
nuestro alcance económico. Por ejemplo, como preguntarles a todos los chilenos,
¿cuál es su equipo favorito?
c) Acceder físicamente a toda la población pudiera ser imposible. Por ejemplo, ir
preguntarles a los chilenos que se encuentran en la Antártica, a los chilenos que
están embarcados, etc.
7
1. Un estudio dice que nueve de cada 10 adolescentes tiene sus dientes con caries, ¿se cumple este estudio en
tu curso? ¿Se refleja es estudio en todo el colegio? ¿Cómo se interpreta el estudio para 1 000 adolescentes?
2. ¿Qué tipo de estudio conoces que sea realmente representativo de toda la población?
3. ¿Con qué inconvenientes te puedes encontrar si quisieras realizar un estudio en tu escuela? ¿Podrías sugerir
alguna solución?
4. ¿Te parece que las encuestas que entregan la gran mayoría de los medios de información son reales y confiables?
actividades
204
Datos y azar
Estos motivos nos hacen pensar en cómo elegir una muestra de la población tal
que esta reúna todas las características que son propias de la población, es decir
que la muestra resulte ser representativa de la población total, para lo propósitos
del estudio.
Por lo anterior se debe tener en cuenta los siguientes aspectos para seleccionar una
muestra de una población:
1. El método de selección de los individuos de la población (tipo de muestreo que
se va a utilizar).
2. El tamaño de la muestra.
3. El grado de fiabilidad de las conclusiones que vamos a presentar, es decir, una
estimación del error que vamos a cometer (en términos de probabilidad).
Método de selección de la muestra
Existen dos tipos de muestreo: el probabilístico y el no probabilístico.
Con el muestreo probabilístico, todos los sujetos tienen la misma probabilidad de
entrar a formar parte del estudio. La elección se hace al azar.
El no probabilístico es aquel en el que no todos los sujetos tienen la misma probabilidad
de formar parte de la muestra de estudio.
Los tipos de muestreo probabilísticos más utilizados son: aleatorio simple, aleatorio
sistemático, aleatorio estratificado y aleatorio por conglomerados.
Muestreo aleatorio simple: Muestra seleccionada de manera que cada elemento
o individuo de la población tenga las mismas posibilidades de que se incluya. Por
ejemplo, los números del cartón de los juegos de azar es una muestra aleatoria
simple ya que todos los números tienen igual probabilidad de salir.
Muestreo aleatorio sistemático: Se selecciona un punto aleatorio de inicio y posteriormente
se elige cada k-ésimo miembro de la población. El k se calcula dividiendo
el total de la población por la muestra necesaria: k = Nn
. Si se tiene una
población de 8 000 individuos y el tamaño de la muestra necesario es de 400, se
seleccionará uno de cada 20, que será la fracción de muestreo (8 000/400). Para
decidir por cuál se ha de comenzar, se selecciona aleatoriamente, o por sorteo, un
número del 1 al 20, y a partir de dicho número se va seleccionando a un sujeto de
cada 20.
Muestreo aleatorio estratificado: Una población se divide en subgrupos según
alguna característica, y se forman los denominados estratos y se selecciona al azar
una muestra de cada estrato. La estratificación se suele hacer en función de diferentes
variables o características de interés: género, edad, situación laboral, etc.
Por ejemplo, si se desea efectuar una estratificación por género y se sabe que en la
población la distribución es de 55 mujeres y 45 hombres, por tanto, si el tamaño de
la muestra es de 400, se elegirán aleatoriamente 220 mujeres y 180 hombres.
4
Unidad
Muestra por conglomerados: Una población se divide en conglomerados a partir
de los límites naturales geográficos o de otra clase. A continuación se seleccionan
los conglomerados al azar y se toma una muestra de forma aleatoria con elementos
de cada grupo. Por ejemplo, al tomar una muestra de una región la dividimos en las
comunas y luego seleccionamos al azar cada una de ellas.
Los tipos de muestreo no probabilístico más utilizados son: accidental, de conveniencia:
Muestreo accidental: Este tipo de muestreo se denomina también consecutivo, ya
que la selección de los sujetos de estudio se hace en función de su presencia o no
en un lugar y un momento determinados. Es el caso, por ejemplo, de la inclusión de
las mujeres a medida que van acudiendo al hospital, o el de un encuestador que, en
la calle, entrevista a las personas que pasan en ese momento por allí. Aunque puede
parecer similar al muestreo probabilístico, es evidente que no todas las personas
tienen la misma probabilidad de estar en el momento y el lugar donde se selecciona
a los sujetos.
Muestreo de conveniencia: Los investigadores deciden, según sus criterios
de interés y basándose en los conocimientos que tienen sobre la población,
qué elementos entrarán a formar parte de la muestra de estudio. En este
muestreo (no probabilístico) es muy importante definir con claridad los
criterios de inclusión y exclusión, y cumplirlos rigurosamente.
1. Si quisieras averiguar el deporte preferido de los alumnos de tu colegio, ¿qué tipo de muestreo realizarías?
2. Si quisieras averiguar el equipo favorito de tu comuna, ¿qué tipo de muestro realizarías?
3. En la siguiente imagen puedes observar la selección de una muestra de aliens. ¿Qué tipo de muestreo se
realizó para determinar la muestra?
actividades
206
Datos y azar
El error muestral
y el tamaño de la muestra
Lautaro infirió que el promedio de las calificaciones de la escuela es de 5,9, ya que
al realizar un estudio en su curso la media que le dio fue de 5,9. Pero el promedio de
la escuela es de 5,4. El error que cometió Lautaro, se conoce como error muestral,
ya que existe una diferencia entre el estadístico (moda, media, mediana y otros
que se puedan determinar) de una muestra y el parámetro de la población. Podemos
identificar dos tipos de errores muestrales:
El error aleatorio es el derivado de trabajar con muestras, se puede cuantificar y
está relacionado con la precisión. A medida que se aumenta el tamaño de la muestra,
este error disminuye, hasta el punto de que si se estudia a toda la población el
error aleatorio desaparece.
El error sistemático o sesgo está relacionado con la representatividad de la población;
si la muestra estudiada reúne características diferentes a las que se producen
en la población, aunque se aumente el tamaño de la muestra, este error se mantiene
y se obtendrán valores diferentes en la muestra a los que realmente se dan en la
población. Este error está relacionado con la validez.
¿Qué es la validez? ¿Cómo podemos tener confianza que la muestra es representativa
de la población para no cometer errores?
Observemos la imagen de la izquierda que representa el lanzamiento de un dardo
a un blanco.
Podemos apreciar que en el caso A los impactos están dispersos (baja confiabilidad)
y alejados de la diana (baja validez). En el caso B los impactos siguen dispersos
(baja confiabilidad) pero ahora circundan la diana (alta validez). En el caso C
los impactos están concentrados (alta confiabilidad) pero alejados de la diana (baja
validez). Y finalmente en el caso D los impactos se presentan concentrados en torno
a la diana (alta confiabilidad y alta validez).
Un procedimiento de medición del tamaño de la muestra que sea confiable proporciona
datos con poca variación. Por ello hay que tener presente que si se estudia a
más sujetos de los que en realidad son necesarios, se estarán derrochando recursos,
tanto materiales como humanos. Si, por el contrario, se estudia a pocos sujetos, no
se tendrá la potencia o seguridad suficiente sobre lo que se está haciendo, y puede
darse el caso de que no se encuentren diferencias entre dos grupos, por ejemplo,
cuando en realidad sí las hay.
El tamaño de la muestra necesaria estará condicionado por los objetivos del estudio,
que determinarán el diseño, las variables que deben considerarse y todo el
método planteado para dar respuesta a dichos objetivos.
Existen procedimientos estadísticos que permiten determinar el tamaño de las
muestras, asegurando confiabilidad y validez de los datos de la muestra, pero esos
procedimientos se escapan del tema de nuestro estudio.
8
Validez
Menor Mayor
Confiabilidad
Menor
Caso A Caso B
Mayor
Caso C Caso D
4
Unidad
9 Simetría y dispersión de los datos
Cuando se analizó que calificación debía representar la notas de Amaru y Lautaro,
se tomo un factor, la distribución de las notas y a la vez su variabilidad.
Observa los histogramas de calificaciones de tres cursos que realizaron la misma
prueba de matemáticas.
¿Qué puedes decir de las medidas de tendencia central en los tres gráficos? Como
puedes observar en el gráfico 2 tenemos que la moda, mediana y media son iguales,
esto nos indica que los datos se distribuyen simétricamente con respecto a las
medidas de tendencia central. En el primer gráfico la media es menor a la moda
y mediana, caracterizando al gráfico con una tendencia hacia la izquierda, cuando
esto sucede, se dice que los datos tienen un sesgo positivo. En el tercer gráfico observamos
lo contrario que en el primer, tenemos que la media es mayor a la moda y
mediana, y la gráfica tiene una tendencia hacia la derecha, cuando esto sucede, se
dice que los datos tienen un sesgo negativo.
Dispersión de los datos
Observa los siguientes gráficos de calificaciones de 4 cursos.
Se puede observar que los dos primeros cursos
tienen sus calificaciones simétricas, esto quiere
decir que las medidas de tendencia central son
iguales, pero en el curso uno hay mayor dispersión,
ya que hubo más personas con calificación
4, en cambio en el curso 2 no hubo tanta distancia
entre la personas que obtuvieron 4 y 5 o
4 y 3. Estadísticamente el curso 1 tuvo mayor
dispersión que el curso 2, ya que el curso dos
hay más homogeneidad de los datos.
En los cursos 3 y 4 difieren con respecto a las
medidas de tendencia central, pero con respecto
a su variabilidad se puede observar que es
la misma.
0
1
2
3
4
5
6
7
8
1 2 3 4 5 6 7
0
1
2
3
4
5
6
7
8
1 2 3 4 5 6 7
0
1
2
3
4
5
6
7
8
1 2 3 4 5 6 7
0
1
2
3
4
5
6
7
8
9
1 2 3 4 5 6 7
C u r s o 1
C u r s o 2
0
1
2
3
4
5
6
7
8
9
1 0
1 2 3 4 5 6 7
C u r s o 3
C u r s o 4
Gráfico 1 Gráfico 2 Gráfico 3
importante i
Una distribución se considera
poco dispersa si
los datos presentan poca
variabilidad, es decir si
sus valores difieren poco
entre si y se concentran
en entornos próximos al
valor medio.
208
Datos y azar
Variabilidad en los gráficos
Ya sabes que la variabilidad en las muestra puede dar información de la representatividad
de tal muestra de la población, uno de los métodos más sencillos para medir
la variabilidad de un conjunto de datos es el rango, ésta es la diferencia entre el
máximo y el mínimo valor del conjunto de datos, que denominaremos Rango (R).
En ocasiones esta medida resulta útil, pero cuando los extremos del lote de datos son
valores muy lejanos (valores “atípicos”) R pierde valor como medida de dispersión.
Una mejor forma de proceder en estas situaciones es calcular el rango del 50% central
del conjunto de datos. La delimitación del 50% central de este conjunto se logra
determinando dos valores que denominamos cuarto inferior (Ci) y cuarto superior
(Cs). Es decir los cuartiles 1 y 3, los cuales actúan como medianas de mitades.
Por ejemplo, si preguntamos el número de personas que trabajan en 20 familias
obtenemos la tabla de la izquierda.
Podemos observar que el primer cuartil o Ci y tercer cuartil o Cs son respectivamente.
¿Qué nos dice este resumen numérico? Esto nos dice que en la mitad de las familias
no había más de dos personas que trabajaran y que la otra mitad de las familias tiene
al menos dos personas que trabajan. Además nos dice que el 50% de las familias
tiene entre 1 y 2,5 personas que trabajan, pero como no se puede decir 2,5 personas
esto equivale a 3.
Este gráfico se conoce como gráfico de caja (ver gráfico de la izquierda), el cual
permite visualizar la variabilidad de los datos.
10
Q C
n n
1 i
= = 5 6
+
2
= 1 +1
2
( ) = 1 Q C
n n
3 s
= = 15 16
+
2
= 2 + 3
2
( ) = 2, 5 3 ≈
2 1 2 2
2 3 0 1
2 2 1 2
3 2 3 1
1 0 4 3
Cuando una abuela vive con la familia de sus hijos, probablemente se involucrará en las actividades paternales.
Supón que los siguientes datos representan en número de órdenes dadas a 25 niños por abuelas:
5, 4, 3, 3, 6, 5, 3, 2, 4, 7, 6, 6, 2, 3, 4, 8, 7, 5, 6, 4, 2, 1, 5, 7, 3
a) Compila los datos en una tabla de distribución de frecuencias con columnas para la frecuencia, la frecuencia
acumulada, la frecuencia porcentual y la frecuencia de porcentajes acumulados.
b) Determina el gráfico de caja, de los datos. ¿Qué puedes decir acerca de la variabilidad de los datos?
c) ¿Entre qué datos se encuentra el 50% de ellos?
75% de los datos
50% de los datos
25% de los datos 50% central de los datos
Mínimo
0
Cuarto inferior
1
Mediana
2
Cuarto superior
3
Máximo
4
0 1 2 3 4
actividades
4
Unidad
¿Cuál es la probabilidad de la frecuencia?
Es común observar que las personas lancen una moneda al aire para decidir alguna
situación, como por ejemplo, qué equipo parte en un partido de fútbol o tenis, o
bien quien decidir si se va a un lugar o a otro.
¿Por qué las personas realizan esto para decidir?
La moneda tiene una cara y un sello por lo cual solo existe la posibilidad que salga
una de las dos, pero, ¿cuál de las dos tiene mayor probabilidad de salir?
Como recordarás cuando los hechos tienen la misma probabilidad de suceder se les
denomina “suceso equiprobable”. Entonces, ¿lanzar una moneda es un hecho equiprobable?
¿Cuál es la probabilidad de que salga cara o sello?, observa el polígono de
frecuencia relativa de abajo el cual muestra el lanzamiento de una moneda 20 veces.
Como observas, la probabilidad dada por la frecuencia relativa de que salga cara al
lanzar una moneda es 1
2
. ¿Cuál es la probabilidad de que salga sello? ¿Cuál será la
probabilidad de que al lanzar un dado, salga un 6? ¿Cuál es la probabilidad de que
salga 1? La siguiente dirección de Internet http://www.xtec.cat/~jlagares/matemati
ques/probabilitat/daus/DausCastellano.html muestra un simulador del lanzamiento
de un dado, el cual nos puede ayudar a responder la pregunta. La página te mostrará
el cuadro de diálogo de la derecha.
En el cuadro aparece el número de experiencia, es decir, la cantidad de veces que
se lanzará el dado, una tabla de frecuencia, un histograma con la frecuencia relativa
porcentual y un gráfico de polígono de frecuencia relativa porcentual. ¿Cuál es la
probabilidad de que al lanzar 6 000 veces un dado salga 6? ¿y al lanzar 60 veces?
Como puedes observar a mayor número de lanzamiento la frecuencia relativa adopta
el valor de la probabilidad del evento.
Lo anteriormente enunciado se conoce como la Primera Ley de los Grandes Números,
la cual dice que:
Si efectuamos un número grande de ensayos de cierto experimento
es poco probable que la frecuencia relativa de un acontecimiento
se separe mucho de su probabilidad.
11
0,5
1,0
1 1 1 2 3 4 4 4 4 5 5 6 7 8 9 9 9 9 9 10
10 15 20
C
C
C
C
C C
C C C
S C
S S
S
S S
S
S
S
S
nt
n
210
Datos y azar
Si jugamos con un dado bien hecho, sabemos que la probabilidad de que salga alguno
de los números es 1
6
, ya que por medio de los experimentos realizados en los simuladores
y aplicando la ley de los grandes números se prueba que esa es la probabilidad.
Pero, ¿podríamos haber dicho esto sin hacer los experimentos? Claro que sí, por
ejemplo, ¿cuál es la probabilidad de que al lanzar un dado el número resultante sea
par? Los números que pueden surgir al lanzar un dado son 1, 2, 3, 4, 5 y 6, por cual
tenemos 3 resultados favorables, dentro de los 6, de que al lanzar un dado salga un
número par, es decir la probabilidad es 3
6
1
2
= .
Este cálculo de probabilidad surge del hecho que todos los resultados posibles son
igualmente probables, y recibe el nombre de probabilidad clásica o teórica.
Probabilidad Teórica =
Según la tabla del lado izquierdo, una persona con discapacidad, ¿qué probabilidad
tiene de recibir ayuda? ¿Qué probabilidad tiene de no recibir ayuda? ¿Cómo
calculas las probabilidades? En este caso usaremos la probabilidad dada por la
frecuencia relativa. A este tipo de probabilidad se le denomina probabilidad empírica
y se determina teniendo en cuenta la frecuencia del evento y el número total
de observaciones.
Probabilidad Empírica =
Número de resultados favorables
Número total de posibles resultados
Número de veces que el evento ocurre
Número total de observaciones
1. ¿Cuál es la diferencia entre probabilidad empírica y teórica?
2. En Antofagasta, antes de las elecciones municipales, se aplicó una encuesta a 5 000 personas y se obtuvo
que 1 150 piensan votar en blanco. Si votan 28 589 electores, ¿cuántos votos en blanco se podrían esperar
en esa elección?
3. La tabla de la derecha muestra
los ocupados según rama de actividad.
¿Cuál es la probabilidad de que
al sacar un ocupado en el trimestre
abril/junio pertenezca a
la rama de comercio?
Tarapacá: ocupados según rama de actividad
(en miles de personas)
Rama de actividad
2008
Ene/Mar Abr/Jun Jul/Sep Oct/Dic
Total 119,9 121,4 131,5 132,0
Agricultura, caza y pesca 7,7 9,9 8,3 7,5
Minas y canteras 5,0 10,6 11,0 10,5
Industria manufacturera 12,0 12,6 13,7 11,6
Electricidad, gas y agua 0,8 0,5 0,6 1,2
Construcción 9,8 9,4 10,9 10,9
Comercio 35,8 31,1 31,6 34,3
Transporte, almacenaje y comunicaciones 13,6 10,5 14,0 14,0
Servicios financieros 8,7 9,0 10,5 12,4
Servicios comunales, sociales y personales 26,5 27,8 30,9 29,7
Fuente INE, encuesta nacional de empleos
Personas con discapacidad
según le ofrecen ayuda en la
calle. Distribución porcentual.
Nº %
Si 479 407 23,18%
No 1 294 167 62,58%
A veces 138 015 6,67%
No sale 156 483 7,57%
Total 2 068 072 100%
investiga i
¿Cómo puedes saber si
un dado esta cargado?
actividades
4
Unidad
12 Problemas complementarios
con las probabilidades
Cuando lanzamos un dado tenemos 6 posibles resultados, lo cual como ya sabes, se
denomina espacio muestral.
Entonces la probabilidad del suceso A “obtener un 3 al lanzar un dado” es P(A)= 16
.
De esto se entiende que la probabilidad de no obtener un 3 al lanzar un dado es:
P(no A) = 56
Cuando dijimos no obtener un 3, es pedir que el evento A “obtener un 3 al lanzar
un dado” no cumpla si no que su complemento. Por lo tanto tenemos que la probabilidad
complementaria P(AC) de un evento es:
P(AC) = 1 – P(A)
Así tenemos que el complemento del suceso A “obtener un 3 al lanzar un dado”
se obtiene
P(AC) = 1 – P(A) = 1 − 16
= 56
Otro ejemplo de la probabilidad complementaria es cuando se dice “al menos” o
“a lo más”, las cuales determinan cotas mínimas y máximas respectivamente, por
ejemplo: ¿Cuál es la probabilidad de obtener al menos un sello, al lanzar dos monedas?
Para dar respuesta observa la siguiente tabla, en la cual se observa el espacio
muestral del experimento “Lanzar dos monedas”
Cara Sello
Cara Cara, Cara Cara, Sello
Sello Sello, Cara Sello, Sello
Así podemos ver que la probabilidad del suceso “obtener al menos un sello” es
P(A) = 3
4
, que es lo mismo que calcular la probabilidad complementaria del suceso
B “no obtener ningún sello”, P(BC) = 1 − P(B) = 1 − 1
4
= 3
4
1. ¿Cuánto suma la probabilidad de un suceso más el complemento del mismo?
2. Si se lanzan 2 dados cual es la probabilidad que al menos en uno de los dos dados se obtenga un 6.
3. ¿Qué es más probable, sacar al menos un 6 lanzando el dado 6 veces o sacar al menos dos 6 lanzando el
dado 12 veces o sacar al menos tres 6 lanzando el dado 18 veces?
actividades
212
Datos y azar
Árbol de las probabilidades
Como sabes, en la probabilidad clásica o teórica, el total de resultados posibles
recibe el nombre de espacio muestral y cada uno de los resultados recibe el nombre
de suceso elemental.
Cuando se lanzan dos monedas tenemos dos sucesos:
Suceso A: “lanzar la moneda de $10”.
Suceso B: “Lanzar la moneda de $50”.
Si preguntamos por un posible resultado tenemos el siguiente cuadro, el cual representa
a todo el espacio muestral.
Cara de $10 Sello de $10
Cara de $50 Cara, Cara Cara, Sello
Sello de $50 Sello, Cara Sello, Sello
Lo que también se puede representar de la siguiente forma:
Ahora si preguntamos por la probabilidad de obtener una cara en el
primer lanzamiento y sello en el segundo podemos observar que la
probabilidad es 1
4
, lo que podemos explicar observando el árbol.
Puesto que la mitad de las veces obtenemos cara en el primer experimento
y de esta mitad, la mitad de las veces obtenemos cara en el
segundo, la probabilidad de obtener dos caras es la mitad de un medio,
esto es un cuarto.
13
Desarrolla el árbol de probabilidad del experimento de lanzar 3 monedas y determina:
a) La probabilidad del suceso “CSC”, en el orden establecido.
b) La probabilidad del suceso “CSC”, sin importar el orden.
c) La probabilidad que salga una cara.
d) La probabilidad que salgan dos sellos.
e) La probabilidad de que salga al menos una cara.
f) Determina la probabilidad de que salga a los más una cara.
g) Determina el complemento de probabilidad de “SCS”.
h) Determina el complemento de probabilidad de “CCC”.
i) Determina la probabilidad de que no salga una cara.
j) Determina la probabilidad de que no salga un sello.
C S
CC CS SC SS
12
1
4
12
C S C S
1
4
1
4
1
4
1er
experimento
2do
experimento
Compuesto
actividades
4
Unidad
Cara
Sello
1
2
3
4
5
6
1
2
3
4
5
6
= C, 1
= C, 2
= C, 3
= C, 4
= C, 5
= C, 6
= S, 1
= S, 2
= S, 3
= S, 4
= S, 5
= S, 6
1er
experimento
2do
experimento
Contando las probabilidades
Se lanzan una moneda y un dado, ¿cuál es el espacio muestral de este experimento?
Observa la siguiente tabla:
1 2 3 4 5 6
Cara Cara, 1 Cara, 2 Cara, 3 Cara, 4 Cara, 5 Cara, 6
Sello Sello, 1 Sello, 2 Sello, 3 Sello, 4 Sello, 5 Sello, 6
Como puedes observar, hay 12 posibles pares de combinaciones posibles al lanzar una
moneda y un dado. Ahora observa el árbol.
¿Cuántos posibles resultados hay al lanzar la moneda? ¿Cuántos posibles resultados
hay al lanzar el dado? Son 2 resultados en la moneda y 6 en el dado. Por lo cual podemos
observar:
Donde podemos concluir que para determinar el total de posibles resultados se deben
multiplicar los resultados de la moneda y el dado.
Lo anterior se conoce como principio de la multiplicación el cual dice que si hay que
disponer elementos en dos posiciones y si se dispone de n-elementos para la primera
posición y m-elementos para la segunda posición, entonces el total de parejas posibles
que se pueden formar es n · m.
¿En que ayuda el principio de la multiplicación a la determinación de la probabilidad?
Nos ayuda a determinar la cantidad de resultados que hay en el espacio muestral, por
ejemplo si se lanzan dos monedas y 2 dados, ¿cuál es la probabilidad del suceso A “se
obtenga cara en las dos monedas y seis en los dos dados”? Para poder resolverlo sin
saber el principio de multiplicación, debemos realizar dos tablas, pero ya no es necesario,
ya que si observamos tenemos:
Moneda I Moneda II Dado I Dado II TOTAL
Resultados
posibles 2 2 6 6 144
14
Moneda Dado Resultado total
2 6 12
Luego la probabilidad del suceso es P(A) = 1
144
Se lanza un dado de forma dodecaedra, el cual tiene la serie numérica de 1 a 12 sobre sus caras, además se
lanza un dado común y una moneda.
a) Determina cuántos resultados posibles hay en el espacio muestral.
b) Desarrolla el árbol de probabilidades.
c) Determina la probabilidad del suceso B “obtener 7 y 3 en los dados y sello en la moneda”.
d) Determina la probabilidad de obtener al menos 13 en la suma de los dados.
actividades
214
Datos y azar
LA ESTADÍSTICA
La estadística es una ciencia con base matemática referente a la recolección, análisis e interpretación de
datos, que busca explicar condiciones regulares en fenómenos de tipo aleatorio. Es transversal a una amplia
variedad de disciplinas, desde la física hasta las ciencias sociales, desde las ciencias de la salud hasta el control
de calidad, y es usada, para la toma de decisiones en áreas de negocios e instituciones gubernamentales.
En la historia la Estadística:
Antes del siglo XVI Está asociada a la práctica del conteo y mediciones, tal
como lo practicaban los astrónomos persas y los agrimensores egipcios. Referencias
de esto se encuentran en la obra Los Estados de Aristóteles.
Siglo XVI Se considera la estadística como la descripción de los Estados. Se utiliza
la información de datos geográfi cos y económicos para tomar decisiones de
Estado.
Siglo XVII En Alemania, Italia e Inglaterra se considera
como la ciencia del Estado. En Francia surge el cálculo
de probabilidades. En Inglaterra nace la corriente de los
aritméticos políticos y comienzan a realizarse los censos
con periodicidad decenal.
Siglo XVIII Se mejoran los procesos de recopilación de
datos. Se amplían los usos estadísticos del concepto de
probabilidad y su cálculo. Jacobo Bernoulli publica su
obra Ars Conjectandi, en la que formula la Ley de los
Grandes Números.
Siglo XIX Friedrich Gauss desarrolla la “Teoría de errores” basada en la curva
normal. Se establecen ofi cinas de estadística en Alemania y otros países. Simón D.
Poisson generaliza la Ley de los Grandes Números.
Siglo XX El avance computacional acelera el desarrollo del análisis de datos para afrontar el problema con
muestras de cualquier tamaño y múltiples factores. La probabilidad borrosa alcanza gran auge.
un poco de historia
Papiro Rhind
Representa la mejor
fuente de información
sobre matemática
egipcia que se conoce.
Fue escrito por el
escriba Ahmes aproximadamente
en el año
1650 a.C a partir de
escritos de 200 años de
antigüedad.
Ars Conjectandi
(Artes de las conjeturas)
Se publicó de manera
póstuma en 1713, (Jackob
Bernoulli murió en
1705). Se encargó de
la edición su sobrino
Nicolás I.
Simón D. Poisson
(1781-1840)
Poisson dedicó su vida a la investigación y enseñanza
de las matemáticas. De su mano surgieron
numerosa memorias (sus biógrafos las cifran
entre 300 y 400 ) con aportaciones originales en
muchos campos. Y una serie de tratados con los
que pretendió formar una gran obra de física
matemática que no llegó a concluir.
4
Unidad
PROBABILIDAD EN LA HISTORIA
Desde hace muchos siglos el ser humano ha venido refl exionando acerca de las experiencias cuyos resultados
son inciertos. Se habla de azar (palabra de origen árabe al-zahr, que signifi ca dados para jugar), fortuna que
se asocia a la suerte, chance (que en francés signifi ca oportunidad) y probabilidad.
Antes del siglo XVI Tucidides, historiador griego (ca. 465-395 a.C.), señalaba: “Es imposible
calcular con precisión los hechos que son fruto del azar”. Para el fi lósofo griego
Aristóteles (384-322 a.C.) la probabilidad de un “acontecimiento” se manifi esta en “la
frecuencia relativa del acontecimiento …”.
Siglo XVI La motivación para estudiar la probabilidad estaba vinculada
estrechamente al éxito o al fracaso en los juegos de azar. El
matemático Girolamo Cardano (Pavia, 1501-1576), fue pionero en
el cálculo de probabilidades de juegos de azar, como lo demuestra
su pequeño manual del jugador llamado el “Liber de Ludo Alae”.
En su época Cardano exhibía una extraordinaria perspicacia para los
problemas fundamentales de la probabilidad vinculados a los juegos
de dados.
Siglo XVII En este siglo se encuentra el acta de nacimiento del
concepto de probabilidad en la correspondencia que se cruzan Blaise
Pascal (francés, 1623-1662) y Pierre Fermat (francés, 1601-1665).
Por primera vez Fermat plantea la noción de probabilidad formulada
un siglo más tarde por Laplace, en los términos de número de
casos favorables entre el número de casos posibles.
Siglo XVIII En este siglo, considerado de oro de numerosas disciplinas,
se producen avances que conducen a un tratamiento mas
formal de la probabilidad. Jacques Bernoulli (suizo 1654- 1705)
destacó la importancia del enfoque probabilístico en lo social y demostró
el llamado teorema de Bernoulli. Abraham De Moivre (francés
1667-1754) dió una formulación matemática de probabilidad.
Siglo XIX En este siglo se introdujeron importantes trabajos acerca
de la probabilidad subjetiva y el teorema de Bayes. Pierre Simón,
marqués de Laplace (francés, 1749-1827), conjuntamente con Karl Friedrich Gauss
(1777-1856), demostraron el valor práctico de la curva normal (curva de Gauss) como
forma típica de distribuciones de frecuencia.
Siglo XX En este siglo destacan muchos probabilistas de los que sólo mencionaremos
a Émile Borel (francés, 1871-1956), Richard Von Misses (austríaco, 1883-1953), Harold
Jeffreys (inglés 1891-1989) y Andreï Kolmogorov (ruso, 1903-1987). Mención especial
merece William Feller (croata, 1906-1970) autor del reputado texto “Introduction to
Probability Theory and its Applications”. También se continuaron los estudios sobre
probabilidad subjetiva y el teorema de Bayes, especialmente por parte de los estadísticos
y probabilistas Bruno de Finetti (austríaco, 1906-1985) y Leonard Savage (norteamericano,
1917-1971), entre otros. El desarrollo computacional acelera el avance en
el campo probabilístico.
un poco de historia
Abraham De Moivre
Aristóteles
Girolamo Cardano
Richard Von Misses
Tucidides
216
Datos y azar
aplicando lo aprendido
1 El Departamento de Transporte urbano del
Ministerio ha elegido a la comuna de Santiago
para recabar información sobre accidentes
de tránsito ocurridos al virar hacia la izquierda
en intersecciones. La recolección de los datos
se realizará durante un período de dos años.
Entre otros aspectos, se quiere comparar el
promedio de accidentes en intersecciones con
y sin pista central para el viraje a la izquierda, a
fi n de decidir sobre la posible instalación de dichas
pistas en las principales ciudades del país.
a) Identifi ca la población de interés.
b) Identifi ca el muestreo a usar para determinar
la muestra.
c) Menciona a lo menos dos variables observables
en los elementos de la población que
sean relevantes en la comparación señalada.
Indique para cada variable si es cualitativa
o cuantitativa.
2 Para responder la pregunta: ¿Cuáles son los
tres problemas a los que debería dedicar el mayor
esfuerzo en solucionar el Gobierno?
¿Qué tipo de muestreo se debería desarrollar
para obtener una representavidad del país?
¿Se podría realizar un muestreo conveniente
para dar respuesta a la pregunta?
Si te dicen que para dar respuesta a esta pregunta
entrevistaron a 1 505 personas a nivel
nacional, ¿estarías confi ado de la posible respuesta?
Pero si agregaran que la muestra consistió
en 1 505 personas que fueron entrevistadas
en sus hogares, en 153 comunas del país.
Y que el método de muestreo fue estratifi cado
(por región y zona urbana/rural), aleatorio y
probabilística en cada una de sus tres etapas
(manzana-hogar-entrevistado), ¿tu confi anza
cambiaría al saber esto último?
3 Las edades de un grupo de personas son las
siguientes:
16 18 18 20 21
22 22 23 25 26
32 30 28 30 32
36 40 44 48 50
a) Calcula las medidas de tendencia central.
b) Determina la tabla de distribución con 5 intervalos
de clase.
c) Haz el histograma.
d) Calcula el primer cuartil.
e) Calcula el tercer cuartil.
f) Haz un diagrama de caja de las edades de
las personas.
g) ¿Entre qué edades se encuentra el 50% de
las personas?
h) ¿Qué puedes decir de la variabilidad y dispersión
de las edades de las personas?
4 El siguiente diagrama de tallo y hojas representa
las notas de dos primeros medios en una
prueba de lenguaje.
a) Determina las medidas de tendencia central
para ambos cursos.
b) Haz los gráfi cos de caja de cada curso.
c) Desarrolla los gráficos de barra de cada
curso.
d) Determina cuál de los dos cursos tiene menor
dispersión y variabilidad.
9 8 4 2 0
8 8 6 4 1 1 0
9 8 6 5 4 2 1 0
9 8 5 5 3 2 2 0
0 0
3
4
5
6
7
0 8 8
1 2 2 3 5 8 8 8
0 0 1 2 3 4 4 5 6 7 9
0 0 2 4 5 6 8 9
4
Unidad
5 Los alumnos que se presentaron al examen
de matemática en la convocatoria de diciembre
obtuvieron las siguientes califi caciones:
7 3 2 4 5 1 8 6 1 5
3 2 4 9 8 1 0 2 4 1
2 5 6 5 4 7 1 3 0 5
8 6 3 4 0 10 2 5 7 4
0 2 1 5 6 4 3 5 2 3
9 7 3 4 3 5 7 4 6 5
6 1 0 5 7 8 5 2 3 10
4 6 2 1 1 2 6 7 4 5
4 7 3 6 5 0 2 8 2 7
8 5 2 7 1 4 6 3 5 6
a) ¿Cuál es la probabilidad de que al sacar a
un alumno del grupo que se presentó al
examen de matemática, hubiera tenido una
califi cación 6?
b) ¿Cuál es la probabilidad que al sacar a un
alumno hubiera tenido una califi cación entre
8 y 10?
6 En una clase de 27 alumnos y alumnas, por
cada 5 niñas hay 4 niños. ¿Cuál es la probabilidad
de que la primera persona que salga al
recreo, tras el profesor, sea una niña?
7 Se extrae una carta de un naipe español. Calcula
la probabilidad de los siguientes sucesos.
a) Extraer un 7.
b) Extraer un oro.
c) Extraer un as.
d) Extraer una carta menor que 4.
e) Extraer una copa o espada.
8 Se extrae una carta de un naipe inglés (sin jockers).
Calcula la probabilidad de los siguientes
sucesos.
a) Extraer una jota.
b) Extraer una carta menor que 5.
c) Extraer una carta mayor que 5.
d) Extraer una carta que sea múltiplo de 3.
e) Extraer una carta que no sea múltiplo de 3.
9 Se extrae una bola de una bolsa que contiene 4
bolas blancas, 5 bolas rojas y 3 bolas azules. Calcula
la probabilidad de los siguientes sucesos.
a) Extraer una bola roja.
b) Extraer una bola blanca.
c) Extraer una bola azul.
d) Extraer una bola no blanca.
e) Extraer una bola no azul.
f) Extraer una bola no roja.
10 Se lanzan dos dados y se suman los puntos
obtenidos. Completa la siguiente tabla con las
sumas.
+ 1 2 3 4 5 6
1
2
3
4
5
6
Calcula la probabilidad que la suma de los
puntos:
a) Sea igual a 9.
b) Sea igual a 3.
c) Sea igual a 12.
d) Sea menor a 7.
e) Sea a lo más 6.
f) Sea por lo menos 4.
g) ¿Cuál es la suma que tiene menor probabilidad
de salir? ¿Cuál es la probabilidad?
h) ¿Cuál es la suma que tiene mayor posibilidad
de salir? ¿Cuál es la probabilidad?
11 Se lanzan dos monedas y un dado. Calcula la
probabilidad de que salga.
a) Cara en ambas monedas y 6 en el dado.
b) Sello en ambas monedas y número par en
el dado.
c) Al menos una cara y un número menor a 6.
d) Al menos un sello y un número mayor o
igual a 3.
218
Datos y azar
información en los medios
TERREMOTOS
Aunque, estrictamente hablando, sismo, temblor o terremoto corresponden a un mismo fenómeno, la
costumbre arraigada en Chile y en muchos países latinoamericanos tiende a llamar sismo o temblor
a aquel movimiento telúrico que causa daños menores y escasas víctimas, y terremoto al que tiene
una dimensión mayor en ambos sentidos.
La mayoría de los sismos aquí presentados no han sido medidos científi camente por instrumentos
confi ables, ya sea porque aún no existían o, como ocurrió muchas veces, porque los sismógrafos
colapsaron con el movimiento, debiendo recurrirse a estimaciones según las crónicas (que no pocas
veces suelen exagerar los hechos) o a registros realizados en lugares alejados de los epicentros.
En algunos casos, incluso, la magnitud o intensidad ha sido asignada por servicios sismológicos
extranjeros, generalmente de EE.UU.
En la presente relación el nombre de sismo, temblor o terremoto ha sido asignado en base a como
han quedado registrados en los registros históricos revisados y no tienen involucrado ningún otro
sentido en cuanto a magnitud o intensidad.
Según el servicio sismológico de la Universidad de Chile, los sismos más importantes y/o destructivos
del siglo XX en Chile son los siguientes:
Fecha Magnitud
16/08/1906 7,9
08/06/1909 7,6
04/10/1910 7,3
15/09/1911 7,3
29/01/1914 8,2
14/02/1917 7
20/05/1918 7,9
04/12/1918 8,2
01/03/1919 7,2
02/03/1919 7,3
10/12/1920 7,4
07/11/1922 7
10/11/1922 8,39
04/05/1923 7
15/05/1925 7,1
28/04/1926 7
21/11/1927 7,1
20/11/1928 7,1
01/12/1928 8,3
Fecha Magnitud
19/10/1929 7,5
18/03/1931 7,1
23/02/1933 7,6
01/03/1936 7,1
13/07/1936 7,3
25/01/1939 8,3
18/04/1939 7,4
11/10/1940 7
08/07/1942 7
14/03/1943 7,2
06/04/1943 8,3
01/12/1943 7
13/07/1945 7,1
02/08/1946 7,9
19/04/1946 7,3
25/04/1949 7,3
29/05/1949 7
17/12/1949 7,8
17/12/1949 7,8
Fecha Magnitud
29/01/1950 7
09/12/1950 8,3
06/05/1953 7,6
06/12/1953 7,4
08/02/1954 7,7
19/04/1955 7,1
08/01/1956 7,1
17/12/1956 7
29/07/1957 7
13/06/1959 7,5
21/05/1960 7,3
22/05/1960 7,3
22/05/1960 8,5
19/06/1960 7,3
01/11/1960 7,4
13/07/1961 7
14/02/1962 7,3
03/08/1962 7,1
23/02/1965 7
Fecha Magnitud
28/03/1965 7,4
28/12/1966 7,8
13/03/1967 7,3
21/12/1967 7,5
17/06/1971 7
08/07/1971 7,5
18/08/1974 7,1
10/05/1975 7,7
29/11/1976 7,3
03/08/1979 7
16/10/1981 7,5
04/10/1983 7,3
03/03/1985 7,8
08/04/1985 7,5
05/03/1987 7,3
08/08/1987 7,1
30/07/1995 7,3
13/06/2005 7,8
Fuente: Lista completa en http://ssn.dgf.uchile.cl/home/terrem.html
4
Unidad
apliquemos
En la tabla se observan ocho terremotos de grado mayor a 8, lo cual indica que han causado un desastre
total. Junto a tus compañeros averigua el epicentro de tales terremotos.
a) ¿En qué intervalo de días del mes hay más terremotos?
b) ¿Cuál es el promedio de magnitudes de terremotos del siglo XX?
c) ¿Cuál es la moda entre las magnitudes de los terremotos? Interpreta el valor.
Como se puede observar en la tabla la magnitud de los sismos supera
los 7 grados en la escala de Richter. La escala de Richter es una escala
“abierta”, de modo que no hay un límite máximo teórico, salvo el
dado por la energía total acumulada en cada placa, lo que sería una
limitación de la Tierra y no de la Escala.
Magnitud y efectos visibles del terremoto
Magnitud en Escala
Richter
Efectos del terremoto
Menos de 3,5 Generalmente no se siente, pero es
registrado.
3,5 – 5,4 A menudo se siente, pero sólo causa
daños menores.
5,5 – 6,0 Ocasiona daños ligeros a edificios.
6,1 – 6,9 Puede ocasionar daños severos en áreas
muy pobladas.
7,0 – 7,9 Terremoto mayor. Causa graves daños
demográficos.
8 o mayor Gran terremoto. Destrucción total a
comunidades cercanas.
Si volvemos a analizar la información de la tabla de la página anterior
tenemos que los terremotos que se registran han causado graves
daños demográficos en nuestro país.
Si aislamos la información tenemos que existen más sismos en mayo
y diciembre. Existen menos terremotos en los meses de julio, agosto
y septiembre.
CHARLES FRANCIS
RICHTER
(1900-1985)
El gran mérito del Dr.
Charles F. Richter (del
California Institute for
Technology, 1935) consiste
en asociar la magnitud del
terremoto con la “amplitud”
de la onda sísmica,
lo que redunda en propagación
del movimiento
en un área determinada.
El análisis de esta onda
(llamada “S”) en un tiempo
de 20 segundos en un
registro sismográfico,
sirvió como referencia de
“calibración” de la escala.
Teóricamente en esta
escala pueden darse sismos
de magnitud negativa,
lo que corresponderá a
leves movimientos de baja
liberación de energía.
Fuente: http://www.angelfire.com/nt/terremotos/chilehistoria.html
220 REFUERZO DE LA UNIDAD
actividades finales
1 Las siguientes medidas corresponden a las alturas de 50 niños y niñas:
1,56 1,59 1,63 1,62 1,65
1,61 1,59 1,51 1,62 1,62
1,53 1,49 1,57 1,54 1,53
1,59 1,58 1,57 1,47 1,64
1,55 1,59 1,53 1,56 1,53
1,47 1,57 1,60 1,54 1,56
1,50 1,62 1,59 1,62 1,54
1,68 1,52 1,62 1,59 1,49
1,65 1,53 1,59 1,56 1,54
1,58 1,52 1,63 1,56 1,62
a) Construye una distribución de frecuencias absolutas y relativas.
b) Obtén las correspondientes distribuciones de frecuencias acumuladas.
c) Representa las distribuciones anteriores mediante histogramas.
d) Dibuja los correspondientes polígonos de frecuencias.
e) Encuentra, a partir del polígono de frecuencias acumuladas, la proporción de observaciones entre
1,57 y 1,66 ambas inclusive.
f ) ¿Qué conclusiones puedes obtener de lo anterior?
2 En una ciudad existen 3 grandes plantas de fabricación de automóviles que llamaremos A, B y C. La primera
emplea a 542 personas y su salario medio es de 1 500 euros. En la segunda trabajan 843 empleados
y su ingreso medio es de 1 200 euros. Finalmente, la paga media de los 1 538 trabajadores de C es de
1 000 euros. ¿Cuál es el salario medio de los empleados en la industria del automóvil de dicha ciudad?
3 Analiza el siguiente comentario: “La mejor medida de tendencia central es la media aritmética, por eso
la utilizaremos siempre salvo que no se conozcan los valores extremos de la variable”.
4 La siguiente tabla de frecuencia resume los datos de las precipitaciones, anuales en m3 , de agua lluvia caída,
por año, en los primeros cincuenta años del siglo pasado (1901-1950) sobre la ciudad de Valparaíso.
a) Completa la siguiente tabla:
Precipitación m3 Marca de
clase
Número de
años
Porcentaje de
años
Número acumulado
de años
Porcentaje acumulado
de años
67.75 – 6
-460.95 48
84
45
1
Total
b) Determina la media, moda y mediana de las precipitaciones.
Unidad 4
5 Un grupo de 80 estudiantes tiene 35 hombres.
En un test, el puntaje medio de las mujeres fue
de 70 puntos y del grupo completo fue 66,5
puntos.
a) Determina el puntaje medio de los hombres.
b) Si se cambia la escala de puntajes mediante
la transformación Yi = 2Xi − 5 (Xi: puntaje
antiguo, Yi puntaje nuevo), determina el
nuevo puntaje medio de hombres, mujeres
y el grupo completo.
c) Comprueba que si se aplica la transformación
al puntaje medio del grupo total
(66,5) se obtiene el mismo resultado que si
se calcula el puntaje medio del grupo total
transformado, como promedio ponderado
de los puntajes transformados de hombres
y mujeres (trata de comprobar esta propiedad
en forma general).
6 Se desea estudiar la composición del agua de
un lago para lo cual el lago se divide en dos
zonas: Costa y Centro del lago. El lago se cuadricula
en 2 800 cuadrículas de igual tamaño
de las cuales se escogen aleatoriamente 80 en
la zona Costa y 60 en la zona Centro. En cada
una de las cuadrículas escogidas se mide el
contenido de cierta sustancia tóxica (en ppm),
el contenido de oxígeno (en mL/100mL) y el
número de larvas de peces. Además se anota
el color y calidad de transparencia del agua en
la cuadrícula.
a) Indica cuál es la población en estudio y cuáles
y cuántos son los elementos de esta población.
b) ¿Qué tipo de muestreo se usó?
7 En un programa de mejoramiento continuo,
que se ha implementado en una empresa, se ha
diseñado un plan para controlar el proceso de
fabricación de un horno de microondas de alta
fi delidad. Desde la línea de despacho, donde
los productos egresan uno a uno, se selecciona
cada dos horas una muestra aleatoria de diez
equipos los cuales son enviados a distintas áreas
donde son califi cados, entre otras características,
el estado de las bisagras de las puertas, las dimensiones
del eje del plato de montaje al interior
del horno, el voltaje de salida, la temperatura al
interior del equipo después de dos minutos de
trabajo, la radiación emitida, tanto con la puerta
abierta como con la puerta cerrada y el color del
horno. Entonces:
a) Determina la población y la unidad estadística
correspondiente.
b) Indica el plan de muestreo utilizado. Justifi –
ca brevemente tu respuesta.
8 Abel y Rosa juegan tirando un dado. Si sale un
5 gana Abel y si sale menos de 3 gana Rosa.
Aproximadamente, ¿cuántas veces habrá ganado
cada uno, después de tirar el dado 30
veces?
9 Observa la siguiente tómbola:
a) Determina la probabilidad de sacar una bola
roja.
b) Determina la probabilidad de sacar una bola
azul.
c) Determina la probabilidad de sacar una bola
que no sea amarilla.
d) Determina la probabilidad de sacar una bola
que no sea blanca.
10 Se toma un número comprendido entre 0 y
999.
a) ¿Cuál es la probabilidad de que el número
sea múltiplo de 5?
b) ¿Cuál es la probabilidad de que la cifra central
sea mayor que las otras dos?
222 REFUERZO DE LA UNIDAD
11 Se lanza una moneda tres veces seguidas.
a) ¿Cuál es la probabilidad de obtener 2 caras?
b) ¿Cuál es la probabilidad de obtener más caras
que cruces?
12 Carmen y Daniel han inventado un juego de
dados con las siguientes reglas:
– Lanzan dos dados simultáneamente y calculan
la diferencia de puntos entre el mayor
y el menor.
– Si resulta una diferencia de 0, 1 ó 2 entonces
Carmen gana 1 fi cha.
– Si resulta 3, 4, ó 5 es Daniel quien gana una
fi cha.
– Comienzan con un total de 20 fi chas y el
juego termina cuando no quedan más.
¿Te parece que este juego es equitativo? Si tuvieras
que jugar, ¿cuál jugador preferirías ser?
¿Cuántas fi chas debería ganar cada jugador
para que el juego sea equitativo sin cambiar el
resto de las reglas?
13 Las siguientes son califi caciones de 5 cursos:
N1 N2 N3 N4 N5
45 49 67 60 67
54 54 57 62 67
40 51 70 64 65
54 55 67 66 65
68 70 70 70 67
53 62 58 60 69
64 50 65 63 70
57 51 62 62 67
46 63 65 68 65
45 38 60 55 50
55 50 56 56 57
60 62 62 55 70
52 53 65 66 67
51 60 65 59 70
49 65 65 70 62
70 62 67 68 70
70 70 50 68 70
23 61 62 64 70
61 55 62 59 70
55 38 58 63 70
60 60 70 55 70
a) Determina las medidas de tendencia central
de cada curso.
b) Haz una tabla de distribución para cada
curso, ayúdate con Excel.
c) Determina los polígonos de frecuencia de
cada curso.
d) Haz los gráfi cos de caja de cada curso.
e) ¿En qué curso hay mayor variabilidad y dispersión?
f) ¿En qué curso hay mayor homogeneidad
en las califi caciones?
g) Si se extrae un alumno del curso N1, ¿cuál
es la probabilidad que el alumno que se extraiga
tenga una califi cación entre 4 y 5?
14 Se selecciona una carta al azar entre 50 cartas
enumeradas (1 al 50)
a) Encuentra la probabilidad de que el número
de la carta sea divisible por 5.
b) Encuentra la probabilidad de que el número
de la carta sea un número primo.
c) Encuentra la probabilidad de que el número
de la carta termine en 2.
d) Encuentra la probabilidad de que el número
de la carta sea menor que 15.
e) Encuentra la probabilidad de que el número
de la carta sea el 50.
15 De los 10 niños de una clase, 3 tienen ojos azules.
Si se escoge dos niños al azar, ¿cuál es la
probabilidad de que:
a) Los 2 niños tengan los ojos azules.
b) Ninguno tenga ojos azules.
c) Por lo menos 1 tenga ojos azules.
16 De un total de 14 números 6 de ellos son positivos
y el resto es negativo, se eligen 4 números
al azar y se multiplican entre ellos calcula:
a) Cuál es la probabilidad de que el producto
sea un número positivo.
b) Cuál es la probabilidad de que el producto
sea un número negativo.
c) Considera el evento A: Que solo se extraen
3 números, cuál es la probabilidad de que el
producto sea un número positivo.
d) Considera el evento B: Que solo se extraen
2 números, cuál es la probabilidad de que el
producto sea un número negativo.
Datos y azar
Unidad 4
autoevaluación
1 El gráfi co muestra el tiempo que demoran los
alumnos en trasladarse de la casa a la escuela.
¿Cuántos niños se demoran más de 10 minutos?
a) 2
b) 5
c) 7
d) 8
e) 15
2 [TIMSS] El siguiente polígono de frecuencia
muestra los puntajes obtenidos en un test por
un curso. ¿Cuál es la media de puntajes del
curso?
a) 6
b) 8
c) 6,2
d) 6,9
e) 5
3 [TIMSS] En un curso hay 30 alumnos. La probabilidad
de seleccionar a un alumno del curso
y que sea menor a 13 años es de
1
5
. ¿Cuántos
estudiantes en la clase son menores a 13
años?
a) 2
b) 3
c) 4
d) 5
e) 6
4 [TIMSS] En una escuela hay entre niños y niñas
1 200 estudiantes. Se obtiene una muestra de 100
estudiantes representativa de la población. Si 45
de los alumnos de la muestra son niños. ¿Cuál
sería la cantidad total de niños en la escuela?
a) 450
b) 500
c) 540
d) 600
e) 660
5 [TIMSS] En una bolsa se ponen 11 fi chas, las
cuales tienen marcadas los números 2, 3, 5, 6,
8, 10, 11, 12, 14, 18, y 20. Si Amaru saca una
fi cha de la bolsa sin mirar. ¿Cuál es la probabilidad
que Amaru saque una fi cha con un número
que sea múltiplo de tres?

Las habilidades que se pretende desarrollar en los estudiantes, a partir de las actividades
presentes en la unidad, son la determinación y análisis de información que contienen
los gráficos presentes en una gran cantidad de recursos informativos, como los diarios,
centros de información nacional, y de instituciones, como por ejemplo, Banco Central,
Ministerio de Salud, SERNAGEOMIN, INE (Instituto Nacional de Estadística) y otros centros
de recursos estadísticos, de los cuales es posibles extraer información a través de sus informes
y de sus representaciones gráficas tales como polígonos de frecuencia, histogramas,
etc. Por lo anterior, esta Unidad se focaliza tanto en la construcción de histogramas y
polígonos de frecuencia para la representación de datos agrupados como también en la
interpretación y producción de información a partir de la representación gráfica. Además,
la unidad pretende que los alumnos construyan un pensamiento crítico de lo que se expresa
en las encuestas y/o informes que entregan los medios de información, a través del
cuestionamiento del cumplimiento de las conclusiones que se expresan, tomando para
ello las medidas de tendencia central y posición, como también la representatividad de
la muestra con la cual se concluyen dichas afirmaciones expuestas en público a través de
dichos medios. Por último, esta unidad pretende que los estudiantes identifiquen y determinen,
cuando están frente a una situación de incerteza, la probabilidad de tales hechos
a través de la probabilidad empírica o teórica, según las condiciones del problema.
En esta unidad también, hay muchas actividades con preguntas abiertas, del tipo ¿Es
cierto que…? En estos casos es preciso dar tiempo para que los estudiantes analicen las
posibilidades y en el caso en que no se llegue a resultados satisfactorios, entregar pistas
que ayuden a resolver los problemas. Las respuestas honestas del estudiante, deben ser
valoradas y encauzadas a reflexiones más profundas para fomentar la confianza personal.
Los trabajos de investigación deben ser rigurosos en la selección y organización de la información
y los argumentos deben condecirse con el pensamiento lógico.
Para fomentar la discusión en el grupo curso y desarrollar un pensamiento crítico en los
estudiantes, es importante que al revisar las diferentes actividades propuestas para los
alumnos(as), haya una confrontación de los procedimientos usados por ellos en relación a
su eficacia y pertinencia. En el caso que los estudiantes cometan errores al desarrollar una
actividad, es importante hacer preguntas que permitan al propio estudiante reflexionar
sobre su error y modificarlo, el error es parte importante del aprendizaje.
Esta unidad utiliza muchos conocimientos adquiridos por el estudiante, en su vida diaria,
por la intuición o por sus cursos anteriores. Es muy importante recoger este conocimiento
y encausarlo a los nuevos. A continuación veremos algunas actividades referidas a las
habilidades antes comentadas.
• Obtención de Información: ¿Qué dice…?
La unidad comienza refiriéndose a un hecho histórico reciente para los chilenos, como
lo es la erupción del Volcán Chaitén y sus implicancias tanto para la localidad como para
sus habitantes. Esta actividad inicial, permite encausar la discusión sobre la obtención de
información, y por ende los medios por los cuales se obtiene. Así se deja claro que el tener
y saber que información es relevante de un hecho y/o situación permite tomar decisiones
importantes.
Una de las actividades de esta unidad busca presentar a los alumnos y alumnas información a
través de histogramas de frecuencia con datos agrupados en intervalos de clase, como por ejemplo,
la frecuencia de sismos del Volcán Chaitén en dos diferentes días de julio, los cuales están
agrupados en clases de intervalos de igual magnitud. Esta actividad pretende iniciar el estudio
de los elementos relevantes a destacar en un gráfico. Por ello es importante preguntar a los
alumnos sobre la frecuencia, cantidad de sismos, etc.
Luego de que los alumnos hayan determinado los elementos que integran a un histograma, se
les presenta el nombre del gráfico que han estado observando. Es importante revelar las características
del histograma, como por ejemplo, las clases, las frecuencias de los datos, la amplitud
de cada clase, para que al definir y luego construir un histograma sean los estudiantes quienes
digan que elementos se necesitan para poder crearlo.
Luego de conversar sobre los histogramas se les presenta una serie de informaciones de periódicos,
los cuales tienen una característica común, todos tienen líneas poligonales para representar
información, con esto se da paso al desarrollo de contenidos referidos al polígono de
frecuencia.
• Acumulando.
Para enseñar la frecuencia acumulada, se presenta el ingreso bruto de las familias de los alumnos
que rinden la PSU. En esta parte se realizan preguntas del tipo: ¿cuál es el tramo donde se
encuentran la mitad de los alumnos con puntajes mayores a 700 puntos? Dejando la necesidad
a los alumnos de contar las frecuencias de los demás tramos y además dando la entrada para
la determinación de la mediana. En este tipo de actividades es muy importante dejar un tiempo
para que los alumnos discutan sobre: ¿Cómo llegar a la respuesta? Y se aventuren a dar sus
respuestas tentativas a las preguntas.
La unidad continúa mostrando gráficos de las frecuencias absolutas y acumuladas. Para luego
dar paso al polígono de frecuencia, el cual necesita de la marca de clase de cada intervalo mostrado
en la descripción de cada tramo.
Construcción de gráficos.
Para entrar en la construcción de gráficos se hace necesario que los estudiantes manejen bien
las características de los histogramas, polígonos de frecuencia y frecuencia acumulada. Con esto
claro, comienza la estructuración de la tabla de distribución de frecuencia. La tabla de distribución
de frecuencia, contempla la frecuencia absoluta y la frecuencia relativa, ambas trabajadas en años
anteriores y como contenido nuevo trabaja la frecuencia acumulada.
Primero se da a conocer los datos que se agruparán en intervalos de clases. Es importante hacer
notar que los intervalos de clases, deben ser, para mayor claridad de la presentación de la información
tanto en la tabla de distribución como para el histograma, de igual amplitud y excluyentes
dos a dos.
Para distribuir los datos existen muchas formas. Para comenzar, la determinación de la amplitud
del intervalo de clase, tiene muchas acepciones, pero en la unidad se presenta primero la cantidad
de clases con las cuales se debería particionar el grupo de datos, siendo la raíz cuadrada de la cantidad
de los datos un buen numero entero y si no la aproximación a un numero entero cercano,
la cantidad de clases que se observarán en la tabla de distribución. Luego de la determinación de
las clases, se determina la amplitud de cada una, para ello es necesario conocer el recorrido de los
datos, el cual se determina restando los datos extremos. Luego el recorrido se divide por la cantidad
de clases que se pretende tener, para obtener la amplitud de cada intervalo de clase. Luego
se determinan los extremos de cada intervalos de clase y posteriormente la frecuencia absoluta y
relativa.
En esta primera parte sólo se construye con la frecuencia acumulada, característica expuesta anteriormente
y necesariamente destacada por los alumnos.
La tabla permite la construcción inmediata del histograma. Hay que recordar que los alumnos
ya trabajaron graficando ecuaciones afines y lineales y ya han construido gráficos de frecuencia
con datos no agrupados, por lo cual la construcción del histograma debiera apoyarse en
todos los conocimientos anteriores de los alumnos, obteniendo de esta manera los siguientes
histogramas.
• Las medidas de tendencia central
La actividad que se les presenta a los alumnos esta ligada a la representatividad de los datos, es
por ello que a los alumnos se les pregunta si la media es buen valor que represente el conjunto de
calificaciones, o la moda o mejor aún, la mediana.
Es necesario que los alumnos discutan sobre si realmente la medida de tendencia central usada
es representativa de las calificaciones, y aun mejor sería si se les deja realizar el ejercicio con sus
propias calificaciones.
Cuando se muestran las calificaciones de Lautaro y se destaca el hecho que éste se esfuerza con
mayor ahínco en la ultima prueba para elevar su calificación, se esta tratando de insertar el hecho
que la media se ve afectada por los valores extremos de los datos, es por ello que el profesor de
Lautaro para no afectar la calificación final toma la calificación que se encuentra en la mitad de
las calificaciones ordenadas de menor a mayor, hecho necesario para determinar la mediana de
los datos.
3 3 4 4 7
Se debe caracterizar el hecho que los datos deben ordenarse para poder determinar la mediana.
La actividad propuesta para destacar este hecho se encuentra en las actividades de Aplicando
lo Aprendido.
Si se conoce que el salario medio mensual de 5 hermanos, es de $120 000, y la mediana
es de $100 000.
Se les pregunta por la cantidad de dinero que los 5 hermanos llevan a la casa. Esta pregunta esta
relacionada con la forma para determinar el promedio.
x x 2 5
5
120
+
=

Luego tenemos que la suma total de los dineros que los hermanos llevan a la casa es:
x1 + … + x5 = 5 i 120
Se debe dejar claro que el promedio se obtiene sumando todos los datos y luego se divide por la
cantidad de datos.
83
4 Unidad
Guía Didáctica para el Profesor Matemática 1o año Medio
En la segunda parte se informa que al hermano que recibe más dinero se le aumento el sueldo en
$10 000, esto se debe hacer notar a los alumnos, es decir, el hecho que cambio el valor extremo
mayor de los datos, lo cual deja invariante a la media de los datos, ya que esta no ve afectada por
tal hecho.
• ¿Se cumple para toda la población?
En esta parte de la unidad se estudia la representatividad de las muestras. La representatividad
se presenta criticando las conclusiones que muchos estudios han realizado, por ejemplo el hecho
de que por cada 10 personas una es zurda, lo cual al experimentar el curso no se cumple. Es necesario
que los alumnos realicen este proceso para que vean que la conclusión del estudio no es
100% acertado. También se trabaja con el hecho de los equipos de fútbol y su adhesión como
fanático, hay que recalcar el hecho que siempre se escucha que “Colo Colo es Chile”, refiriéndose
al hecho que todos los chilenos son fanáticos de ese equipo. Una pequeña contra-respuesta a esta
afirmación sería preguntarle al curso sobre la adhesión a determinados equipos de fútbol, lo cual
dejara claro que no es posible y que los resultados de tales estudios están sesgados por que no se
les preguntó a toda la población.
Existen siempre estudios relacionados con la adhesión y aprobación de los chilenos a las tareas
realizadas por el gobierno de turno, los cuales también pueden mostrar afirmaciones sesgadas.
Además, se puede incluir el hecho de que los políticos no le creen a las encuestas y preguntar el
porqué.
Luego de discutir sobre la representatividad de las afirmaciones y conclusiones de los estudios,
sería interesante que les planteara a los alumnos cómo se debería realizar un estudio para que
las afirmaciones representen a la población. Destacando las dificultades que a veces representa el
realizar un estudio a toda la población, tanto por hechos de recursos, como geográficos. Hay que
destacar la ventaja que nos da la conectividad entre las personas y los medios que los ofrecen,
como por ejemplo la Internet, teléfono, etc. Con lo anterior se podría destacar los elementos que
se necesitan para que un estudio sea representativo de toda la población, surgiendo la necesidad
de realizar muestreos, determinar errores y determinar el tamaño de la muestra.
El primero de los hechos marcados se plantea en la unidad, es decir las diferentes formas de realizar
un muestreo, destacando a los tipos de muestreo pertenecientes al grupo de los aleatorios.
84
DATOS Y AZAR 4 Unidad
Es importante realizar ejemplos por cada uno de los tipos de muestreo que se muestran, aparte de
los que se muestran en la unidad. Además se debe rescatar el hecho que ellos mismos son parte
de una muestra de estudiantes de un liceo o colegio.
Uno de los temas a destacar es la determinación de las proporciones de la población y la mantención
de esta proporción en la muestra, como por ejemplo si el 60% de los alumnos del colegio son
hombres, entonces la muestra debiera tener el 60% de alumnos que los compone de hombres.
Este se pregunta en la autoevaluación.
Con lo anterior, se plantean actividades donde se les presenta qué se quiere estudiar y ellos deben
determinar el tipo de muestreo que debieran realizar. Como por ejemplo el problema 6 de las
actividades finales.
6. Se desea estudiar la composición del agua de un lago para lo cual se divide en dos zonas:
costa y centro del lago. El lago se cuadricula en 2 800 cuadrículas de igual tamaño de las
cuales se escogen aleatoriamente 80 en la zona Costa y 60 en zona Centro. En cada una
de las cuadrículas escogidas se mide el contenido de cierta sustancia tóxica (en ppm), el
contenido de oxígeno (en mL/100mL) y el número de larvas de peces. Además se anota
el color y calidad de transparencia del agua en la cuadrícula.
a) Indique cuál es la población en estudio y cuáles y cuántos son los elementos de esta
población.
b) ¿Qué tipo de muestreo se usó?
85
4 Unidad
Guía Didáctica para el Profesor Matemática 1o año Medio
Aquí se puede observar la característica del estudio y las medidas que se tomaron para tomar la
muestra, por lo cual los alumnos deben determinar a que tipo de muestra representa. Es importante
hacer notar que no necesariamente debe pertenecer a un solo tipo de muestreo, pueden
coexistir dos tipos de muestreo o hasta tres, lo cual sucede en el problema.
La determinación del error y el tamaño de la muestra es un hecho que en este año no se puede
estudiar en profundidad, porque se necesita de la desviación estándar y de la variación de los datos,
elementos pertenecientes a segundo año medio. Sin embargo, el error muestral se muestra
realizando una analogía entre el lanzamiento de un dardo y la confiabilidad y validez de la dispersión
de los aciertos en la tabla de blanco.
Validez
Menor Mayor
Confiabilidad
Menor
Caso A Caso B
Mayor
Caso C Caso D
Podemos apreciar que en el caso A los impactos están dispersos (baja confiabilidad)
y alejados de la diana (baja validez). En el caso B los impactos siguen
dispersos (baja confiabilidad) pero ahora circundan la diana (alta validez).
En el caso C los impactos están concentrados (alta confiabilidad) pero alejados
de la diana (baja validez). Y finalmente en el caso D los impactos se presentan
concentrados en torno a la diana (alta confiabilidad y alta validez).
Con esto se debe dejar claro que una buena muestra y con menor grado de error, es decir variación
entre el estadístico que se obtiene de la muestra y el parámetro (estadístico de la población),
es cuando se produce menor variación, es decir los datos están menos dispersos dentro de la
muestra, lo cual al observar la imagen se puede clarificar. Es necesario realizar las preguntas adecuadas
a los alumnos sobre la validez y confiabilidad de los datos y por ello es tan necesario el
trabajo con la analogía.
El tamaño de la muestra se encuentra sujeto a muchas condiciones, como por ejemplo económicas
y geográficas, por decir algunas. Sin embargo, los contenidos de la unidad no permiten
ahondar más en ello.
86
DATOS Y AZAR 4 Unidad
• ¿Cuál es la probabilidad de la frecuencia?
En parte de la unidad se trabaja con un simulador que tiene un sitio Web:
http://www.xtec.cat/~jlagares/matematiques/probabilitat/daus/DausCastellano.html
El cual muestra el siguiente cuadro de diálogo:
Este simulador muestra la cantidad de veces que se lanzará el dado, muestra una tabla de distribución
de los datos obtenidos al realizar el experimento, además tiene un histograma y un polígono
de frecuencia que muestra a donde tiende la frecuencia relativa del suceso de salir cuatro,
lo cual da paso para mencionar la ley de los grandes números. Hay que destacar el hecho que
si lanzáramos infinitivas veces la frecuencia relativa se acerca a la probabilidad de que el suceso
ocurra. El simulador tiene una frecuencia de lanzamiento de hasta 600 000 tiradas de dado. Hay
que destacar que la tabla de distribución permite observar la frecuencia relativa porcentual, donde
se puede observar que todos tienen el mismo porcentaje y por ende, la misma probabilidad
de salir.
La probabilidad empírica y la probabilidad teórica o clásica se deben diferenciar muy bien, es por
ello que la principal característica que se les debe hacer notar a los alumnos es que la probabilidad
empírica viene de la frecuencia de un suceso, por ejemplo el problema.
En Antofagasta, antes de las elecciones municipales, se aplicó una encuesta a 5 000 personas y se
obtuvo que 1 150 piensan votar en blanco. Si votan 28 589 electores, ¿cuántos votos en blanco
se podrían esperar en esa elección?
Se puede clarificar que la frecuencia relativa de las personas que piensan votar en blanco es de
1 150/5 000, es decir, el 23% de los encuestados votaría en blanco. Lo anterior permite determinar
cuantas personas de las 28 589 electores votaran en blanco, ya que debiera mantenerse la
misma frecuencia relativa, lo cual se debe gracias a la ley de los grandes números.
87
4 Unidad
Guía Didáctica para el Profesor Matemática 1o año Medio
ERRORES FRECUENTES
• Contar la frecuencia de los extremos de los intervalos semi-cerrados.
Los alumnos al determinar los extremos de los intervalos de clase, muchas veces trabajan con intervalos
semi-cerrados, es decir con un extremo abierto sin notar que al estar abierto un extremo
del intervalo, este actúa como límite pero no se cuenta al tomar las frecuencias de los datos, es
por ello que a veces los alumnos pueden contar dos veces el mismo dato y colocarlos en diferentes
intervalos como por ejemplo:
Clase Intervalo de clase Frecuencia Frec. Acum.
1 [0,25-1,65] 17 17
2 ]1,65-3,05] 11 28
3 ]3,05-4,45] 7 35
4 ]4,45-5,85] 7 42
5 ]5,85-7,25] 4 46
6 ]7,25-8,65] 2 48
7 ]8,65-10,05] 2 50
Donde se puede observar que los intervalos de clases son abiertos a la izquierda a excepción del
primero, ya que tiene el valor mínimo. Por ello en el segundo intervalo no se toma en cuenta el
extremo izquierdo al contar la frecuencia de los datos que tengan el valor 1,65, ya que éste está
contemplado en el primer intervalo. Nótese que la amplitud de todos los intervalos en la misma.
• Determinar la media de dos medias.
Los alumnos al presentarles el siguiente problema:
La edad media de los 175 alumnos de una escuela es de 8 años, y la de los 12 adultos
(profesores y personal) es de 40 años. ¿Cuál es la edad media de todas las personas de
esa escuela?
Tienden a determinar la media entre las dos medias es decir
8 40
2
+ = 24
Lo cual es un error gravísimo, la media entre ambos se determina tomando el total de las personas,
es decir tenemos que el promedio de las edades de los 175 alumnos es de 8 años, es decir,
x x 1 175
175
8
+ +
=

Luego el promedio de las edades de los adultos es
88
DATOS Y AZAR 4 Unidad
y y 1 12
12
40
+ +
=

Luego para determinar el promedio se debe despejar la suma de los datos, así tenemos
x1 + … + x175 = 175 i 8 y y1 + … + y12 = 12 i 40
Luego sumando y dividiendo por el total de los datos tenemos:
x x y y 1 175 1 12
187
+ + + + + 175 8 12
= + … … i i 40
187
= 10,05
De donde obtenemos que la media total sea 10,05 años.
ACTIVIDADES DE REFUERZO Y AMPLIACIÓN
1. Una municipalidad está autorizada para diseñar patentes usando las letras A, B, y C y los dígitos
con excepción del 0. Si las patentes tienen dos letras y dos números y no se puede repetir la letra
o el número, ¿cuántas patentes distintas se pueden diseñar?, ¿cuál es la probabilidad de tener
una patente con las letras A, C?
2. Lanzar una moneda y un dado. ¿Cuál es la probabilidad de obtener “sello” o “cuatro”?
3. Al lanzar simultáneamente dos monedas, ¿cuál es la probabilidad de obtener cara en por lo menos
una de ellas?
4. Se organiza un sorteo en el que participan los número del 1 al 40. Gana quien tenga un número
múltiplo de 4 o un múltiplo de 6, ¿cuál es la probabilidad de ganar?
5. Al lanzar una moneda y un dado, ¿Cuál es la probabilidad de obtener sello y 3?
6. Según la información disponible, un cierto tipo de enfermo sometido a un trasplante tiene un
2% de probabilidad de sufrir una grave complicación por la anestesia; la probabilidad de que se
produzcan complicaciones durante la operación es de un 9%; después de la operación, la probabilidad
de complicación es de un 15%.
Determina la probabilidad que un paciente sometido a trasplante, de acuerdo a esta información,
no tenga ninguna complicación.
7. En una clínica médica se ha organizado un archivo de los pacientes por sexo y por tipo de hepatitis.
Son 45 varones de los cuales 25 tienen hepatitis tipo A y 20, tipo B. Son 35 mujeres con
hepatitis tipo A y 20 con hepatitis B.
Si se selecciona una de las fichas del archivo al azar, determinar la probabilidad se sacar:
a) Una correspondiente al sexo femenino.
b) Una correspondiente a un caso de hepatitis tipo B.
c) Una correspondiente al sexo masculino y con hepatitis tipo A.
Fuente: http://www.sectormatematica.cl/
89
4 Unidad
Guía Didáctica para el Profesor Matemática 1o año Medio
ACTIVIDADES DE CIERRE DE UNIDAD
Las actividades del texto del estudiante están diseñadas para que el estudiante modele, resuelva
problemas, calcule y aplique los conceptos e ideas descubiertos en esta unidad. Las preguntas que
presentamos a continuación pretenden reconocer si se logró un conocimiento profundo de los
tópicos estudiados en esta unidad.
• Las siguientes medidas corresponden a las alturas de 50 niños y niñas.
1,56 1,59 1,63 1,62 1,65
1,61 1,59 1,51 1,62 1,62
1,53 1,49 1,57 1,54 1,53
1,59 1,58 1,57 1,47 1,64
1,55 1,59 1,53 1,56 1,53
1,47 1,57 1,60 1,54 1,56
1,50 1,62 1,59 1,62 1,54
1,68 1,52 1,62 1,59 1,49
1,65 1,53 1,59 1,56 1,54
1,58 1,52 1,63 1,56 1,62
a) Construir una distribución de frecuencias absolutas y relativas.
b) Obtener las correspondientes distribuciones de frecuencias acumuladas.
c) Representar las distribuciones anteriores mediante histogramas.
d) Dibujar los correspondientes polígonos de frecuencias.
e) Hallar, a partir del polígono de frecuencias acumuladas, la proporción de observaciones entre
1,58 y 1,66 ambas inclusive.
f) ¿Qué conclusiones puedes obtener de lo anterior?
– En una ciudad existen 3 grandes plantas de fabricación de automóviles que llamaremos A, B y C.
La primera emplea a 542 personas y su salario medio es de 1 500 euros. En la segunda trabajan
843 empleados y su ingreso medio es de 1 200 euros. Finalmente, la paga media de los 1 538
trabajadores de C es de 1 000 euros. ¿Cuál es el salario medio de los empleados en la industria
del automóvil de dicha ciudad? ¿A cuánto equivale en pesos chilenos?
– Abel y Rosa juegan tirando un dado. Si sale un 5 gana Abel y si sale menos de 3 gana Rosa.
¿Cuántas veces habrá ganado cada uno, aproximadamente, después de tirar el dado 60 veces?
– Se toma un número comprendido entre 0 y 999
a) ¿Cuál es la probabilidad de que el número sea múltiplo de 5?
b) ¿Cuál es la probabilidad de que la cifra central sea mayor que las otras dos?