lunes, 26 de octubre de 2009

FRECUENCIA ESTADISTICA

Frecuencia estadística
Se llama frecuencia a la cantidad de veces que se repite un determinado valor de la variable.
Se suelen representar con histogramas y con diagramas de Pareto.
Tipos de frecuencia


ig.1 Ejemplo: variables de A en una muestra estadística de un conjunto B de tamaño 50 (N)
En estadística se pueden distinguir hasta cuatro tipos de frecuencias (véase fig.1), estas son:
• Frecuencia absoluta (ni) de una variable estadística Xi, es el número de veces que aparece en el estudio este valor . A mayor tamaño de la muestra, aumentará el tamaño de la frecuencia absoluta; es decir, la suma total de todas las frecuencias absolutas debe dar el total de la muestra estudiada (N).
• Frecuencia relativa (fi), es el cociente entre la frecuencia absoluta y el tamaño de la muestra (N). Es decir,

siendo el fi para todo el conjunto i. Se presenta en una tabla o nube de puntos en una distribución de frecuencias (ver fig.1 y (fig.2).
Si multiplicamos la frecuencia relativa por 100 obtendremos el porcentaje o tanto por ciento (pi) que presentan esta característica respecto al total de N, es decir el 100% del conjunto.
• Frecuencia absoluta acumulada (Ni), es el número de veces ni en la muestra N con un valor igual o menor al de la variable. La última frecuencia absoluta acumulada deberá ser igual a N.


• Frecuencia relativa acumulada (Fi), es el cociente entre la frecuencia absoluta acumulada y el número total de datos, N. Es decir,

Con la frecuencia relativa acumulada por 100 se obtiene el porcentaje acumulado (Pi)), que al igual que Fi deberá de resultar al final el 100% de N.

ORDENACIÓN DE DATOS
• CARACTERES CUALITATIVOS
Consideremos una muestra de tamaño N sacada de una población estadística de la que observamos un carácter cualitativo A que presenta las modalidades siguientes : a1, a2, a3, ..., ak , llamamos
FRECUENCIA ABSOLUTA ni de la modalidad ai al número de veces que aparece repetida dicha modalidad en el conjunto de las observaciones realizadas.

FRECUENCIA RELATIVA fi de la modalidad ai al cociente entre la frecuencia absoluta y el número de datos (= tamaño de la muestra N).


Los datos de las observaciones se pueden recoger en la siguiente tabla de distribución :

• CARACTERES CUANTITATIVOS
Consideramos una variable estadística X que, en una muestra de tamaño N extraída de una población estadística, toma los valores x1 < x2 < x3 < ... < xk , definimos los siguientes conceptos :
Tamaño de la muestra N Llamamos tamaño muestral al número de observaciones realizadas, es decir, al número total de datos.

Frecuencia Absoluta ni Llamamos frecuencia absoluta de un valor xi de la variable estadística X al número de veces que aparece repetido dicho valor en el conjunto de las observaciones realizadas.

Frecuencia Absoluta Acumulada Ni Llamamos frecuencia absoluta acumulada en el valor xi a la suma de las frecuencias absolutas de los valores inferiores o iguales a él.
Evidentemente, los valores xi han de estar ordenados de forma creciente, como ya se ha indicado, y la frecuencia absoluta acumulada del último valor será igual a N.

Frecuencia Relativa fi Llamamos frecuencia relativa de un valor xi de la variable estadística X al cociente entre la frecuencia absoluta y el número de observaciones realizadas.
;
Frecuencia Relativa Acumulada Fi Llamamos frecuencia relativa acumulada en el punto xi al cociente entre la frecuencia absoluta acumulada y el número de observaciones realizadas.
;
En las observaciones realizadas en una muestra o población, puede ocurrir :
1. Que la variable estadística tome pocos valores diferentes (ya sea grande o pequeño el tamaño de la muestra).
2. Que, en una muestra de gran tamaño, la variable estadística tome muchos valores diferentes, ya se trate de variable estadística discreta como de variable estadística continua (este último caso es el más habitual).
En el primer caso no es necesario agrupar los datos, y la tabla de distribución presenta el siguiente aspecto (ordenando los datos de menor a mayor) :
En el segundo caso por tratarse de variable continua o discreta pero con un número de datos muy grande, es aconsejable AGRUPAR LOS DATOS EN CLASES.
• Agrupamos los valores de la variable estadística en intervalos de clase contiguos y elegidos convenientemente para no perder mucha información. No existe un criterio claro de cuál debe ser el número de intervalos que debemos escoger, Norcliffe establece que el número de clases debe ser, aproximadamente igual a la raíz cuadrada positiva del número de datos. Normalmente, el número de intervalos de clase se suele fijar entre 5 y 15 y de tal manera que en cada clase se tengan, al menos, 5 observaciones. De todas formas el investigador los acomodará a las condiciones especificas del problema estadístico objeto de estudio (se tomarán tantos intervalos solapados como sean necesarios para recubrir todo el recorrido de la variable).
• Los extremos de los intervalos de clase se denominan extremos de clase y sus puntos medios marcas de clase (valor que nos representa la información que contiene un intervalo).
• Como cada observación debe quedar perfectamente encasillada en uno y sólo un intervalo de clase, debemos decidir a qué intervalos pertenecen los extremos de las clases, por lo que habrán de tomarse intervalos semiabiertos o tomando el extremo de cada clase con un decimal más que las observaciones. Con el fin de que la clasificación esté bien hecha, los intervalos se deben construir de manera que el límite superior de una clase coincida con el límite inferior de la siguiente, y además, adoptando el criterio de que los intervalos sean cerrados por la izquierda y abiertos por la derecha.
• Por otro lado tenemos la amplitud de cada intervalo, que puede ser constante o variable. Si procuramos que todas las clases tengan la misma amplitud y los límites de cada clase sean números redondos (múltiplos p. ej. de 5) conseguiremos simplificar mucho los cálculos (siempre y cuando no se pierda demasiada información con estas consideraciones).
• Debemos observar un hecho importante, se entiende que cuando hacemos una agrupación en intervalos de clase, para nosotros solamente cuenta el número de observaciones que caen dentro de cada uno de los intervalos y no la colocación en su interior, es decir, suponemos que la distribución de estos valores en el intervalo es homogénea, en esto radica la pérdida de información que supone agrupar los datos de las observaciones.
Tabla de frecuencias de una variable estadística agrupada en intervalos.


INTRODUCCION
En muchas ocasiones la información proporcionada en una tabla es tan singular o importante que se decide presentar esos resultados de forma gráfica. Cuando se decide utilizar el gráfico, este sustituye a la tabla, no la complementa. Por ello no se deben tener tantos gráficos como tablas. Como se presenta sólo uno de los dos, se acostumbra reflejar la información numérica en el gráfico para que no sea necesaria la tabla correspondiente. Incluso, un número innecesariamente grande de gráficos le puede restar lucidez al trabajo en lugar de proporcionarle calidad o rigor científico. Se debe lograr un balance entre estas dos formas de presentación de resultados.
El objetivo básico de un gráfico es transmitir la información de forma tal que pueda ser captada rápidamente, de un golpe de vista. Luego, un gráfico debe ser ante todo sencillo y claro, a pesar de su aspecto artístico, ya que se elabora para ser incluido en un trabajo científico.
Existen múltiples tipos de gráficos, pero aquí trataremos solamente de los usados más frecuentemente, que son: gráfico de barras simples, gráfico de sectores o circular (pastel), gráfico de barras múltiples, gráfico de barras compuestas, histograma, polígono de frecuencias, gráfico de frecuencias acumuladas y gráfico aritmético simple. También haremos una breve referencia a otros tipos de gráfico utilizados en ciertos temas del campo de la Medicina, como son los gráficos semilogarítmicos, los probabilísticos y los logísticos.
DESARROLLO
Veamos primeramente algunos principios comunes en la construcción de gráficos:
• En su gran mayoría los gráficos se inscriben en un sistema de ejes coordenados, siendo el circular o de sectores una excepción.
• En uno de los ejes se representan las frecuencias observadas o los valores calculados a partir de los datos, mientras que en el otro se representa el criterio principal de clasificación (que aparece en el talón de la tabla correspondiente).
• La escala relativa al eje donde se representan frecuencias debe comenzar en cero. De ser necesario, se puede interrumpir 'adecuadamente' la escala. Decimos adecuadamente porque la forma de realizar esa ruptura depende del tipo de gráfico.
• La longitud de un eje debe ser, aproximadamente, entre una vez y una vez y media la del otro. Esta proporcionalidad es importante, pues garantiza la comparabilidad entre gráficos.
• Cada eje debe ser rotulado, es decir, indicar que representa, y en caso de que corresponda, la unidad de medida usada.
• Un gráfico no debe sobrecargarse de líneas o cifras, el solo da la idea general del fenómeno, pues los detalles están representados en la tabla correspondiente.
2.-Componentes de un gráfico.
Un gráfico, al igual que una tabla, está compuesto de las partes siguientes:
a.- Identificación del gráfico.
b.- Título del gráfico.
c.- Cuerpo del gráfico o gráfico propiamente dicho (incluye la clave o leyenda de ser necesaria esta).
d.- Pie del gráfico.
Las características de estos componentes, salvo el gráfico propiamente dicho, son las mismas de dichos componentes en la tabla o cuadro estadístico, así que no insistiremos en ellas y pasaremos directamente a discutir la construcción de los diferentes tipos de gráficos.
Debemos hacer una aclaración antes de continuar. En la actualidad es muy infrecuente encontrar un gráfico hecho a mano. Generalmente se emplean sistemas graficadores de microcomputadoras. Esto no invalida la necesidad de conocer las reglas y convenciones establecidas con respecto a la confección de los mismos. Dada la enorme libertad que brindan algunos de esos sistemas, en más de una oportunidad hemos visto gráficos confeccionados por estos medios que presentan errores, entre otras cosas, por seleccionar un tipo de gráfico no adecuado para la información que se desea representar.
3.- Diferentes tipos de gráficos.
a) Gráfico de barras simples.
Se usa fundamentalmente para representar distribuciones de frecuencias de una variable cualitativa o cuantitativa discreta y, ocasionalmente, en la representación de series cronológicas o históricas. Uno de los ejes sirve para inscribir las frecuencias, ya sean absolutas o relativas (%), y el otro para la escala de clasificación utilizada. Un ejemplo de este tipo de gráfico es el que se presenta a continuación:
Cada clase se representa con una barra o rectángulo cuya altura (si el eje de frecuencias es el vertical) resulta proporcional a la frecuencia que representa. Todas las barras deben tener el mismo grosor y el espacio entre barras debe ser el mismo, teniendo un ancho de 0,5 a 1 vez el de las barras.
El orden de las barras en el gráfico debe ser el mismo que en la tabla que le sirve de fuente. Por ello, si no existe un criterio 'a priori' de orden entre las clases establecidas, pueden ordenarse las mismas (y, como es lógico, las barras en el gráfico) en orden ascendente o descendente de las frecuencias, para facilitar la interpretación de esos resultados.
b) Gráfico circular, de sectores o pastel.
El gráfico siguiente es un ejemplo típico de gráfico circular (confeccionado con los mismos valores del gráfico anterior):
Se usa, fundamentalmente, para representar distribuciones de frecuencias relativas (%) de una variable cualitativa o cuantitativa discreta. En este gráfico se hace corresponder la medida del ángulo de cada sector con la frecuencia correspondiente a la clase en cuestión. Si los 360º del círculo representan el 100 % de los datos clasificados, a cada 1% le corresponderán 3,6º. Luego, para obtener el tamaño del ángulo para un sector dado bastaría con multiplicar el por ciento correspondiente por 3,6º (por simple regla de tres).
Mediante un sector circular se representan las medidas angulares correspondientes a las diferentes categorías, respetando el orden establecido en la tabla, partiendo de un punto dado de la circunferencia. Ese punto dado generalmente es el punto más alto de la circunferencia (12 en el reloj). Si lo que se representa en cada sector no puede colocarse dentro del mismo, se elabora una leyenda o se coloca fuera, adyacente al mismo. Se acostumbra a diferenciar los sectores con tramas o colores diferentes, lo que hace que resulte un gráfico más vistoso que el de barras simples.
c) Gráfico de barras múltiples.
Se usa para representar las frecuencias observadas en clasificaciones dobles, es decir, cuando son dos los criterios de clasificación, para variables cualitativas o cuantitativas discretas. Su forma de construcción es similar a la del gráfico de barras simples, sólo que en este caso se representan dos variables. El hecho de ser doble, triple, cuádruple, etc., parte del número de clases que tenga la variable, que no es el criterio principal de clasificación. Las barras que integran una barra múltiple se colocan juntas o ligeramente solapadas.
Veamos un ejemplo de este tipo de gráfico:
Este es un gráfico de barras triples. En la leyenda aparece el criterio de clasificación que complementa al que aparece en el eje de categorías. Note la separación entre los “tríos” de barras.


d) Gráfico de barras compuestas.
Su objetivo es la representación de las frecuencias relativas (%) observadas en clasificaciones dobles, es decir, cuando son dos los criterios de clasificación, para variables cualitativas o cuantitativas discretas.
Su forma de construcción es la siguiente: cada barra representa el 100 % de los individuos en cada clase del criterio principal de clasificación y se divide, proporcionalmente, en los por cientos correspondientes a las clases del otro criterio de clasificación. Como es lógico, las diferentes partes en que se dividen las barras compuestas se diferencian con tramas o colores diferentes.
e) Histograma.
Este gráfico se usa para representar una distribución de frecuencias de una variable cuantitativa continua.
Habitualmente se representa la frecuencia observada en el eje Y, y en el eje X la variable. La escala del eje correspondiente a la variable se rotula con los límites inferiores de notación de las clases consideradas y se agrega al final el que le correspondería a una clase subsiguiente inexistente. En este caso, las frecuencias deben resultar proporcionales no a la altura de las barras, sino al área de las mismas, lo que significa que la obtención de las alturas de las barras resulta un poco más compleja que en los gráficos anteriores. Además, las barras van contiguas y no separadas, por la naturaleza continua de la variable de clasificación.
Para lograr la proporcionalidad entre la frecuencia y el área de la barra que esta representa el procedimiento es el siguiente: sabemos que el área de un rectángulo es el producto de la base por la altura y que la base de una barra en el gráfico es, precisamente, la amplitud del intervalo de clase, luego la formulación de esa 'proporcionalidad' sería: frecuencia observada = amplitud del intervalo* altura de la barra.
Conocemos la frecuencia observada y la amplitud de cada uno de los intervalos, por tanto, para calcular las alturas de las barras sólo se tendría que despejar en la fórmula correspondiente, lo que quedaría: altura de la barra = frecuencia observada / amplitud del intervalo.
Debido a la forma de obtención de esas alturas, el eje de las frecuencias debe rotularse como número de individuos por unidad de medida de la variable en cuestión, por ejemplo: 'defunciones por año de edad'; 'número de individuos por kg de peso; etc.

El procedimiento que hemos explicado es el general, pero sucede, en el caso particular de que las amplitudes de todos los intervalos de clase sean iguales, que no es estrictamente necesario realizar estos cálculos: sería dividir todas las frecuencias por una constante y eso no alteraría el gráfico, pues se mantendría la misma relación de proporcionalidad entre las frecuencias.
Veámoslo a través de un ejemplo, cuando las amplitudes de los intervalos son iguales:
En este caso se usó la frecuencia absoluta como altura de la barra. Todas las barras tienen el mismo ancho y van unidas, una a continuación de la otra, porque están representando una variable continua (edad).
Es sencillo darse cuenta de que es imposible presentar otra distribución en ese gráfico, pues unas barras podrían ocultar a otras. Es decir, este tipo de gráfico sólo es útil para presentar una distribución.
f) Polígono de frecuencias.
Se utiliza, al igual que el histograma, para representar distribuciones de frecuencias de variables cuantitativas continuas, pero como no se utilizan barras en su confección sino segmentos de recta, de ahí el nombre de polígono. Habitualmente se usa cuando se quiere mostrar en el mismo gráfico más de una distribución o una clasificación cruzada de una variable cuantitativa continua con una cualitativa o cuantitativa discreta, ya que por la forma de construcción del histograma sólo se puede representar una distribución.
Para su confección, una vez construidas y rotuladas las escalas, de manera similar a como se realiza para un histograma, los valores de alturas obtenidos se plotean sobre el punto medio o marca de clase de los intervalos correspondientes y luego se procede a unir esos puntos con segmentos de recta.
Veamos un ejemplo de polígono de frecuencias:
g) Gráfico de frecuencias acumuladas u ojiva.
Su objetivo, al igual que el histograma y el polígono de frecuencias es representar distribuciones de frecuencias de variables cuantitativas continuas, pero sólo para frecuencias acumuladas.
No se utilizan barras en su confección, sino segmentos de recta, por ello no sólo es útil para representar una distribución de frecuencias sino también cuando se quiere mostrar más de una distribución o una clasificación cruzada de una variable cuantitativa continua con una cualitativa o cuantitativa discreta. Este es un ejemplo de una ojiva:

La diferencia con el polígono de frecuencia es que la frecuencia acumulada no se plotea sobre el punto medio de la clase, sino al final de la misma, ya que representa el número de individuos acumulados hasta esa clase. Como el valor de la frecuencia acumulada es mayor a medida que avanzamos en la distribución, la poligonal que se obtiene siempre va a ser creciente y esa forma particular de la misma es la que ha hecho que se le dé también el nombre de ojiva.
h) Gráfico aritmético simple.
Este es uno de los más sencillos de confeccionar. Su uso estadístico fundamental es en la representación de series cronológicas, y en casos particulares, como el del Crecimiento y Desarrollo Humanos, para representar los valores promedio o posicionales (medias, medianas y percentiles, que se estudiarán más adelante) de muchas dimensiones: peso para la edad, peso para la talla y talla para la edad, entre otras.
Uno de los ejes (habitualmente el horizontal) se usa para la unidad de tiempo estudiada: años, días, etc.. En el otro eje se representa la frecuencia o el indicador calculado a partir de esos datos. En este tipo de gráfico es particularmente importante la relación de proporcionalidad entre los ejes para evitar malas interpretaciones del fenómeno que se presenta.
El gráfico que sigue es un ejemplo de gráfico de este tipo:
En el mismo gráfico se puede presentar más de una serie de datos si la escala usada se adecua para todas, cuando los valores de las mismas no son extremadamente diferentes.
4.- Errores más comunes en la confección de gráficos.
En la confección de un gráfico se pueden cometer dos tipos de errores: errores de forma y errores de contenido. Aquí mencionaremos los que se han observado con más frecuencia en las publicaciones científicas.
De forma:
• No uso de la identificación.
• No aparición de título o títulos extremadamente extensos.
• Títulos que no responden a las preguntas básicas.
• Gráficos muy cargados y/o sumamente complejos de interpretar.
• Desproporción notable entre las longitudes de los ejes.
• Omisión de los rótulos de los ejes y/o las unidades de medida.


De contenido:
• Uso de gráficos inadecuados dada la naturaleza de lo que se representa.
• Omisión de la leyenda donde se han usado claves o símbolos.
• No respetar alguna de las reglas establecidas para la construcción del gráfico en particular. Por ejemplo, barras unidas cuando se trabaja con variable cualitativa o discreta.
5.- Otros tipos de representación gráfica.
Existen muchos otros tipos de gráficos con propósitos más específicos que los discutidos anteriormente. Daremos una visión muy general de los mismos sin adentrarnos en las particularidades relativas a la construcción. Estos son gráficos en los que, en lugar de tener escalas aritméticas en los dos ejes de coordenadas (como es el caso del gráfico aritmético simple), uno de los ejes tiene una escala especial. Esos gráficos reciben los nombres de la escala especial, no aritmética. Por ejemplo:
• gráfico semilogarítmico (una escala logarítmica)
• gráfico probabilístico (una escala probabilística)
• gráfico logístico (una escala logística)
Veamos la forma más frecuente de uso de uno de ellos.
Semilogarítmico: En ocasiones, al representar series cronológicas para comparar, resulta que los valores de las diferentes series pueden diferir grandemente y eso hace prácticamente imposible el uso del Grafico aritmético simple, pues deben aparecer en la escala del eje Y valores que pueden estar 'muy distantes' entre sí. La solución es usar una escala logarítmica en dicho eje y así pueden colocarse todos los datos sin alterar seriamente sus comportamientos, de modo tal que las comparaciones sean válidas. Veámoslo con un ejemplo:
El eje correspondiente a las tasas es un eje logarítmico, para poder representar números de magnitudes tan diferentes al unísono.
También hay formas de presentación gráfica que no son gráficos propiamente dichos. Al menos, no de los tipos que hemos visto. Esas presentaciones pueden ser:
• Mapas con localizaciones específicas dando información sobre el tema de que se trate. Por ejemplo, dando colores o intensidades diferentes a las distintas zonas geográficas en función del grado de afectación por el fenómeno en estudio.
• Fotos.
• Esquemas.
• Organigramas, etc.
Nota complementaria: Sobre los gráficos basados en barras (barras simples, múltiples, etc) existe la prohibición de “cortar” el eje de las frecuencias (número de casos, por cientos, etc). Para el resto se autoriza el “corte” de cualesquiera de los ejes, siempre y cuando este no interrumpa el trazado. Esto nos ayuda a reducir el gráfico sólo al área del sistema de ejes coordenados entre cuyos valores se mueven los datos a graficar.
CONCLUSIONES
1-Los gráficos se reciben con agrado por parte de los editores y lectores, pero la apariencia es lo menos importante, el objetivo de la presentación gráfica es mejorar la presentación del contenido científico.
2-Si el contenido de los resultados se puede hacer de forma textual, no se recomienda la presentación gráfica, ya que eleva los costos de publicación.
3- El objetivo básico de un gráfico es transmitir la información de forma tal que pueda ser captada rápidamente, de un golpe de vista, un gráfico debe ser ante todo sencillo y claro, a pesar de su aspecto artístico, ya que se elabora para ser incluido en un trabajo científico.
BIBLIOGRAFIA
1-Huth EJ. Medical Style and Format: an International Manual for Authors, Editors, and Publishers. Philadelphia: ISI Pr; 1997.
2-CBE Style Manual Committee. CBE Style Manual. 5th ed. Bethesda, MD: Council of Biology Editors; 1993.
3-Iverson C, Dan BB, Glitman P, Jogel B, Jasson N, Bacall J, et al. American Medical Association Manual of Style. 8th ed. Baltimore: Williams & wilkins; 1999.
4-Reynolds L, Simmonds D. Presentation of Data in Science. Dordrecht: Martinus Nijhoff; 1984.
5-Scientific Illustration Committee. Illustrating Science: Standards for Publication Bethesda, Md: Council of Biology Editors; 1988.
El histograma es una gráfica de barras que permite describir el comportamiento de un conjunto de datos en cuanto a su tendencia central, forma y dispersión. El histograma permite que de un vistazo se pueda tener una idea objetiva sobre la calidad de un producto, el desempeño de un proceso o el impacto de una acción de mejora. La correcta utilización del histograma permite tomar decisiones no solo con base en la media, sino también con base en la dispersión y formas especiales de comportamiento de los datos. Su uso cotidiano facilita el entendimiento de la variabilidad y favorece la cultura de los datos y los hechos objetivos. .


CONSTRUCCION DE UN HISTOGRAMA.
Para decidir correctamente y detectar posibles anormalidades en los datos se procede a lo siguiente para construir un histograma:
• Paso 1. Determinar el rango de datos.La diferencia entre el dato máximo y el dato mínimo.
• Paso 2. Obtener el numero de clases (NC) o barras.Ninguno de ellos es exacto, esto depende de cómo sean los datos y cuantos sean . Un criterio usado es del numero de clases, debe ser aprox. Igual a la raíz cuadrada del numero de datos.
• Paso3. Establecer la longitud de clase (LC).Se establece de tal manera que el rango pueda ser cubierto en su totalidad por NC. Una forma directa de obtener la LC es dividiendo el rango entre el numero de clases, LC= R/NC.
• Paso 4. Construir los intervalos de clase. Resultan de dividir el rango (original o ampliado) en NC e intervalos de longitud LC.
• Paso 5. Obtener la frecuencia de cada clase. Se cuentan los datos que caen en cada intervalo de clase.
• Paso 6.Graficar el histograma.
Se grafican en barras, en las que su base es el intervalo de clase y la altura sean las frecuencias de las clases.

lunes, 19 de octubre de 2009

Ejercicios


1. Si una prueba se compone de 12 preguntas de verdadero-falso, a. ¿de cuantas maneras diferentes un estudiante puede dar una respuesta para cada pregunta?, b. Sí de antemano el maestro le dice que la primera pregunta es verdadera, ¿cuántas maneras tiene de contestar esta prueba?.
a. r=4,096 maneras b. r=2,048 maneras

2. Un fabricante tiene dificultades para obtener registros consistentes de resistencias a la tensión entre tres máquinas localizadas en la planta de producción, el laboratorio de investigación y el laboratorio de control de calidad , respectivamente, al mismo tiempo hay cuatro posibles técnicos –Tomás, Enrique, Rafael y Javier- quienes operan al menos una de las máquinas a prueba regularmente, a. ¿cuántos pares operador-máquina deben incluirse en un experimento planeado en el que cada operador maneje todas las máquinas?, b. Si se requiere que cada par operador-máquina pruebe ocho especimenes, ¿cuántos especimenes de prueba se necesitan para el procedimiento íntegro? Nota: un espécimen se destruye cuando se mide su resistencia a la tensión.
a) 3 maquinas * 4 técnicos = a 12 pares operador - maquina
b) 12 pares operador- maquina* 8 especímenes cada uno = a 96 especímenes
3. Un inspector de construcciones tiene que revisar el cableado de un nuevo de departamentos, ya sea el lunes, el martes, miércoles o jueves, a las 8 A. M., a las 10 A. M. o a las 2 P. M. , a. ¿cuántas maneras tiene este inspector de hacer las revisiones del cableado?, b. Obtenga las maneras en que el inspector puede realizar las revisiones del cableado, haciendo uso ahora de un diagrama de árbol.
a) cuatro posibles días * tres posibles horas distintas = 12 maneras diferentes
b)


7.Un edificio comercial tiene dos entradas, numeradas con I y II. Entran tres personas al edificio a la 9:00 a.m. Sea x el número de personas que escogen la entrada I, si se supone que la gente escoge las entradas en forma independiente, determinar a)la distribución de probabilidades de x, b) el número esperado de personas que que escogen la entrada I.
Respuesta:
a) b) 1.5  2 personas
x 0 1 2 3
p(x) 1/8 3/8 3/8 1/8

8.Se observó que el 40% de los vehículos que cruzan determinado puente de cuota, son camiones comerciales. Cuatro vehículos van a cruzar el puente en el siguiente minuto. Determinar la distribución de probabilidad de x, el número de camiones comerciales entre los cuatro, sí los tipos de vehículos son independientes entre sí.
Respuesta:
X 0 1 2 3 4
p(x) 0.1296 0.3456 0.3456 0.1536 0.0256
9.Entre 10 solicitantes para un puesto 6 son mujeres y 4 son hombres. Supóngase que se seleccionan al azar 3 candidatos de entre todos ellos para concederles las entrevistas finales. Determinar; a)la función de probabilidad para x, el número de candidatas mujeres entre los 3 finalistas, b)el número esperado de candidatas mujeres entre los finalistas.
Respuesta:
a) b) 1.8  2 mujeres
X 0 1 2 3
p(x) 1/30 9/30 15/30 5/30



4. Si los cinco finalistas de un torneo internacional de golf son España, Estados Unidos, Portugal, Uruguay y Japón, a. Diga de cuantas maneras es posible que se otorgue un primero, segundo lugar y tercer lugar, b. Considerando que el primer lugar lo gana Portugal y el segundo lo gana Estados Unidos, ¿cuantas maneras hay de que se otorguen los lugares antes mencionados?. a. r=60 maneras, b. r=3 maneras



5. Una computadora de propósito especial contiene tres conmutadores, cada uno de los cuáles puede instalarse de tres maneras diferentes. ¿De cuantas maneras diferentes puede instalarse el banco de conmutadores de la computadora? r= 27 maneras



6. ¿De cuantas maneras ordenadas puede programar un director de televisión seis comerciales en los seis intermedios para comerciales durante la transmisión televisiva del primer tiempo de un partido de hockey?, si, a. los comerciales son todos diferentes, b. dos de los comerciales son iguales, c. Si hay cuatro comerciales diferentes, uno de los cuales debe aparecer tres veces, mientras que cada uno de los otros debe aparecer una sola vez. a. r=720 maneras b. r=360 maneras c. r=120 maneras



7. Determine el número de maneras en las que un fabricante puede seleccionar dos de las quince ubicaciones para un almacén. r=105 maneras



8. Una caja de 12 baterías recargables, contiene una defectuosa, ¿de cuantas maneras un inspector puede seleccionar tres de las baterías y, a. obtener la defectuosa, b. no obtener la defectuosa. a. r=55 maneras, b. r=165 maneras

9. El departamento de suministros tiene ocho diferentes motores eléctricos y cinco diferentes interruptores de arranque. ¿De cuantas maneras pueden seleccionarse dos motores y dos conmutadores para un experimento de una antena de rastreo?, r=280 maneras



10. A los participantes de una convención se les ofrecen 6 recorridos por día para visitar lugares de interés durante los tres días de duración del evento. ¿ En cuantas formas puede una persona acomodarse para hacer alguno de ellos? r=18 formas



11. Un determinado zapato se fabrica en 5 estilos diferentes y en 4 colores distintos para cada uno. Si la zapatería desea mostrar a su clientela pares de zapatos en todos los estilos y colores, ¿cuántos pares distintos deberán colocar en el aparador? r=20



12. Un estudiante de primer año debe tomar un de ciencia, uno de humanidades y otro de matemáticas. Si puede escoger entre cualquiera de 6 cursos de ciencias, 4 de humanidades y 4 de matemáticas, ¿cuántas maneras tiene de seleccionar las materias? r=96 maneras

13. Un urbanista de una nueva subdivisión ofrece a los clientes prospectos para la compra de una casa, la posibilidad de seleccionar cualquiera de 4 diseños diferentes, tres sistemas de calefacción, cochera con puertas o sin ellas, y patio o pórtico, ¿cuántos planes distintos están disponibles para el comprador? r= 48 planes



14. Si una prueba de selección múltiple consta de 5 preguntas, cada una con 4 posibles respuestas, de las cuales solo una es correcta, a. ¿en cuantas formas diferentes puede un estudiante escoger una respuesta para cada pregunta?, b. ¿en cuantas formas puede un estudiante escoger una alternativa para cada pregunta y tener todas las respuestas incorrectas? a. r= 1024 b. r=243



15. Un testigo de un accidente de tránsito en el que el causante huyó, le indica al policía que el número de matrícula del automóvil tenía las letras DUH seguidas por tres dígitos, el primero de los cuales era un cinco. Sí el testigo no puede recordar los otros dos dígitos, pero está seguro de que los tres eran diferentes, encuentre el número máximo de registros de automóvil que debe verificar la policía. r=72 registros



16. a) ¿De cuantas maneras pueden formarse 6 personas para subir a un autobús?, b.si tres de ellas insisten en seguirse una a la otra, ¿en cuantas formas es esto posible?,c.Si dos personas se rehúsan a seguirse una a la otra?

a. r=720 b. r=144 c. r=480 maneras



17. a) ¿cuántos números de tres dígitos pueden formarse con los dígitos 0, 1, 2, 3, 4, 5, y 6, si cada uno solo puede usarse solo una vez?, b) ¿cuántos de estos números son nones?, c) ¿cuántos son mayores que 330? a. r=180 b. r=75 c. r=105 números



18. ¿En cuantas formas pueden sentarse en una línea 4 niños y 5 niñas, si deben colocarse alternadamente? r=2880 formas



19. Cuatro matrimonios compraron 8 lugares para un concierto. ¿En cuantas formas diferentes pueden sentarse a. sin restricciones?, b. si se sientan por parejas?, c. si todos los hombres se sientan juntos a la izquierda de todas las mujeres?

a. r=40,320 b. r=384 c. r=576

20. ¿Cuántos menús que consisten de sopa, emparedado, postre y un refresco se puede ofrecer si se puede seleccionar entre 4 sopas diferentes, 3 clases de emparedados, 5 postres y 4 refrescos? r=240 menús



21. ¿En cuantas formas pueden llenarse las 5 posiciones iniciales de un equipo de baloncesto con 8 jugadores que pueden ocupar cualquiera de ellas? r=6720 formas

59280

22. Se sacan tres boletos de la lotería, de un grupo de 40, para el primero, segundo y tercer premios. Encuentre el número de puntos muestrales en d para otorgarlos si cada concursante conserva solo un boleto. r=59,280 puntos



23. ¿En cuantas formas pueden plantarse, a lo largo de la línea divisoria de una propiedad, 3 robles, 4 pinos y 2 arces, si no se distingue entre los árboles de la misma clase? r=1,260 formas

24. Nueve personas salen de viaje para esquiar en tres vehículos cuyas capacidades son de 2, 4 y 5 pasajeros, respectivamente. ¿En cuántas formas es posible transportar a las 9 personas hasta el albergue con todos los vehículos? r=4,410 formas



25. ¿Cuántas formas hay de seleccionar a 3 candidatos de un total de 8 recién graduados y con las mismas capacidades para ocupar vacantes en una firma contable? R=56,,21,,10 formas



26. En un estudio que realizaron en california, el decano Lester Breslow y el doctor James Enstrom de la School of Public Health de la University of California en los Angeles, se concluyó que al seguir 7 sencillas reglas de salud, la vida de un hombre puede alargarse, en promedio 11 años, y la de las mujeres siete. Estas 7 reglas son: no fumar, hacer ejercicio regularmente, tomar alcohol solo en forma moderada, dormir siete u ocho horas, conservar un peso apropiado, desayunar y no comer entre alimentos. ¿En cuantas formas puede una persona adoptar cinco de estas reglas, a. si actualmente las viola todas?, b. si nunca toma bebidas alcohólicas y siempre desayuna? a. r=21 formas b.r=10 formas



27. Un dispositivo Biomecánico para emergencias médicas puede operar 0, 1 o 2 veces por noche. Trace un diagrama de árbol para demostrar que existen 10 maneras diferentes en las que puede operar para un total de 6 veces en cuatro noches.

Unidad tematica 1

Escuela Preparatoria del estado no.3




Estadística 1




Catedrático:
Manuel Dávila Ochoa




Alumnos(as):
Aguilar Ruiz Gabriela
Méndez Ramírez Alicia
Rodríguez Martínez Raquel
Vázquez Chun Carolina
Vázquez García Beatriz





5to semestre grupo “E”
Químico Biológico, turno Matutino.






Índice


1.1 Términos básicos de estadística

1.1.2 Definición de estadística y utilidad

1.1.3 Clasificación de la estadística

1.1.4 Definición de:
- Población
- Muestra
- Variable
- Datos
- Experimentos
- Muestreo
- Parámetro estadístico
- Tipos de variables



1.2 métodos de muestreo

1.2.1 definición de muestreo, censo, poblaciones finitas e infinitas

1.2.2 métodos de muestreo: aleatorio simple, sistemático, Estratificado por conglomerados.



Investigación: Unidad temática 1
1.1Definición de estadística y su utilidad

La estadística utiliza los métodos científicos para recopilar, organizar, resumir y analizar datos, tanto para sacar conclusiones válidas y tomar decisiones razonables basadas en tal análisis.
La estadística es una ciencia con base matemática referente a la recolección, análisis e interpretación de datos, que busca explicar condiciones regulares en fenómenos de tipo casual o incierto. Es transversal a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales, desde las ciencias de la salud hasta el control de calidad, y es usada para la toma de decisiones en áreas de negocios e instituciones gubernamentales.


Hoy el uso de la estadística se ha extendido más allá de sus orígenes como un servicio al Estado o al gobierno. Personas y organizaciones usan la estadística para entender datos y tomar decisiones en ciencias naturales y sociales, medicina, negocios y otras áreas. La estadística es entendida generalmente no como un sub-área de las matemáticas sino como una ciencia diferente “aliada”.

La estadística se utiliza en ciencias tales como psicologia ,educación y salud pública.
Al aplicar la estadística a un problema científico, industrial o social, se comienza como un proceso . Esta puede ser la población de un país, de granos cristalizados en una roca o de bienes manufacturados por una fábrica en particular durante un periodo dado. Por razones prácticas, en lugar de compilar datos de una población entera, usualmente se estudia un subconjunto seleccionado de la población, llamado muestra. Datos acerca de la muestra son recogidos de manera observacional o experimental. Los datos son entonces analizados estadísticamente lo cual sigue dos propósitos: descripción e inferencia.


Un problema mayor es el de determinar que tan representativa es la muestra extraída. La estadística ofrece medidas para estimar y corregir por aleatoriedad en la muestra y en el proceso de recolección de los datos, así como métodos para diseñar experimentos

Clasificación de estadística

La estadística descriptiva, que se dedica a los métodos de recolección, descripción, visualización y resumen de datos originados a partir de los fenómenos en estudio. Los datos pueden ser resumidos numérica o gráficamente. Ejemplos básicos de parámetros estadísticos son: la media y la desviación estándar. Algunos ejemplos gráficos son: histograma, pirámide poblacional, clúster, etc.
La inferencia estadística, que se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la población bajo estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas si/no (prueba de hipótesis), estimaciones de características numéricas (estimación), pronósticos de futuras observaciones, descripciones de asociación (correlación) o modelamiento de relaciones entre variables (análisis de regresión).


1.1.4 definición de:

Población
El termino población de manera generalizada se refiere al conjunto de individuos que vive en un determinado espacio, pero de manera específica en estadística hace referencia
A el término de variable aleatoria, o magnitud numérica de naturaleza aleatoria, x, asociada a los objetos (individuos) sobre los que se desarrolla una experiencia. La repetición n veces, en idénticas condiciones, de la citada experiencia aleatoria, afectará a una muestra de n objetos u individuos de la población, y tendrá asociada una sucesión de n variables aleatorias, independientes.


Muestra
En estadística una muestra estadística (también llamada muestra aleatoria o simplemente muestra) es un subconjunto de casos o individuos de una población estadística.
Las muestras se obtienen con la intención de inferir propiedades de la totalidad de la población, para lo cual deben ser representativas de la misma. Para cumplir esta característica la inclusión de sujetos en la muestra debe seguir una técnica de muestreo. En tales casos, puede obtenerse una información similar a la de un estudio exhaustivo con mayor rapidez y menor coste (véanse las ventajas de la elección de una muestra, más abajo).
El número de elementos o sujetos que componen una población estadística es igual o mayor que el número de elementos que se obtienen de ella en una muestra (n).
Un ejemplo obvio de población y muestra surgiría al considerar una urna de bolas blancas y negras, con variabilidad de su número. Si la experiencia consistiera en extraer al azar una bola y nuestro interés se centra en el color de la bola, nuestra población, desde el punto de vista estadístico, es una variable dicotómica por que hace referencia a la existencia de 2 objetos, por ejemplo, una variable de Bernoulli, que toma dos únicos valores: x=1 si la bola extraída es blanca, x=0 si es negra. Una muestra de tamaño n, una vez extraída de la población, y observado el color de las correspondientes bolas, no será otra cosa que una secuencia de unos y ceros asegurarse reintroduciendo la bola después de cada extracción, o bien considerando que el tamaño de la muestra es pequeño respecto al "gran número" de bolas de la urna., (las idénticas condiciones a las que se habla anteriormente, pueden

Variable

Se trata de algo inestable, inconstante es decir que no tiene un valor propio, en otras palabras una variable es un símbolo que representa un elemento no identificado de un conjunto dado.


Datos
Es un documento que permite deducir una información o consecuencias de un hecho.
Ejemplo:
“hemos descubierto la probabilidad de acreditar estadística mediante testimonios que proporcionaron datos para el muestreo”
Experimento
Un experimento es un procedimiento mediante el cual se trata de comprobar (confirmar o verificar) una o varias hipótesis relacionadas con un determinado fenómeno, mediante la manipulación de la/s variables que presumiblemente son su causa.
La experimentación constituye uno de los elementos claves del método científico y es fundamental para ofrecer explicaciones causales.
Muestreo
El muestreo es una técnica usada en estadística que es indispensable en la investigación científica para seleccionar a los sujetos a los que les aplicaremos las técnicas de investigación elegidas, según el enfoque en que se trabaje (cuantitativo, cualitativo o mixto) en la mayoría de los proyectos de investigación utilizamos una muestra, y es importante reconocer aquellas definiciones que nos ayudarán a hacer un correcto proceso de muestreo, como también conocer los tipos de muestreo según la selección y el procedimiento.
Parámetro estadístico
En estadística se llama parámetro estadístico, medida estadística o parámetro poblacional a un valor representativo de una población, como la media aritmética, la proporción de individuos que presentan determinada característica, o la desviación típica.
Un parámetro es un número que resume la ingente cantidad de datos que pueden derivarse del estudio de una variable estadística. El cálculo de este número está bien definido, usualmente mediante una fórmula aritmética obtenida a partir de datos de la población.
Los parámetros estadísticos son una consecuencia inevitable del propósito esencial de la estadística: modernizar la realidad.
Tipos de variables
Una variable estadística es cada una de las características o cualidades que poseen los individuos de una población.

Variables cualitativas:
Las variables cualitativas se refieren a características o cualidades que no pueden ser medidas con números, podemos distinguir dos tipos:
- Variable cualitativa nominal: una variable cualitativa nominal presentan modalidades no numéricas que no admiten un criterio de orden
- Variable cualitativa ordinal o variable cuasi cuantitativa: una variable cualitativa ordinal presenta modalidades no numéricas, en las que existe un orden.
- Variable cuantitativa:
es la que se expresa mediante un número, por tanto se puede realizar operaciones aritméticas con ella, existen 2 tipos
Variable discreta:
Es aquella que toma valores aislados, es decir no admite valores intermedios entre 2 valores específicos
Variable continúa:
Es aquella que puede tomar valores comprendidos entre 2 números.



1.2 MÉTODOS DE MUESTREO

1.2.1 DEFINCION DE MUESTREO, CENSO, POBLACION FINITAS E INFINITAS


Censo
Conjunto de datos estadísticos que comprenden infinidad de asunto en un tiempo determinado. Comprende diferentes fenómenos de la vida de un país, estado, población, etc., tales como los demográficos, económicos y sociales.

Población finita
Es una población que consiste en un número fijo de individuos, objetos o medidas conocidos. Los ejemplos incluyen: el número de estudiantes en esta clase, el número de automóviles en el estacionamiento.

Población infinita
Cuando el número de elementos que la forman es infinito, o tan grande que pudiesen considerarse infinitos. Como por ejemplo si se realizase un estudio sobre los productos que hay en el mercado. Hay tantos y de tantas calidades que esta población podría considerarse infinita.


Métodos de muestreo:
Aleatoria simple
Sistemático
Estratificado
Por conglomerados

Aleatorio simple, es uno de los métodos menos complejos y más sencillos de utilizar.
Característica:
• Se selecciona una muestra de tamaño n de una población de N unidades, cada elemento tiene una probabilidad de inclusión igual y conocida de n/N.
Ventajas:
• Sencillo y de fácil comprensión.
• Cálculos rápido de medias y varianzas.
• Se basa en la teoría estadística, y por tanto existen paquetes informáticos para analizar los datos.
Sistemático, es otro de los métodos más simples, pero en esta ocasión este método no es necesaria una encuesta elaborada pues muy simple de aplicar en la práctica.
Características:
• Conseguir un listado de los N elementos de la población.
• Determinar tamaño muestral n.
• Definir un intervalo k=N/n.
• Elegir un número aleatorio, r, entre 1 y k (r=arranque aleatorio).
• Seleccionar los elementos de la lista.

Ventajas:
• Fácil de aplicar.
• No siempre es necesario tener un listado de toda la población.
• Cuando la población está ordenada siguiendo una tendencia conocida, asegura una cobertura de unidades de todos los tipos.
Estratificado, es un método en el cual se necesita tener una exactitud de alguna investigación.

Características:
• En ciertas ocasiones resultará conveniente estratificar la muestra según ciertas variables de interés. Para ello debemos conocer la composición estratificada de la población objetivo a muestrear. Una vez calculado el tamaño muestral apropiado, este se reparte de manera proporcional entre los distintos estratos definidos en la población usando una simple regla de tres.

Ventajas:
• Tiende a asegurar que la muestra represente adecuadamente a la población en función de unas variables seleccionadas.
• Se obtienen estimaciones más precisa
• Su objetivo es conseguir una muestra lo mas semejante posible a la población en lo que a la o las variables estratificadoras se refiere.
Conglomerados, este método se distribuye en grupos para llegar a un solo resultado.
Características:
• Se realizan varias fases de muestreo sucesivas (polietápico)
• La necesidad de listados de las unidades de una etapa se limita a aquellas unidades de muestreo seleccionadas en la etapa anterior.
Ventajas:
• Es muy eficiente cuando la población es muy grande y dispersa.
• No es preciso tener un listado de toda la población, sólo de las unidades primarias de muestreo.



















Direcciones y bibliografía:


Http://e-stadistica.bio.ucm.es/glosario/def_poblacion.html



- Estadística Descriptiva, José María Montero Lorenzo.



http://www.vitutor.com/estadistica/descriptiva.html


- Estadistica, Taro Yamane, editorial HARSA.


http://www.itch.edu.mx/academic/industrial/estadistica1/cap01c.html



- Estadística poblacional, Edit. Alfaguara