miércoles, 4 de febrero de 2009

Los principales criterios para calcular una muestra

El error estándar y el intervalo de confianza

Si por ejemplo un investigador conoce ya el tamaño de una muestra y conoce la población restringida y también conoce las proporciones de esa población para opinar sobre algo, entonces puede calcular el error estándar y conocer luego el intervalo de confianza en que esas proporciones de preferencias quedarían en unos determinados límites.

Supongamos que se toma una muestra de 263 empresarios en un Municipio que tiene 1.551 empresas registradas en la Administración de Rentas Municipales para octubre del año 2.006, con el fin de conocer las opiniones de sus directores ejecutivos acerca de su capacidad competitiva y que era ya conocido de una encuesta preliminar que el 0,125 (12,5%) corresponde a la proporción de empresarios que señalan problemas de competencia en sus empresas y que el 0,875 (87,5%) es la proporción de los empresarios que no señalan esos problemas. Lo que se desea ahora es conocer, con un intervalo de confianza de 95%, la proporción de empresarios que están opinando en relación a la elevada competitividad de sus empresas.

En este planteamiento del problema tenemos:

N = 1.551
n = 263
p = 0,125
q = 0,875

Y además el intervalo de confianza o probabilidad del 95% que está definido por una unidad “z” que acompaña al error estándar igual a 1,96. Si el intervalo de confianza hubiese sido del 90% , entonces el valor “z” sería 1,64 y si el nivel de confianza hubiese sido del 99%, el valor “z” sería 2,57.

El cálculo del error estándar, en este caso, se debe hacer con la fórmula que incorpora el “factor de corrección” porque el tamaño de la muestra de 263 es mayor del 10% de la población restringida de 1.551 ( es 17% ). Entonces:

e = Raíz de 0,125 x 0,875 / 263 x Raíz 1.551 – 263 / 1551 – 1
e = Raíz de 0,00042 / Raíz de 0,831
e = 0,020 / 0,91
e = 0,02 (2%)

Así el intervalo de confianza con un nivel de 95%, es:

a) 0,875 más o menos 1,96 x 0,02
b) 0,875 más o menos 0,039

Según este resultado podemos decir que, con un intervalo de confianza del 95%, el valor de la proporción de empresarios que opinan tener una elevada competitividad queda entre los límites de : 0,875 + 0,039 = 0,914 (91%) y 0,875 – 0,039 =0,836 (84%).

Tamaño de la muestra aleatoria simple y el error estándar

¿Cuál debe ser el tamaño de la muestra aleatoria simple con un intervalo de significación del 95% ( z = 1,96) y admitiendo un error del 4% ? Si el punto de partida para estimar ese tamaño fuese la fórmula del error estándar de una proporción, se despejaría “n” pues se relaciona con todos los demás datos de que se dispone y es la única incógnita.

Para simplificar el cálculo del tamaño con este método vamos a usar la fórmula del error estándar de una proporción pero sin el factor de corrección y para una población finita como ya se ha dicho, pero admitiendo un error del 4% , o sea:

e = 1,96 x Raíz de p x q / n = 0,04

e = 1,96 x Raíz de 0,125 x 0,875 / n = 0,04

Recordemos que 0,125 ( p =12,5 % ) son empresarios que opinan tener baja competitividad y que 0,875 ( q =87,5% ) son empresarios que opinaban tener alta competitividad. Si esas proporciones no se hubiesen conocido se puede utilizar en la fórmula 0,50 y 0,50 y entonces el tamaño de muestra que resultará será mayor.

Siguiendo con el cálculo anterior porque se conocen las proporciones de “p” y de “q” , entonces :

e = 1,96 x Raíz 0,125 x 0,875 / n = 0,04

Observemos que el error estándar con nivel de confianza del 95% corresponde al valor z = 1,96 y que la precisión que espera el investigador es de 0,04 (4% ). En la fórmula anterior la única incógnita es “ n” o sea el tamaño de la muestra, que la calculamos despejando esa “n” de la fórmula y de esta manera :

( 1,96 x ( 0,125 x 0,875 ) / n = 0,04 ) todo al cuadrado

n = 1,96 al cuadrado x 0,125 x 0,875 / 0,04 al cuadrado

n = 3,8416 x 0,125 x 0,875 / 0,0016

n = 0,420175 / 0,0016

n = 262, 61 ( digamos 263 )

¿ Qué hubiese pasado si el investigador admite un error estándar igual al 5% ?

n = 0,420175 / 0,0025

n = 168

¿Y si el error admitido fuese del 3% ?

n = 0,420175 / 0,0009

n = 467

Según la operación realizada vemos que el tamaño de la muestra de 263 empresarios a ser entrevistados, una vez que sean seleccionados al azar, cumplirá con los requisitos encontrados en las dos proporciones p x q que suman 100%, dentro del margen de error establecido del 4% y con el intervalo de confianza del 95% ; y que si el error admitido fuese igual al 5%, entonces el tamaño de la muestra sería igual a 168 empresarios y si el error admitido fuese del 3%, el tamaño de la muestra será de 467 empresarios a ser interrogados, si previamente han sido seleccionados al azar con una tabla de números aleatorios.

El tamaño de la muestra de proporciones para población finita

Recordemos que también el tamaño de la muestra de proporciones se puede calcular de la siguiente manera: con el 95,5% (2 sigmas) de intervalo de confianza, admitiendo un margen de error del 4% y con las mismas proporciones de p = 12,5 % y q = 87,5%, para una población finita igual a 1.551. El resultado será un 10% menor que el resultado aplicando la fórmula del error estándar, en efecto:

n = 2 sigmas al cuadrado x p x q x N / error al cuadrado ( N+ 1 ) + sigma al cuadrado x p x q

n = 4 x 12,5 x 87,5 x 1551 / 16 ( 1551 – 1 ) + 4 x 12,5 x 87,5
n = 6.785.625 / 29.175
n = 234

Vamos a suponer que en el Estado Falcon Exista un total de 200 posadas turisticas y que el 75% tienen no mas de 6 habitaciones y que el 25% tiene mas de 6 habitaciones. Con los mismos criterios anteriores, o sea un intervalo de confianza del 95,5% (2 sigmas), un error admitido maximo del 10%, entonces el numero de posadas a investigar para una comparacion de sus estrategias de marketing, seria:

n = 10 x 75 x 25 x 200 / 100 ( 200 - 1 ) + 10 x 75 x 25
n = 3.750.000 / 19.900 + 18.750
n = 3.750.000 / 38.650
n = 97 posadas a investigar

Es deecir, se investigarian 73 posadas de menos de 6 habitaciones y 24 posadas de mas de 6 habitaciones.

El tamaño infinito de la población

Para el cálculo del tamaño de la muestra en el muestro aleatorio simple el tamaño de la población es infinita se pueden aplicar dos fórmulas, una donde se conoce la desviación estándar ( s al cuadrado); otra, donde se conocen las proporciones de los atributos ( p y q expresados en proporciones).

Suponga una corporación de ahorro y préstamos para vivienda, localizada en una ciudad intermedia, y que desea determinar a qué proporción de sus ahorradores le pagan su sueldo en forma quincenal y necesita estimar el tamaño de una muestra para hacer una encuesta. En estudios anteriores se encontró que la proporción es del 72% (0,72). Si se establece que se admite un error estar de más o menos el 6% (0,06) de la proporción verdadera y un intervalo de confianza del 90% ( con z = 1,64), entonces la pregunta es : ¿ qué tamaño de la muestra se necesita en esta investigación, suponiendo que la población es infinita o mayor de 100.000 sujetos?

n = [ 1,64 al cuadrado ( 0,72 ) (0,28 ) ] / 0,06 al cuadrado = 2,69 x 0,202 / 0,0036 = 151
ahorradores.

En un instituto de educación media, el departamento de bienestar estudiantil desea estimar con una encuesta a una muestra el peso promedio de sus alumnos para implantar un programa específico de alimentación. El error debe ser más o menos 2 kilos y un intervalo de confianza del 95% ( con z = 1,96), entonces la pregunta es : ¿ cuál es el tamaño de la muestra, bajo el supuesto de que la población es infinita y además se estima que la desviación típica es igual a 5 kilos ?

N = [ 1,96 al cuadrado (5) al cuadrado] / 2 al cuadrado = 3,84 x 25 / 4 = 24 alumnos.

Si la población es finita, por ejemplo se desea conocer el tamaño de la muestra para una población finita de 1200 ahorradores, con los mismos datos anteriores o sea: el error admitido de 6% (0,06) y el intervalo de confianza del 90% ( con z = 1,64) y una desviación típica o estándar igual en las proporciones 0,72 y 0,28. Entonces, la fórmula utilizada es la siguiente:

n = 0,72 (0,28) / 0,06 al cuadrado / 1.64 al cuadrado + 0,72 (0,28) / 1200
n = 0,2016 / 0,0015
n= 134 ahorradores

Si en el ejemplo de los alumnos se conoce que la población finita son 800 estudiantes, entonces la fórmula que se aplica con los mismos datos del error de 2 kilos, de la desviación típica de 5 kilos ( 5 x 5 = 25) y del intervalo de confianza de 95% ( z = 1,96), la fórmula que se aplica es:

n = 25 / 2 al cuadrado / 1,96 al cuadrado + 5 al cuadrado / 800
n = 25 / 1,0412 + 0,0312
n = 25 / 1,0724
n= 23 alumnos

Como estas fórmulas trabajan con los valores Z , es útil conocer estos valores para cada probabilidad o intervalo de confianza:

68,26% = 1,00
86,64% = 1,50
90,0% = 1,64
99,0% = 2,57
99,7% = 3,00
95,0% = 1,96
95,5% = 2,00

Los puntajes Z se obtienen dividiendo la proporción del grado de confianza entre 2 y el resultado se busca en la tabla de áreas de la curva d la distribución normal. Por ejemplo si el intervalo de confianza es 95% entonces : 0,9500 / 2 = 0,4750 y en la tabla esto corresponde a 1,96.

3 comentarios:

CEHO dijo...

Hola, muy buen blog, si no sabes que ir a ver al cine, entra en mi blog y te daré mi recomendación sobre la cartelera nacional, el blog se actualiza diariamente y te provee de las mejores criticas cinematográficas del momento, ahora elegir que película ver es mas divertido.

Alfredo Ascanio Guevara dijo...

Ya veremos tu BLOG CEHO y gracias

Carol dijo...

Muy util la informacion! Gracias!