estadisticas demi blog

jueves, 21 de abril de 2011

PROBABILIDAD Y ESTADISTICAS.



Las Probabilidades pertenecen a la rama de la matemática que estudia ciertos experimentos llamados aleatorios, o sea regidos por el azar, en que se conocen todos los resultados posibles, pero no es posible tener certeza de cuál será en particular el resultado del experimento. Por ejemplo, experimentos aleatorios cotidianos son el lanzamiento de una moneda, el lanzamiento de un dado, extracción de una carta de un mazo de naipes. Más adelante se verá que debemos distinguir entre los conceptos de probabilidades matemáticas o clásicas de las probabilidades experimentales o estadísticas.
La probabilidad mide la frecuencia con la que se obtiene un resultado (o conjunto de resultados) al llevar a cabo un experimento aleatorio, del que se conocen todos los resultados posibles, bajo condiciones suficientemente estables. La teoría de la probabilidad se usa extensamente en áreas como la estadística, la física, la matemática, la ciencia y la filosofía para sacar conclusiones sobre la probabilidad de sucesos potenciales y la mecánica subyacente de sistemas complejos.

Probabilides, Algunas Definiciones
Espacio Muestral.- Se llama espacio muestral (E) asociado a un experimento aleatorio, el conjunto de todos los resultados posibles de dicho experimento.
Al lanzar una moneda, el espacio muestral es E = {sale cara, sale sello} ó E = {c, s}.
 Al lanzar un dado de seis caras, el espacio muestral es
 E = {sale 1, sale 2, sale 3, sale 4, sale 5, sale 6}
 ó E = {1, 2, 3, 4, 5, 6}
 Al lanzar dos monedas, el espacio muestral es
 E = {(c,c), (c,s), (s,c), (s,s)}.
 Al lanzar tres monedas, el espacio muestral es E = {(c,c,c), (c,c,s), (c,s,c), (c,s,s), (s,c,c), (s,c,s), (s,s,c), (s,s,s)}
Evento o Suceso. Se llama evento o suceso a todo subconjunto de un espacio muestral. Por ejemplo en el espacio muestral E = {1, 2, 3, 4, 5, 6} del lanzamiento de un dado, los siguientes son eventos:
 1. Obtener un número primo A = {2, 3, 5}
 2. Obtener un número primo y par B = {2}
 3. Obtener un número mayor o igual a 5 C = {5, 6}
Eventos mutuamente excluyentes.- Dos eventos son mutuamente excluyentes si no pueden ocurrir en forma simultánea, esto es, si y sólo si su intersección es vacía. Por ejemplo, en el lanzamiento de un dado los eventos B = {2} y C = {5, 6} son mutuamente excluyentes por cuanto
B  C =
Eventos Complementarios.- Si A  B =  y A  B = E, se dice que A y B son eventos complementarios: Ac = B y
Bc = A
Su Medición Matemática o Clásica. Si en un experimento aleatorio todos los resultados son equiprobables (iguales probabilidades), es decir, la ocurrencia de uno es igualmente posible que la ocurrencia de cualquiera de los demás, entonces, la probabilidad de un evento A es la razón:
 P(A) = número de casos favorables para A/número total de casos posibles
 A partir de esta definición las probabilidades de los posibles resultados del experimento se pueden determinar a priori, es decir, sin realizar el experimento.
 Se deduce de la definición lo siguiente:
 0  P(A)  1 La medición probabilística es un número real entre 0 y 1, inclusive, ó 0%  P(A)  100% en porcentaje.
P() = 0 y P(E) = 1
Su Medición Experimental o Estadística.- La frecuencia relativa del resultado A de un experimento es la razón
 FR = número de veces que ocurre A/número de veces que se realiza el experimento
 Si el experimento se repite un número grande de veces, el valor de FR se aproximará a la medición probabilística P del evento A. Por ejemplo, si lanzo 100 veces una moneda, el número de veces que obtengo cara es cercano a 50, o sea FR es cercano a 50%.

CONVERTIR TANTO POR CIENTO A DECIMALES Y VICEVERSA.

Se debe recordar siempre que un por ciento significa un centésimo. Lo dice la palabra misma: por ciento es por cien, se está comparando con cien: si 15% de la populación son ancianos, significa que 15 personas de cada cien son ancianos.

1% es un centésimo ó 0.01 4% es cuatro centésimos ó 0.04 12% es doce centésimos ó 0.12 89% es 89 centésimos ó 0.89 100% es cien centésimos ó 1 145% es 145 centésimos ó 1.45

Convertir un número decimal en tanto por ciento
Si tiene un número decimal, sólo se observa cuántos centésimos tiene. segunda cifra después del punto significa las centésimos.

NOTACIÓN CIENTÍFICA.

La notación científica (o notación índice estándar) es una manera rápida de representar un número utilizando potencias de base diez. Esta notación se utiliza para poder expresar fácilmente números muy grandes o muy pequeños.
Los números se escriben como un producto:

siendo:
 un número entero o decimal mayor o igual que 1 y menor que 10, que recibe el nombre de coeficiente.
 un número entero, que recibe el nombre de exponente u orden de magnitud.
La notación científica utiliza un sistema llamado coma flotante, o de punto flotante en países de habla inglesa y en algunos hispanohablantes.
La notación científica (o notación índice estándar) es un modo conciso de representar un número utilizando potencias de base diez. Los números se escriben como un producto: a · 10k, (siendo a un número mayor o igual que 1 y menor que 10, y k un número entero). Esta notación se utiliza para poder expresar fácilmente números muy grandes. 0 = 1 1 = 10 2 = 100 3 = 1 000 4 = 10 000 5 = 100 000 6 = 1 000 000 9 = 1 000 000 000 10 = 10 000 000 000 20 = 100 000 000 000 000 000 000 30 = 1 000 000 000 000 000 000 000 000 000 000 –n es igual a 1/10n o equivalentemente a 0, (n–1 ceros) 1: –1 = 1/10 = 0,1 –3 = 1/1000 = 0,001 –9 = 1/1 000 000 000 = 0,000 000 001 29, y un número pequeño como 0,000 000 000 023 4 puede ser escrito como 2,34·10–11.
Por ejemplo, la distancia a los confines observables del universo es ~4,6·10
La notación científica es altamente útil para anotar cantidades físicas, pues pueden ser medidas solamente dentro de ciertos límites de error y al anotar sólo los dígitos significativos se da toda la información requerida sin malgastar espacio.
Para expresar un número en notación científica debe expresarse en forma tal que contenga un dígito (el más significativo) en el lugar de las unidades, todos los demás dígitos irán entonces después del separador decimal multiplicado por el exponente de 10 respectivo.
Ejemplo:
238294360000 = 2,3829436E11 y 0,000312459 = 3,12459E-4.
26m y la masa de un protón es ~1,67·10-27 kilogramos. La mayoría de las calculadoras y muchos programas de computadora presentan resultados muy grandes y muy pequeños en notación científica; los números 10 generalmente se omiten y se utiliza la letra E para el exponente; por ejemplo: 1,56234 E29. Nótese que esto no está relacionado con la base del logaritmo natural también denotado comúnmente con la letra e.
Operaciones matemáticas con notación científica
Suma y resta
Siempre que las potencias de 10 sean las mismas, se debe sumar las mantisas, dejando la potencia de 10 con el mismo grado (en caso de que no tengan el mismo exponente, debe convertirse la mantisa multiplicándola o dividiéndola por 10 tantas veces como sea necesario para obtener el mismo exponente).
Ejemplo:
2·10
4 + 3·104 = 5·104
Para sumar y restar dos números (o más) debemos tener el mismo exponente en las potencias de base diez. Tomamos como factor común el mayor y movemos la coma flotante, en los menores, tantos espacios como sea necesario, elevando los correspondientes exponentes hasta que todos sean iguales.
Ejemplo:
2·10
0.2·10
4 + 3·105 - 6·103 (tomamos el exponente 5 como referencia) 5 + 3·105 - 0.06·105
3.14·10
5
Multiplicación
Se multiplican los coeficientes y se suman a la vez los exponentes.
Ejemplo:
(4·10
5)· (2·107) = 8·1012
División
Se dividen las mantisas y se restan los exponentes (numerador-denominador).
Ejemplo:
(4·10
12)/ (2·105) =2·107
Además se pueden pasar los dos números al mismo exponente y luego nada más multiplicar.
Potenciación
Se potencia la mantisa y se multiplican los exponentes.
Ejemplo:
(3·10
6)2 = 9·1012
Radicación
Se debe extraer la raíz de la mantisa y dividir el exponente por el índice de la raíz:
Ejemplos:


Usos

ESTADÍSTICA DESCRIPTIVA Y ESTADÍSTICA INFERENCIAL.

La Estadística para su mejor estudio se ha dividido en dos grandes ramas: la Estadística Descriptiva y la Inferencial.
Estadística Descriptiva: consiste sobre todo en la presentación de datos en forma de tablas y gráficas. Esta comprende cualquier actividad relacionada con los datos y está diseñada para resumir o describir los mismos sin factores pertinentes adicionales; esto es, sin intentar inferir nada que vaya más allá de los datos, como tales, es decir, únicamente los adquiere, los recopila y los organiza.
Estadística Inferencial: se deriva de muestras, de observaciones hechas sólo acerca de una parte de un conjunto numeroso de elementos y esto implica que su análisis requiere de generalizaciones que van más allá de los datos. La estadística inferencial simplemente es el procedimiento por medio del cual se llega a las inferencias acerca de una población base en los resultados obtenidos de una muestra extraída de la población, es decir, la Estadística Inferencial investiga o analiza una población partiendo de una toma de muestra.

VARIABLES DISCRETAS Y CONTINUAS.

En líneas anteriores se ha señalado que el objeto de estudio de la Estadística son las poblaciones y que estas están formadas por entes o elementos. El número total de los mismos determina el tamaño de la población. Para estudiar una población, lo primero que debe hacerse es observarla de alguna de las formas que ya se ha señalado en las líneas anteriores. Pero observar una población es equivalente a observar sus elementos. Ahora bien, esos elementos poseen una serie de características que son las que realmente se observan. Por ejemplo, el conjunto de todas las empresas industriales radicadas en España constituyen una población. Los elementos de esa población son las empresas. Pero una empresa no se observa en abstracto. Lo que realmente tiene interés son las distintas características de esas empresas, como, por ejemplo, el número de empleados, el volumen de ventas, los costos salariales, los gastos en publicidad, los beneficios de las mismas, la naturaleza de los productos que fabrican, etc.
X
Los atributos no pueden medirse como ocurre con las variables. Lo único que puede hacerse con ellos es describirlos mediante palabras y clasificarlos en categorías no numéricas que sean mutuamente excluyentes. A cada una de
estas categorías se le denomina modalidades. Un ejemplo es el que se recoge en la Tabla 3.
En algunos casos, las modalidades de un atributo pueden ser objeto de ordenación, como se aprecia en la tabla 4.

= (X1, X2,...... Xn)
A todas estas características de los elementos de una población se les conoce de forma genérica como caracteres. Estos últimos, según su naturaleza, pueden ser de tipo cuantitativo o cualitativo. Para el ejemplo anterior, serían caracteres cuantitativos "el número de empleados", "el volumen de ventas", "los costos salariales", "los gastos en publicidad", "los beneficios de las mismas", etc., mientras que sería cualitativo "la naturaleza de los productos que fabrican". Hay que señalar que, en general, cualquier carácter de tipo cuantitativo se puede ofrecer en términos cualitativos. Así, si el número de empleados lo agrupamos en intervalos, se podría hablar de empresas pequeñas, medinas y grandes, siendo ahora el carácter "tamaño de la empresa" de naturaleza cualitativa. De manera similar se podría proceder con los demás. Pero en estadística es más habitual hablar de variables que de caracteres cuantitativos y de atributos en lugar de caracteres cualitativos. Las variables son susceptibles de medirse en términos cuantitativos y a cada una de esas posibles mediciones o realizaciones se les conoce como valores, datos u observaciones.
A su vez, en función del número posible de valores que tome una variable, a las mismas se les puede clasificar en discretas y continuas. Serán discretas cuando el número de valores sea finito o infinito numerable, mientras que una variable será continua cuando el número de sus valores sea infinito no numerable. En los casos en los que las variables toman infinitos valores, la práctica habitual es agruparlos en intervalos, como se muestra en las Tabla 1, para variable continua, y en la Tabla 2 para discreta.
Variable discreta, es aquella que entre dos valores próximos puede tomar a un número finito de valores, es decir, es aquella que contiene saltos entre un número y otro (1, 2, 3, 4, etc.), por ejemplo: el número de miembros de una familia, el de obreros de una fábrica, el de alumnos de la universidad, etc.
Variable continúa, es la que puede tomar infinitos valores de un intervalo, es decir, es aquella que no contiene saltos (1.1, 1.2, 1.3, 1.4, etc.) En muchas ocasiones la diferencia es más teórica que práctica, ya que los aparatos de medida dificultan que puedan existir todos los valores del intervalo. Ejemplos, peso, estatura, distancias, etc.
La variable se denota por las mayúsculas de letras finales del alfabeto castellano. A su vez cada una de estas variables puede tomar distintos valores, colocando un subíndice, que indica el orden.

FUENTE DE DATOS.

En los apartados anteriores se ha señalado que el objetivo de la Estadística es el estudio de los fenómenos de masas. Pero ello requiere el manejo de una información numérica amplia. La cuestión inmediata que surge es saber a dónde se puede recurrir para encontrar esa información necesaria y sin la cual el análisis estadístico no se puede realizar. En definitiva, se trata de conocer las fuentes que suministran información de carácter estadístico. Estas fuentes son susceptibles de clasificarse según distintos criterios. Atendiendo al agente que elabore esa información, la misma puede agruparse en endógena y exógena. La primera sería la que elabora el propio investigador. En este caso, la operación estadística conducente a recabar los datos necesarios para la realización del análisis estadístico se supone que la lleva a cabo el propio investigador. Será quien se encargue de observar los distintos caracteres, cuantitativos o cualitativos, relevantes de los elementos de una población. El resultado será una base de datos, obtenida mediante una muestra, o cualquiera de los otros procedimientos indicados con anterioridad, que permitirá el correspondiente análisis estadístico.
Esta situación se da cuando no existe fuente alternativa exógena capaz de facilitar esa información. Pero ¿qué se entiende por fuente exógena? En general, la podemos definir como aquella cuyo objeto principal es la obtención de información estadística pero que no actúa como usuaria, es decir, no es elaborada por el propio investigador.
Las fuentes exógenas son múltiples y a su vez se clasifican en dos categorías distintas. Por un lado están las fuentes oficiales o públicas, en el caso de México, un ejemplo claro es el INEGI (Instituto Nacional de Estadística y Geografía) y, por otro, las privadas (consultorias). De todas ellas las que generan mayor volumen de información son las primeras, es decir, las oficiales o públicas. Estas últimas se pueden clasificar, de acuerdo al ámbito espacial en que desarrollan sus competencias en materia estadística.

LA ESTADÍSTICA EN LA INVESTIGACIÓN.


El método estadístico consiste en una serie de procedimientos para el manejo de los datos cualitativos y cuantitativos de la investigación.
 Dicho manejo de datos tiene por propósito la comprobación, en una parte de la realidad de una o varias consecuencias verticales deducidas de la hipótesis general de la investigación.
 Las características que adoptan los procedimientos propios del método estadístico dependen del diseño de investigación seleccionado para la comprobación de la consecuencia verificable en cuestión.
 El método estadístico tiene las siguientes etapas:
 Recolección (medición)
 Recuento (computo)
 Presentación
 Descripción
 Análisis
Errores Estadísticos Comunes
Al momento de recopilar los datos que serán procesados es susceptible cometer errores así como durante los cómputos de los mismos. No obstante, hay otros errores que no tienen que ver con la digitación y que no son tan fácilmente identificables.
Algunos de estos errores son:
  • Sesgo
: Es imposible ser completamente objetivo o no tener ideas preconcebidas antes de comenzar a estudiar un problema, y existen muchas maneras en que una perspectiva o estado mental pueda influir en la recopilación y en el análisis de la información. En estos casos se dice que hay un sesgo cuando el individuo da mayor peso a los datos que apoyan su opinión que a aquellos que la contradicen. Un caso extremo de sesgo sería la situación donde primero se toma una decisión y después se utiliza el análisis estadístico para justificar la decisión ya tomada.
  • Datos no comparables

  • : el establecer comparaciones es una de las partes más importantes del análisis estadístico, pero es extremadamente importante que tales comparaciones se hagan entre datos que sean comparables. Proyección descuidada de tendencias: la proyección simplista de tendencias pasadas hacia el futuro es uno de los errores que más ha desacreditado el uso del análisis estadístico.
  • Muestreo Incorrecto

  • : en la mayoría de los estudios sucede que el volumen de información disponible es tan inmenso que se hace necesario estudiar muestras, para derivar conclusiones acerca de la población a que pertenece la muestra. Si la muestra se selecciona correctamente, tendrá básicamente las mismas propiedades que la población de la cual fue extraída; pero si el muestreo se realiza incorrectamente, entonces puede suceder que los resultados no signifiquen nada.