Estadística y sus fundamentos

La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones.

Un estudio estadístico consta de las siguientes fases:

  • Recogida de datos.
  • Organización y representación de datos.
  • Análisis de datos.
  • Obtención de conclusiones.

La Estadística se divide en dos partes:

  1. Estadística descriptiva

La estadística descriptiva registra los datos en tablas y los representa en gráficos. Calcula los parámetros estadísticos, que describen el conjunto estudiado.

  1. Estadística inferencial

La Estadística inferencial estudia cómo sacar conclusiones generales para toda la población a partir del estudio de una muestra, y el grado de fiabilidad o significación de los resultados obtenidos.

Conceptos de Estadística

  • Población

Una población es el conjunto de todos los elementos a los que se somete a un estudio estadístico.

  • Individuo

Un individuo o unidad estadística es cada uno de los elementos que componen la población.

  • Muestra

Una muestra es un conjunto representativo de la población de referencia, el número de individuos de una muestra es menor que el de la población.

  • Muestreo

El muestreo es la reunión de datos que se desea estudiar, obtenidos de una proporción reducida y representativa de la población.

  • Valor

Un valor es cada uno de los distintos resultados que se pueden obtener en un estudio estadístico. Si lanzamos una moneda al aire 5 veces obtenemos dos valores: cara y cruz.

  • Dato

Un dato es cada uno de los valores que se ha obtenido al realizar un estudio estadístico. Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara, cruz.

Variables estadísticas

Una variable estadística es cada una de las características o cualidades que poseen los individuos de una población.

Variable cualitativa

Las variables cualitativas se refieren a características o cualidades que no pueden ser medidas con números. Podemos distinguir dos tipos:

  1. Variable cualitativa nominal

Una variable cualitativa nominal presenta modalidades no numéricas que no admiten un criterio de orden. Por ejemplo:

El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo.

  1. Variable cualitativa ordinal o variable cuasicuantitativa

Una variable cualitativa ordinal presenta modalidades no numéricas, en las que existe un orden. Por ejemplo:

La nota en un examen: suspenso, aprobado, notable, sobresaliente.

Puesto conseguido en una prueba deportiva: 1º, 2º, 3º, …

Medallas de una prueba deportiva: oro, plata, bronce.

Variable cuantitativa

Una variable cuantitativa es la que se expresa mediante un número, por tanto se pueden realizar operaciones aritméticas con ella. Podemos distinguir dos tipos:

  1. Variable discreta

Una variable discreta es aquella que toma valores aislados, es decir no admite valores intermedios entre dos valores específicos. Por ejemplo:

El número de hermanos de 5 amigos: 2, 1, 0, 1, 3.

  1. Variable continua

Una variable continua es aquella que puede tomar valores comprendidos entre dos números. Por ejemplo:

La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75.

En la práctica medimos la altura con dos decimales, pero también se podría dar con tres decimales.

Distribución de frecuencias

La distribución de frecuencias o tabla de frecuencias es una ordenación en forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente.

Frecuencia absoluta

La frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio estadístico.

Se representa por fi.

La suma de las frecuencias absolutas es igual al número total de datos, que se representa por N.

3

Para indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma mayúscula) que se lee suma o sumatoria.

2

Frecuencia relativa

La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el número total de datos.

Se puede expresar en tantos por ciento y se representa por ni.

1

La suma de las frecuencias relativas es igual a 1.

Frecuencia acumulada

La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado.

Se representa por Fi.

Frecuencia relativa acumulada

La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el número total de datos. Se puede expresar en tantos por ciento.

Este tipo de tablas de frecuencias se utiliza con variables discretas.

Distribución de frecuencias agrupadas

La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables toman un número grande de valores o la variable es continua.

Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente.

Límites de la clase

Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase.

Amplitud de la clase

La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase.

Marca de clase

La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el cálculo de algunos parámetros.

Parámetros estadísticos

Un parámetro estadístico es un número que se obtiene a partir de los datos de una distribución estadística.

Los parámetros estadísticos sirven para sintetizar la información dada por una tabla o por una gráfica.

Hay tres tipos parámetros estadísticos:

  1. De centralización.
  2. De posición.
  3. De dispersión.

Medidas de centralización

Nos indican en torno a qué valor (centro) se distribuyen los datos.

Las medidas de centralización son:

Media aritmética

La media aritmética es el valor promedio de la distribución.

Mediana

La mediana es la puntación de la escala que separa la mitad superior de la distribución y la inferior, es decir divide la serie de datos en dos partes iguales.

Moda

La moda es el valor que más se repite en una distribución.

Medidas de posición

Las medidas de posición dividen un conjunto de datos en grupos con el mismo número de individuos.

Para calcular las medidas de posición es necesario que los datos estén ordenados de menor a mayor.

Las medidas de posición son:

Cuartiles

Los cuartiles dividen la serie de datos en cuatro partes iguales.

Deciles

Los deciles dividen la serie de datos en diez partes iguales.

Percentiles

Los percentiles dividen la serie de datos en cien partes iguales.

Medidas de dispersión

Las medidas de dispersión nos informan sobre cuánto se alejan del centro los valores de la distribución.

Las medidas de dispersión son:

Rango o recorrido

El rango es la diferencia entre el mayor y el menor de los datos de una distribución estadística.

Desviación media

La desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a la media.

Varianza

La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media.

Desviación típica

La desviación típica es la raíz cuadrada de la varianza.

Referencias

@Vitutor 2014. (01 de 09 de 2015). VITUTOR. Obtenido de Estadística: http://www.vitutor.com/estadistica/descriptiva/a_1.html

T., J. L. (01 de 09 de 2015). monograficas.com. Obtenido de Estadística: http://www.monografias.com/trabajos15/estadistica/estadistica.shtml

Valdiviezo, L. T. (01 de 09 de 2015). slideshare. Obtenido de Estadistica: http://es.slideshare.net/utpl/estadistica-1604093

Anuncios

Probabilidad y sus fundamentos

La probabilidad más que nada es el estudio de los fenómenos puramente aleatorios. También se puede considerar a la probabilidad como una teoría referente a los resultados posibles de un experimento.

La teoría de la probabilidad tiene como objeto el análisis matemático de la noción del azar. La teoría de la probabilidad es la base de la estadística inferencial. Sin ella, nuestra interpretación de los datos apenas podría ir más allá de la simple conjetura.

  • Suceso (o evento): Es cualquier conjunto de resultados o consecuencias de un procedimiento.
  • Suceso Simple: Es un resultado o un evento que ya no puede desglosarse en componentes más simples.

Espacio muestral de un procedimiento, es el que se compone de todos los suceso simples posibles. Es decir, el espacio muestral se forma con todos los resultado que ya no es posible desglosar más.

Procedimiento Ejemplo de un suceso Espacio Muestral
Tirar un dado Cae un 5 (Suceso simple) {1,2,3,4,5,6}
Tirar dos dados Cae 7 (Suceso no simple) {1-1,1-2,…,6-6}

Cuando se tira un dado, el resultado 5 es un suceso simple porque no es posible desglosarse en otros.

Cuando se tiran dos dados, el resultado 7 no es un suceso simple, porque puede desglosarse en eventos más simples como 3-4 o 6-1. El resultado 3-4 se considera un evento simple porque 3 y 4 no son resultados individuales del procedimiento. Cuando se tiran dos dados, existen exactamente 36 resultados  que son sucesos simples: 1-1, 1-2, 1-3,…., 6-6.

Notación de probabilidades

P denota una probabilidad.

A, B y C denotan sucesos específicos.

P(A) denota la probabilidad de que ocurra el suceso A.

Probabilidad de un Suceso o Evento.

Hay diferentes formas para definir la probabilidad de un suceso. Se exponen tres enfoques:

Regla 1: Aproximación de la probabilidad.

Realiza un procedimiento un gran número de veces y cuenta las ocasiones que le suceso A ocurre en realidad. Con base en éstos resultados reales, P(A) se estima de la siguiente manera:

1

Probabilidad de un Suceso o Evento.

Regla 2: Método clásico de la probabilidad (requiere resultados igualmente probables).

Supón que un procedimiento dado tiene n sucesos simples distintos, cada uno de los cuales tiene la misma probabilidad de ocurrir. Si el suceso A puede ocurrir en s de esta n formas, entonces:

2

Probabilidad de un Suceso o Evento.

Regla 3: Probabilidades subjetivas.

P(A), la probabilidad del suceso A, se obtiene simplemente suponiendo o estimando su valor con base en el conocimiento de las circunstancias relevantes.

Ejemplos de aplicación de las tres reglas

  1. a) Método de las frecuencias relativas (Regla 1).

Cuando se trata d determinar P (tachuela cae con la punta hacia arriba), debemos repetir muchas veces el procedimiento de lanzar la tachuela y después calcular el cociente del número de veces que la tachuela cae con la punta hacia arriba entre el número de lanzamientos.

  1. b) Método Clásico (Regla 2).

Cuando se trata de determinar P(3) con un dado balanceado, cada una de las seis caras tiene la misma probabilidad de ocurrir.

  1. c) Probabilidad Subjetiva (Regla 3).

Cuando se trata de estimar la probabilidad de que mañana llueva, los meteorólogos usan su conocimiento experto de las condiciones del tiempo para desarrollar un estimado de probabilidad.

Importante

El método clásico (regla 2) requiere resultados igualmente probables. Si los resultados no son igualmente probables, debemos usar el estimado de frecuencias relativas o confiar en nuestro conocimiento de las circunstancias para hacer una conjetura entrenada.

Al calcular probabilidades con el método de frecuencias relativas (regla 1), obtenemos un estimado en lugar de un valor exacto. Conforme el número total de observaciones se incrementa, los estimados correspondientes tienden a acercarse a la probabilidad real. Tal propiedad se enuncia en forma de teorema, al que se conoce como ley de los grandes números.

Ley de los grandes números

Conforme un procedimiento se repite una y otra vez, la probabilidad de frecuencias relativas (regla 1) de un suceso, tiende a aproximarse a la probabilidad real.

Los estimados por frecuencias relativas tienden a mejorar si se hacen más observaciones. Por ejemplo: es fácil que una encuesta de opinión entre solo una docena de personas seleccionadas al azar resulte errónea en gran medida, pero si se aplica a miles de personas seleccionadas al azar, puede acercarse bastante a los valores reales de la población.

Ejemplos de resolución de problemas con las 3 reglas

1.- Calcular la probabilidad de que un adulto que se seleccionó aleatoriamente haya volado en avión.

Solución: El espacio muestral consiste en dos sucesos simples: la persona ya voló o no ha volado en avión. Pero estos sucesos no son igualmente probables, así que no es aplicable la regla 1. Se necesitarían datos de encuestas.

2.- Planeas apostar al número 13 en el próximo giro de la ruleta. ¿Cuál es la probabilidad de que pierdas?

Solución: Una ruleta tiene 38 ranuras distintas y solo una corresponde al número 13. La ruleta se diseñó para que todos los números sean igualmente probables de resultar, por lo que en éste caso se puede utilizar el método clásico (regla 2)

33

3.- ¿Cuál es la probabilidad de que tu automóvil sea impactado por un meteorito éste año?

Solución:

La regla 1 (Método de frecuencias relativas) no puede emplearse porque no hay datos históricos de meteoritos que chocan contra automóviles.

Hay 2 posibles resultados: chocar o no chocar, pero no son igualmente probables, por lo que no puede aplicarse la regla 2 (método clásico).

Queda la regla 3, por medio de la cual se hace un estimado subjetivo. En éste caso, todos sabemos que la probabilidad en cuestión es muy pequeña, estimemos que sea de 0.000000000001 (una en un billón). Éste es un estimado subjetivo porque se basa en nuestro conocimiento general.

Referencias

@Vitutor 2014. (02 de 09 de 2015). VITUTOR. Obtenido de Probabilidad: http://www.vitutor.com/pro/2/probabilidad.html

Colina, J. M. (02 de 09 de 2015). monografias.com. Obtenido de La Probabilidad: http://www.monografias.com/trabajos54/resumen-estadistica/resumen-estadistica.shtml