Concepto de Estadística, Población, Muestra y Variables



La Estadística es una ciencia que se ocupa de recoger, agrupar, representar, analizar e interpretar una serie de datos. Trata de buscar la regularidad en las formas de actuar de una serie de casos. 

La estadística no es sólo una lista de resultados o un cálculo de porcentajes, sino que trata de obtener conclusiones a partir de unas observaciones hechas. La estadística actual tiene su origen en la unión, en el siglo XIX, de dos disciplinas que habían evolucionado por separado: 

    Concepto de Estadística, Población, Muestra y Variables
  • El cálculo de probabilidades, nacida en el siglo XVII como teoría matemática de los juegos de azar. 
  • La estadística descriptiva o ciencia del Estado, cuyo origen se remonta a la antigüedad y estudia la descripción de datos (por ejemplo, censos de población). 
La fusión de ambas líneas da lugar a esta ciencia que tiene como fin obtener conclusiones de la investigación empírica mediante el uso de modelos matemáticos. 

En resumen, la estadística sirve como puente entre los fenómenos reales y los modelos matemáticos. Teniendo en cuenta que un modelo matemático es una abstracción simplificada de una realidad más compleja, siempre existirá una cierta discrepancia entre lo que se observa y lo previsto por el modelo 

Población, Muestra y Variables:

Cuando vamos a utilizar la estadística es necesario hacer referencia al conjunto de elementos de los que vamos a obtener los datos. Este conjunto es lo que denominaremos población, pero teniendo en cuenta que pueden ser objetos, tiempo, etc. y no sólo a personas, como utilizamos en el lenguaje habitual. Otra forma de denominarlo es universo. 

Es necesario que la población esté bien delimitada, y para ello hay que definirla en el tiempo y en el espacio. Gracias a esta limitación podremos determinar si algo forma parte o no de la población que estamos estudiando. 

Población Estadística : Conjunto finito o infinito de elementos, sobre los que vamos a realizar observaciones. Por ejemplo: los habitantes de un lugar, las piezas obtenidas de una máquina en un determinado tiempo, etc. 

Como se puede extraer de la definición, la población como tal es un concepto muy abstracto, esto da lugar a que sea muy difícil o incluso imposible trabajar con ella al completo ya que puede ser un tamaño infinito o muy caro. A efectos prácticos, se estudia un subconjunto o muestra a partir de la cual extrapolamos los resultados al resto de la población. En general, cuanto mayor es la muestra mejores son los resultados que podemos obtener. Por ejemplo: si queremos analizar la resistencia de las piezas producidas por una máquina en un determinado periodo de tiempo es evidente que no podemos probar todas las piezas porque las vamos a dañar debemos seleccionar sólo una parte de ellas. 

Por otro lado no podemos elegir la muestra que queramos sin más, para poder extrapolar los resultados es necesario que cumpla unos requisitos que la conviertan en estadísticamente significativa. 

Las características que se tienen en cuenta son: 

a) Tamaño: se establece mediante fórmulas en función del grado de confianza y precisión que planteemos. 
b) Forma de elección: es fundamental para que la muestra sea representativa de la población de la cual se extrae. 

Por ejemplo, si analizamos las piezas producidas por dos máquinas de forma simultánea e igual número, debemos obtener una muestra en la que ambas estén representadas en la misma proporción. 

Muestra: Subconjunto finito de una población. El número de elementos que forman la muestra se denomina tamaño muestral. 

Variable: Cada una de las características que pueden observarse de un elemento de la muestra 

Siguiendo con nuestro ejemplo de las piezas se puede medir grosor, peso, resistencia, etc. Además de los datos a medir es necesario especificar, cuando sea preciso, la unidad de medida (por ejemplo, el grosor en centímetros o en milímetros). 

Las variables pueden ser clasificadas en dos grupos: 

a) Cualitativas: pueden tomar valores no cuantificables numéricamente. Se denomina categoría a cada uno de los valores que toma la variable. Dentro de este grupo diferenciamos: 

Nominativas: no existe ningún orden entre las categorías de variables. Por ejemplo: el grupo sanguíneo (A, B, AB, 0) o el color del pelo (moreno, rubio, pelirrojo).

Podemos distinguir las variables binarias cuando toman dos valores posibles -Si/no, presencia/ausencia- (por ejemplo: casado sí o no, tener el carnet de conducir sí o no).
Ordinales: existe un cierto orden entre las categorías de las variables, por ejemplo el nivel de estudios (sin estudios, básico, secundarios, etc) o categoría dentro de una empresa (peón, encargado, etc.) 

b) Cuantitativas: los valores que pueden tomar las variables son cuantificables numéricamente. Dentro de éstas se agrupan en: 

Discretas: tomas valores aislados, normalmente números enteros, por ejemplo número de hermanos o de hijos. 

Continuas: teóricamente puede tomar cualquier valor numérico por ejemplo: el peso de un individuo. Aunque en la práctica todas tomarían valores discretos por la imposibilidad de tener aparatos lo suficientemente sensibles para realizar mediciones intermedias.