Capítulo 3 Recolección de Datos

3.1 Definiciones

A primary goal of statistical studies is to collect data that can then be used to make informed decisions. It should come as no surprise that the ability to make good decisions depends on the quality of the information available.

  • Datos: colección de información sobre las variables de interés.
    Para poder tener una colección habrá que definir la población de donde saldrán éstos datos:
  • Población: Conjunto de datos, objetos, humanos, experiencias, étc.
    • Población infinita: Aquella que no se puede o es difícil de contar. (población difícil o no contable)
    • Población finita: se puede contar y/o medir.
    • Población muestreada: subconjunto de la población que reúne todas las características (parámetros) de la población.
  • Parámetro: unidad de medida de los atributos, características de la población.
  • Muestra: Subconjunto de la población.
  • Estadísticos: unidad de medida de un atributo o característica de la muestra.
  • Censo: cuando la población se analiza en su totalidad.

A study is an observational study if the investigator observes characteristics of a sample selected from one or more existing populations. The goal of an observational study is usually to draw conclusions about the corresponding population or about differences between two or more populations. In a well-designed observational study, the sample is selected in a way that is designed to produce a sample that is representative of the population.

A study is an experiment if the investigator observes how a response variable behaves when one or more explanatory variables, also called factors, are manipulated. The usual goal of an experiment is to determine the effect of the manipulated explanatory variables (factors) on the response variable. In a well-designed experiment, the composition of the groups that will be exposed to different experimental conditions is determined by random assignment.

3.2 Tipos de Muestreo

Advantages of sampling methods:

  • Reduced cost.
  • Greater speed.
  • Greater Scope
  • Greater Accuracy

3.2.0.1 Types of sampling

3.2.0.1.1 Non Probabilistic Techniques
  • Muestreo por Conveniencia: Los encuestados son seleccionados porque estaban en el lugar preciso en el momento adecuado.
  • Muestreo por Juicio: Los encuestados son seleccionados siguiendo el criterio del investigador, basándose en su conocimiento de la población objetivo.
  • Muestreo Encadenado: Se selecciona a una muestra que sirve como punto de partida para otra muestra. Se utiliza cuando, por la naturaleza delicada de la pregunta o la dificultad de encontrar a los encuestados, es necesario que el encuestado nos dirija a otro. Un ejemplo típico de la utilidad de este método sería la investigación sobre hábitos de conducta moralmente no aceptados por la sociedad.
  • Muestreo por Cuotas: En este caso el investigador tiene una información más detallada de la distribución de la población según algunas variables que están relacionadas con la variable a estudiar. De acuerdo con estas variables se divide la población en estratos y se entrevista un número determinado en cada estrato.
3.2.0.1.2 Probabilistic Techniques
  • Muestreo Aleatorio Simple (MAS): Cada elemento de la población y cada posible muestra de un tamaño n tienen una probabilidad conocida e igual de ser seleccionados. Esta técnica requiere tener un listado exhaustivo de todos los elementos de la población objetivo. Errores que arruinan el muestreo aleatorio simple (buscar evitarlos siempre):
    • Tendencias.
    • Prejuicios.
    • Parcialidades.
  • Muestreo Sistemático: Se elige un primer elemento aleatoriamente y a continuación todos los siguientes cada n posiciones. Así, si por ejemplo queremos seleccionar 20 individuos de entre 100, el primer paso es seleccionar un número aleatorio entre 1 y 5 (ya que 100/20=5), digamos el 3; a continuación seleccionamos los individuos 3, 8, 13, 18,… 93, 98. Esto implica la ordenación de todos los elementos de la población, si bien el criterio de ordenación no debe guardar ninguna relación con el fenómeno sociológico a estudiar.
  • Muestreo Estratificado: Requiere al menos dos etapas. En una primera etapa la población objetivo se divide en estratos según las variables que se consideran relacionadas con el fenómeno sociológico a estudiar. La segunda fase consiste en seleccionar aleatoriamente una muestra dentro de cada estrato.
  • Muestreo por conglomerados (clusters):
    • Monoetápico: La población es dividida en conglomerados (barrios, manzanas), seleccionando un grupo de ellos con probabilidad proporcional a su importancia. Una vez se tienen estos conglomerados se encuesta a todos los elementos del conglomerado (todos los vecinos de las manzanas B, H y G).
    • Bietápico: Igual que el anterior pero en lugar de encuestar a todos los elementos del conglomerado se selecciona una muestra.
  • 1-in-\(k\) systematic sampling/ muestreo sistemático 1-en-\(k\): Consiste en seleccionar cada \(k\)-ésima unidad. Útil para muestreo de artículos en líneas de producción.

Ejemplos:
Muestreo con reemplazo:
En un lote de 1000 artículos. Agarro 20 al hazar, si \(\leq 4\) están defectuosos, acepto el lote.

Muestreo sin remplazo:
Después de sacar 20, vuelvo a muestrear a los 980 restantes (con ésta técnica la muestra aumenta, dado que \(\Omega\) disminuye y la cantidad de artículos defectuosos siguen siendo los mismos en cantidad) \(\therefore\)
Tomo 30 artículos, si \(\leq 4\) resultan defectuosos entonces rechazo el lote.

3.2.1 Resumen de Muestreos

3.3 Tipos de Estudios

3.3.0.1 Correlation Analysis (CA)

El análisis de correlaciones es muy útil para el investigador para determinar si existe alguna relación o asociación entre diversas variables de interés antes de continuar con un análisis más sofisticado de causa-efecto. El análisis de correlaciones también constituye un insumo fundamental para realizar diversos análisis estadísticos más avanzados como el análisis factorial y el análisis de confiabilidad. Estos análisis son utilizados por los investigadores para determinar la validez y confiabilidad de las encuestas de actitud.

3.3.0.1.1 Statistical assumption of CA

El análisis más común es el análisis de correlación de Pearson (Pearson product moment correlacion coefficient). Este tipo de análisis presupone que las variables son ordinales o continuas y que la distribución de estas variables se acerca a la distribución normal (Bell shape curveo “curva de campana”). Es aconsejable que antes de proceder al análisis de correlación de las variables, el investigador estime las estadísticas descriptivas correspondientes para determinar si se cumplen estos supuestos.

  • Estudio observacional:
  • Estudio experimental:

Recordar el concepto de efecto placebo, para evitar éste efecto se utilizan grupos control en los estudios.