ANÁLISIS DE SENDEROS (II)Gabriel Sotomayor

Mayo 2023

CONTENIDOS

•Recordatorio de la sesión anterior: Conceptos básicos y supuestos del PA

•Pasos de aplicación del PA

•Especificación

•Identificación

•Estimación de parámetros

•Evaluación del ajuste

•Re-especificación del modelo

•Interpretación de resultados

•Aplicación de PA en R

CALENDARIZACIÓN

Fechas

Contenidos Evaluaciones

29 de mayo

Análisis de sendero

5 de junio

Modelos de ecuaciones

estructurales

12 de junio

Modelos de ecuaciones

estructurales

Tarea de Senderos

19 de junio

Modelos de ecuaciones

estructurales

26 de junio

Feriado

3 de julio

Repaso Trabajo Final

1. REPASO DE LA SESIÓN ANTERIOR

CONCEPTOS CENTRALES

Análisis de senderos: es un método que permite evaluar el ajuste de modelos

teóricos en los que se proponen un conjunto de relaciones de dependencia entre

variables. Extensión de RLM.

•Variables exógenas: sus causas son externas al modelo, su función es explicar las

otras variables internas del modelo.

•Variables endógenas: tienen sus causas en una o más variables del modelo,

incluyen variables dependientes e intervinientes.

•Efectos directos: influencia inmediata de una variable sobre otra.

•Efectos indirectos: influencia mediada por una o más variables intermedias.

•Efectos espurios: relación entre dos variables endógenas es influenciada por una

tercera variable no contemplada en el modelo.

SUPUESTOS DEL PATH ANALYSIS (I)

•Path Analysis (PA) es una extensión del análisis de regresión múltiple y requiere el

cumplimiento de sus supuestos junto con otros adicionales.

•Exploración de datos: Detectar valores extremos (outliers) y valores perdidos

(missing) para evitar distorsiones en el análisis. Para los outliers, se pueden usar

puntajes Z (rango +-3) y la distancia de Mahalanobis (D²).

•Manejo de outliers: Recomendado removerlos o recodificarlos al puntaje extremo

más próximo.

•Valores perdidos: Su impacto depende de la cantidad y el patrón.

SUPUESTOS DEL PATH ANALYSIS

(II)

•Tamaño de la muestra: Se recomienda entre 10 y 20 casos por parámetro y al

menos 200 observaciones.

•Independencia de errores: El término de error de cada variable endógena no debe

correlacionarse con otras variables.

•Normalidad: Los datos deben seguir una distribución normal. Se puede verificar la

normalidad univariada y multivariada examinando los índices de asimetría y

curtosis, y el índice multivariado de Mardia.

SUPUESTOS DEL PATH ANALYSIS

(III)

•Linealidad y Multicolinealidad: Los datos deben tener una relación lineal y las

correlaciones bivariadas entre variables no deben ser demasiado altas (más de 0.85

indica posible multicolinealidad).

•Recursividad: Las influencias causales deben ser unidireccionales y sin efectos

retroactivos.

•Nivel de medición intervalar: Se asume para la mayoría de las variables, aunque a

veces se pueden usar variables nominales u ordinales.

•Confiabilidad: Los instrumentos de medición utilizados deben tener propiedades de

confiabilidad al menos moderadas.

PASOS DE APLICACIÓN DEL ANÁLISIS

DE SENDEROS

PASOS DEL PATH ANALYSIS

Especificación: Define las variables y relaciones en el modelo explicativo.

Identificación: Verifica si el modelo está correctamente identificado.

Estimación de parámetros: Estima los parámetros con base en las varianzas y

covarianzas muestrales.

Evaluación del ajuste: Revisa si las relaciones del modelo reflejan adecuadamente

las observadas en los datos.

Re-especificación del modelo: Mejora el ajuste del modelo si es necesario.

Interpretación de resultados: Extrae conclusiones significativas de los datos.

ESPECIFICACIÓN

Determina las variables y su relación basada en el conocimiento teórico del

fenómeno.

Evita errores de especificación interna y externa para desarrollar un modelo de alto

valor explicativo y relevancia teórica.

Errores de especificación interna: por omisión de parámetros relevantes o inclusión de

parámetros irrelevantes.

Errores de especificación externa: variables omitidas.

Ejemplo: Un modelo de rendimiento académico en Lengua debería incluir la variable

de autoeficacia para la escritura.

IDENTIFICACIÓN

•Antes de recoger los datos, asegura que el modelo esté correctamente identificado:

determinar si se cuenta con la cantidad suficiente de información para constrastarse

el mdoelo.

•Calcula los grados de libertad del modelo para determinar si se dispone de

suficiente información.

•gl= ½ x (Nº de variables observadas x (Nº de variables observadas + 1)) –Nº

parámetros a estimar

•Diferentes estados del modelo: identificado (gl=0, ajuste perfecto), por lo que no

resulta de interés, solo reproduce la matriz de correlaciones original, sub-

identificado (gl<0, necesita más información), sobre-identificado (gl>0, puede ser

estimado y contrastado).

ESTIMACIÓN DE PARÁMETROS

Estima los valores de los parámetros que proporcionen un ajuste óptimo entre la

matriz reproducida y la observada.

Si la matriz residual es próxima a cero (matriz observada - matriz reproducida =

matriz residual) el ajuste es bueno.

Método más común: Máxima Verosimilitud (ML, Maximum Likelihood), que requiere

supuestos como muestra de tamaño adecuado, medidas al menos de nivel intervalar,

y distribución normal multivariada.

Este método es robusto a ligeras desviaciones de la distribución normal (valores de

hasta 70 en el coeficiente de Mardia).

Otros métodos pueden ser utilizados en casos de ausencia de normalidad o variables

categóricas: WLS, DWLS.

EVALUACIÓN DEL AJUSTE

•Revisa si las relaciones en el modelo reflejan adecuadamente las relaciones

observadas en los datos.

•Evaluar en términos de: (a) magnitud y significación de los parámetros estimados,

(b) varianza explicada por las variables, y (c) ajuste del modelo a los datos.

•Uso de estadísticos de bondad de ajuste: ajuste absoluto (chi cuadrado, RMSEA),

ajuste relativo (CFI, TLI), ajuste parsimonioso (NFI).

EVALUACIÓN DEL AJUSTE

RE-ESPECIFICACIÓN DEL MODELO

Si el ajuste no es óptimo, el modelo puede ser re-especificado.

Las decisiones de añadir o eliminar parámetros deben estar en línea con la teoría subyacente

al modelo propuesto.

Índices de modificación y análisis de residuos pueden ser utilizados para orientar las

modificaciones del modelo.

El valor del índice de modificación corresponde aproximadamente a la reducción en el X² que

se produciría si el coeficiente fuera estimado.

Un valor > 3.84 sugiere que se obtiene una reducción estadísticamente significativa en el X²

cuando se estima el coeficiente.

La existencia de residuos elevados entre parejas de variables (> 2.58) señalaría la

necesidad de introducir parámetros adicionales susceptibles de explicar la relación entre las

variables en cuestión.

INTERPRETACIÓN DE RESULTADOS

•Extrae conclusiones significativas basadas en los datos y el ajuste del modelo.

•Proporciona una visión general del fenómeno bajo estudio basado en los resultados

del análisis de senderos.

APLICACIÓN EN R