Livestock Research for Rural Development 18 (2) 2006 | Guidelines to authors | LRRD News | Citation of this paper |
El objetivo de este estudio fue determinar el efecto de diferentes estructuras de covarianzas en la significancia estadística y en los estimadores de los efectos fijos, tomando como ejemplo los datos de cuatro hormonas en un experimento con mediciones repetidas. El estudio se realizó en una granja comercial de tres sitios con 2400 vientres en la Piedad Michoacán, México. Se utilizaron 32 cerdas de tercer parto pertenecientes a tres grupos genéticos (11 cerdas AZ, 11 cerdas B y 10 cerdas del grupo genético N) a las cuales se les tomó 10 ml de sangre para determinación de las concentraciones de las hormonas: progesterona (P4), estradiol (E2), prolactina (PRL) e insulina (INS). Las muestras de sangre se tomaron a los 3, 6, 9, 12, 15 días de lactancia. Las determinaciones de las hormonas se hicieron por medio de radioinmonoanálisis. Los datos fueron analizados utilizando anovas para medidas repetidas y procedimientos de modelos mixtos. Los anovas fueron realizados utilizando las opciones RANDOM o TEST del programa SAS. Los modelos mixtos consideraron nueve estructuras de covarianzas: componentes de varianza (CV), simetría compuesta (CS), autogresiva (AR(1)), antedependencia (ANTE(1)), Toeplitz, no estructurada (UN), CS heterogénea, AR(1) heterogénea y Toeplitz heterogénea.
Las mejores estructuras de covarianzas que describieron los datos fueron: ANTE(1), UN, CS y CS para P4, E2, PRL e INS, respectivamente. Se observaron diferencias en los niveles de significancia de los efectos fijos, principalmente de grupo genético, dependiendo de la estructura de covarianzas utilizada. Por ejemplo, para P4 el intervalo de las significancias para grupo genético fue de P = 0.0063 para la estructura CV a P = 0.1318 para Toeplitz. El efecto del tiempo de lactancia sobre las concentraciones de hormonas fue altamente significativo para todas las estructuras (P<0.001). Las medias de cuadrados mínimos generalizados y errores estándares (EE), fueron asimismo afectados por el tipo de matriz de covarianzas. Para P4 los EE más pequeños correspondieron a la estructura más simple (CV) y los mayores a las estructuras AR(1) y Toeplitz.
En conclusión, los resultados de este estudio indican que la elección de la estructura de covarianzas afecta principalmente el nivel de significancia de la prueba de F y los errores estándares de las medias. El análisis de datos de las hormonas aquí estudiadas pero con frecuencias de medición diferentes o por periodos más cortos o prolongados a los aquí investigados, así como el estudio de otras variables de respuesta, requería la exploración de diferentes estructura de covarianzas para encontrar la más apropiada.
Palabras clave: Estructura de covarianzas, hormonas, medidas repetidas, modelos mixtos
The objective of this study was to determine the effect of different covariance structures on the statistical significance and on the fixed effect estimates, using as an example the data of four hormones in a repeated measures experiment. The study was carried out in a three-sites commercial farm with 2400 sows in La Piedad Michoacan, Mexico. Thirty-two multiparous sows from three genetic groups (11 AZ, 11 B and 10 N sows) were used. Sows were bled and a 10 ml blood sample was taken to determine the concentration of progesterone (P4), estradiol (E2), prolactin (PRL) and insulin (INS). Blood samples were taken at days 3, 6, 9, 12 and 15 of lactation. Hormone assays were carried out by radioimmunoanalysis. Data were analyzed using anova repeated measures and mixed models procedures. The anova repeated analysis was carried out using the options RANDOM and TEST of the SAS programme. The mixed models considered nine covariance structures: variance components (VC), compound symmetry (CS), autoregressive (AR(1)), Toeplitz, unstructured (UN), heterogeneous CS (CSH), heterogeneous AR(1) and heterogeneous Toeplitz.
The anova repeated analysis gave similar results than the CS structure. The best covariance structures that described the data were ANTE(1), UN, CS and CS for P4, E2, PRL and INS, respectively. Differences were observed in the levels of significance of the fixed effects, mainly of genetic group, depending on the structure used. For example, for P4 the interval of significances for genetic group was from P = 0.0063 for the structure CV to P = 0.1318 for Toeplitz. The effect of time of lactation on the hormone concentrations was highly significant for all structures (P<0.001). The generalized least squares means and standard errors (SE), were also affected by the type of the covariance matrix. For P4 the lowest SE corresponded to the simplest structure (VC) and the greatest to the AR(1) and Toeplitz structures.
In conclusion, the results of this study indicate that the covariance structure selected affects the level of significance of the F test and the SE of the means. The analysis of the data for the hormones here studied but with different bleeding times or for shorter or longer periods, as well as the study of other response variables needs the exploration of different covariance structures in order to find the most appropriate.
Key words: Covariance structures, hormones, mixed models, repeated measures
Los experimentos con medidas repetidas son frecuentes en las investigaciones pecuarias (Segura y Osorio 2002, ZooBell et al 2003, Wang y Goonewardene 2004) y se refieren a aquellos casos en que se hacen varias mediciones en una misma unidad experimental. En la mayoría de los casos, las múltiples observaciones por unidad experimental son tomadas a través del tiempo, aunque podrían ser en espacio, como es el caso de los experimentos en parcelas divididas. En el análisis de datos de experimentos con mediciones repetidas en tiempo, las suposiciones usuales acerca de independencia y homogeneidad de varianzas normalmente no son válidas, ya que, a menudo, las medidas hechas en un mismo animal están correlacionadas entre si y las varianzas entre mediciones pueden ser diferentes. La metodología de modelos mixtos permite analizar correcta y eficientemente los datos de experimentos con medidas repetidas, a través del modelaje de la estructura de covarianzas que consideren las correlaciones entre medidas repetidas y la presencia de varianzas heterogéneas. El ignorar la importancia de la correlación dentro de sujetos utilizando modelos de efectos fijos (procedimientos ANOVA o GLM) o modelos mixtos con estructuras de covarianzas muy simple, podrían aumentar la tasa de error tipo I (rechazo de la hipótesis nula cuando debería ser aceptada) para la prueba de los efectos fijos del modelo, mientras que un modelo muy complicado conduciría a un sacrificio en el poder y eficiencia de la prueba para los efectos fijos (Littell et al 2000; Wang y Goonewardene 2004). La elección de la estructura de covarianzas apropiada resulta en estimadores más eficientes de los efectos fijos del modelo y consecuentemente pruebas más robustas de los efectos de las medidas repetidas. Sin embargo, la selección de la estructura de covarianzas más apropiada y parsimoniosa es complicada debido a la existencia de un gran número de estructuras posibles (SAS, 2000). Los criterios más utilizados para la elección de la mejor estructura son el criterio de información de Akaike y el criterio de información Bayesiano de Schwarz (Littell et al 1998; Wang y Goonewardene 2004).
El objetivo de este estudio fue determinar el efecto de la estructura de covarianzas en los niveles de significancia de los efectos fijos y en los estimadores de los efectos fijos, tomando como ejemplo los datos de un experimento con mediciones repetidas de las hormonas progesterona, estrógenos, prolactina e insulina.
El estudio se realizó en una granja comercial de tres sitios con 2400 vientres en la Piedad Michoacán México. Al inicio de la lactación las cerdas recibieron 2kg de alimento (15.5% de proteína cruda) aumentándose la cantidad progresivamente hasta alcanzar 6 kg/día. Se utilizaron 32 cerdas de tercer parto pertenecientes a tres grupos genéticos comerciales (11 cerdas AZ, 11 cerdas B y 10 cerdas del grupo genético N) a las cuales se les tomó 10ml de sangre para determinación de las hormonas: progesterona (P4), estradiol (E2), prolactina (PRL) e insulina (INS). Las muestras de sangre se tomaron durante la lactancia a los 3, 6, 9, 12, 15 días. Las determinaciones de las hormonas se hicieron por medio de radioinmonoanálisis (RIA) utilizando kits comerciales. Las condiciones ambientales y de manejo así como la determinación de las hormonas en sangre han sido descritas con anterioridad (Pérez Sánchez et al., en prensa).
El modelo estadístico que describió los resultados de las hormonas fue:
yijk = m + Gi + a(G)ij + Tk + eijk
donde:
yijk es la concentración de la hormona medida
en el tiempo k de la j-ésima cerda del grupo racial i;
m es el efecto de la
media general;
Gi es el efecto fijo del i-ésimo grupo
racial;
a(G)ij es el efecto aleatorio (fijo para el anova con
medidas repetidas) de cerda dentro de grupo racial,
Tk es el efecto fijo del k-ésimo
tiempo de medición (3, 6, 9, 12, 15 días),
eijk es el error
aleatorio asociado con la j-ésima cerda perteneciente al i-ésimo el grupo racial
el k-ésimo tiempo(día), eijk ~N(0, Vij) (aproximadamente normal con media 0 y
varianza Vij; donde Vij es una matriz de covarianzas con
bloques en la diagonal para cada cerda j perteneciente al grupo racial i. La
matriz de covarianzas Vij puede tomar diferentes formas dependiendo
de heterogeneidad y relación entre las mediciones
repetidas.
Los datos de las hormonas se analizaron utilizando procedimientos de análisis de varianza para mediciones repetidas, que utilizan el cuadrado medio del error de unidad experimental dentro de tratamiento para probar la hipótesis de igualdad de tratamientos y modelos mixtos, considerando diferentes estructuras de covarianza (correlaciones) de las medidas repetidas. Las estructuras de covarianzas evaluadas fueron: componentes de varianza (CV) la cual es la estructura más simple ya que asume que todas las observaciones son independientes una de otra y que no hay correlación (covarianza) entre pares de observaciones, aun cuando las mediciones se hicieron en el mismo individuo.
Esta estructura tiene varianzas iguales en la diagonal principal y ceros en los demás elementos de la matriz. La estructura de simetría compuesta (CS) considera varianzas iguales en la diagonal principal e iguales covarianzas en los demás elementos de la matriz, es decir asume una misma correlación entre observaciones independientemente de la distancia entre tiempos de medición. La estructura autoregresiva de primer orden (AR(1)) considera varianzas homogéneas . Asimismo considera que la correlaciones entre dos medidas adyacentes son iguales y que éstas declinan exponencialmente con la distancia entre mediciones .
La estructura de TOEPLITZ (TOEP) es similar a la AR(1) en que todas las mediciones próximas a la siguiente tienen la misma correlación, medidas separadas por una medición tienen la misma correlación, pero diferente de la primera, medidas separadas por dos mediciones tienen la misma correlación pero diferente de la primera y segunda y así sucesivamente. La estructura de covarianzas de primer orden y covarianzas dependientes (ANTE(1)) permite varianzas diferentes para cada medición en tiempo y correlaciones y covarianzas diferentes entre diferentes pares de medidas. La estructura de covarianzas no estructurada (UN) permite que cada término de la matriz de covarianzas sea diferente. Asimismo, se corrieron las versiones: CSH, ARH(1), TOEPH que son las versiones de las estructuras CS, AR(1) y TOEP pero considerando varianzas heterogéneas. También se probaron las estructuras CS + AR(1), CS+ARH(1) y CS+TOEP, las cuales se desecharon por tener peores valores de AICC (criterio de información de Akaike) y BIC (criterio de información bayesiano) que algunas de las estructuras anteriormente citadas.
Los anovas con medidas repetidas se corrieron utilizando las opciones RANDOM y TEST del procedimiento GLM y las nueve estructuras de covarianzas evaluadas, se corrieron utilizando la sentencia REPEATED del procedimiento MIXED (SAS 2000) la cual controla la estructura de covarianzas de los errores residuales. Las sentencias SAS utilizadas para correr los diferentes modelos se proporcionan en el Apéndice. Los datos de concentraciones de hormona se transformaron usando la función raíz cuadrada para aproximarlos a la normalidad, pero al no afectar la jerarquía de las estructuras comparadas se prefirió presentar los resultados de los datos sin transformar. Los datos transformados redujeron en 2 a 3% los niveles de significancia. La hipótesis de homogeneidad de varianzas entre mediciones se probó utilizando la prueba de Bartlett (Snedecor y Cochran 1978).
La selección de la mejor estructura de covarianzas se basó en la comparación de los criterios AICC y BIC. Estos estadísticos son funciones del logaritmo de la verosimilitudes y cuando se comparan dos estructuras aquella con los valores de los criterios más bajos indican una mejor estructura.
Las varianzas para las hormonas P4 y E2 fueron heterogéneas (P<0.05) y para PRL e INS homogéneas (P>0.05). Los intervalos de varianzas para las hormonas P4, E2, PRL e INS fueron: 0.0134-0.0375 ng2/ml2, 13.82-71.42 ng2/ml2, 7.26-9.53 ng2/ml2 y 0.4186-0.8756 ng2/ml2, respectivamente. Las razones entre las varianzas mayor y menor para las concentraciones de P4, E2, PRL e INS fueron 2.8, 5.2, 1.3 y 2.1, respectivamente. En el Cuadro 1 se presenta la matriz de covarianzas para las cuatro hormonas.
Cuadro 1. Matriz de covarianzas y correlaciones obtenida utilizando la estructura de covarianzas no estructurada (UN) para concentraciones de hormonas durante la lactancia en cerdas*. | |||||
Día de medición |
Día de medición | ||||
3 |
6 |
9 |
12 |
15 | |
Progesterona |
|
|
|
|
|
3 |
0.037 |
0.265 |
0.215 |
0.081 |
0.040 |
6 |
0.006 |
0.014 |
0.726 |
0.747 |
0.606 |
9 |
0.005 |
0.012 |
0.018 |
0.838 |
0.544 |
12 |
0.002 |
0.010 |
0.013 |
0.013 |
0.647 |
15 |
0.001 |
0.012 |
0.012 |
0.013 |
0.029 |
Estradiol |
|
|
|
|
|
3 |
71.4 |
0.328 |
0.018 |
0.188 |
0.135 |
6 |
18.8 |
46.0 |
0.537 |
0.276 |
0.315 |
9 |
1.05 |
25.4 |
48.5 |
0.141 |
0.755 |
12 |
5.91 |
6.96 |
3.65 |
13.8 |
0.233 |
15 |
5.94 |
11.1 |
27.5 |
4.53 |
27.3 |
Prolactina |
|
|
|
|
|
3 |
8.02 |
0.822 |
0.778 |
0.778 |
0.886 |
6 |
6.34 |
7.42 |
0.694 |
0.760 |
0.770 |
9 |
6.80 |
5.83 |
9.53 |
0.764 |
0.788 |
12 |
5.94 |
5.58 |
6.36 |
7.26 |
0.782 |
15 |
7.47 |
6.24 |
7.24 |
6.27 |
8.85 |
Insulina |
|
|
|
|
|
3 |
0.761 |
0.361 |
0.001 |
0.019 |
0.293 |
6 |
0.229 |
0.530 |
0.606 |
0.096 |
0.487 |
9 |
0.001 |
0.348 |
0.622 |
0.223 |
0.402 |
12 |
0.011 |
0.046 |
0.114 |
0.419 |
0.231 |
15 |
0.239 |
0.332 |
0.297 |
0.140 |
0.876 |
* Correlaciones arriba de la diagonal principal; varianzas en la diagonal; covarianzas debajo de la diagonal. |
Los resultados de los ANOVAs con medidas repetidas fueron similares a los obtenidos con la estructura del covarianzas CS del procedimiento MIXED. Lo que indica que para experimentos balanceados o ligeramente desbalanceados (como en este estudio) con varianzas homogéneas y similares correlaciones entre pares de medidas repetidas, los procedimientos de cuadrados mínimos (utilizados por GLM) proporcionan los mismos resultados que los procedimientos de máxima verosimilitud (utilizados por MIXED). Los resultados de los criterios de información (AICC y BIC) y los niveles de significancia obtenidos por los efectos de grupo genético y número de medición, para las estructuras comparadas, se presentan en los Cuadros 2-5. Con base en los criterios AICC y BIC las mejores estructuras de covarianzas que describieron los datos fueron ANTE(1), UN, CS y CS para las hormonas P4, E2, PRL e INS, respectivamente. Asimismo se observa, que las hormonas PRL e INS pudieron ser analizadas utilizando ANOVAs con medidas repetidas.
Cuadro 2. Criterios de información y niveles de significancia de la prueba de F para los efectos de grupo genético y número de medición para progesterona en sangre en cerdas | ||||
Estructura de covarianzas |
Criterios |
Efectos fijos | ||
AICC |
BIC |
Grupo genético |
Medición | |
GLM random |
|
|
0.1164 |
0.0001 |
GLM test |
|
|
0.1164 |
0.0001 |
Componente de varianza (CV) |
-122.9 |
-121.5 |
0.0063 |
0.0001 |
Simetría compuesta (CS) |
-151.9 |
-149.1 |
0.1164 |
0.0001 |
Ante-dependence ANTE(1) |
-197.7 |
-185.7 |
0.1000 |
0.0001 |
Autoregresiva AR(1) |
-165.8 |
-162.9 |
0.1303 |
0.0001 |
Toeplitz (TOEP) |
-161.0 |
-154.0 |
0.1318 |
0.0001 |
No estructurada (UN) |
-192.4 |
-174.0 |
0.1229 |
0.0001 |
CS Heterogénea |
-173.3 |
-165.5 |
0.0595 |
0.0001 |
AR(1) heterogénea |
-188.6 |
-180.4 |
0.0720 |
0.0001 |
TOEP heterogénea |
-183.4 |
-171.4 |
0.0666 |
0.0001 |
AICC = Criterio de Información de Akaike; BIC = Criterio de Información Bayesiano |
Cuadro 3. Criterios de información y niveles de significancia de la prueba de F para los efectos de grupo genético y número de medición para estradiol en sangre en cerdas | ||||
Estructura de covarianzas |
Criterios |
Efectos fijos | ||
AICC |
BIC |
Grupo genético |
Medición | |
GLM random |
|
|
0.0441 |
0.0001 |
GLM test |
|
|
0.0441 |
0.0001 |
Componente de varianza |
1024.2 |
1025.6 |
0.0063 |
0.0001 |
Simetría compuesta |
1018.7 |
1021.5 |
0.0441 |
0.0001 |
Ante-dependence |
1008.7 |
1020.6 |
0.2072 |
0.0001 |
Autoregresiva |
1014.2 |
1017.0 |
0.0467 |
0.0001 |
Toeplitz |
1017.2 |
1024.1 |
0.0740 |
0.0001 |
No estructurada |
989.1 |
1007.6 |
0.5577 |
0.0017 |
CS Heterogénea |
1006.2 |
1014.4 |
0.2745 |
0.0001 |
AR(1) heterogénea |
1005.6 |
1013.8 |
0.2089 |
0.0002 |
TOEP heterogénea |
1002.1 |
1014.0 |
0.5335 |
0.0004 |
AICC = Criterio de Información de Akaike; BIC = Criterio de Información Bayesiano |
Cuadro 4. Criterios de información y niveles de significancia de la prueba de F para los efectos de grupo genético y número de medición para prolactina en sangre en cerdas | ||||
Estructura de covarianzas |
Criterios |
Efectos fijos | ||
AICC |
BIC |
Grupo genético |
Medición | |
GLM random |
|
|
0.44590 |
0.4375 |
GLM test |
|
|
0.44590 |
0.4375 |
Componente de varianza, CV |
776.4 |
777.8 |
0.0412 |
0.9280 |
Simetría compuesta, CS |
638.2 |
641.0 |
0.4459 |
0.4375 |
Ante-dependence, ANTE(1) |
684.4 |
696.3 |
0.4645 |
0.6394 |
Autoregresiva, AR(1) |
675.2 |
678.0 |
0.4489 |
0.4878 |
Toeplitz, TOEP |
638.7 |
645.6 |
0.4266 |
0.4358 |
No estructurada, UN |
655.8 |
674.3 |
0.4105 |
0.6127 |
CS Heterogénea |
644.2 |
652.5 |
0.4994 |
0.4860 |
AR(1) heterogénea |
679.6 |
687.8 |
0.4571 |
0.5686 |
TOEP heterogénea |
645.2 |
657.1 |
0.4213 |
0.4796 |
AICC = Criterio de Información de Akaike; BIC = Criterio de Información Bayesiano |
Cuadro 5. Criterios de información y niveles de significancia de la prueba de F para los efectos de grupo genético y número de medición para insulina en sangre en cerdas | ||||
Estructura de covarianzas |
Criterio |
Efectos fijos | ||
AICC |
BIC |
Grupo genético |
Medición | |
GLM random |
|
|
0.3048 |
0.7359 |
GLM test |
|
|
0.3048 |
0.7359 |
Componente de varianza, CV |
389.5 |
390.9 |
0.0905 |
0.8296 |
Simetría compuesta, CS |
375.9 |
378.7 |
0.3048 |
0.7359 |
Ante-dependence, ANTE(1) |
381.2 |
393.1 |
0.2688 |
0.7673 |
Autoregresiva, AR(1) |
375.9 |
378.7 |
0.1608 |
0.7112 |
Toeplitz, TOEP |
378.2 |
385.1 |
0.2940 |
0.6651 |
No estructurada, UN |
383.2 |
401.7 |
0.5563 |
0.6993 |
CS Heterogénea |
379.7 |
387.9 |
0.4761 |
0.7619 |
AR(1) heterogénea |
379.1 |
387.3 |
0.2893 |
0.7313 |
TOEP heterogénea |
381.2 |
393.2 |
0.4781 |
0.6904 |
AICC = Criterio de Información de Akaike; BIC = Criterio de Información Bayesiano |
Se observaron diferencias en los niveles de significancia de los efectos fijos (principalmente de grupo genético) dependiendo de la estructura de covarianzas utilizada. Por ejemplo, para la concentración de progesterona en sangre el intervalo de significancia para el efecto de grupo genético fue P = 0.0063 para la estructura de covarianza CV y P = 0.1318 para la estructura TOEP. Esto demuestra la importancia de elegir la correcta estructura de covarianzas para la prueba de hipótesis de los efectos fijos en los experimentos con mediciones repetidas. El efecto del tiempo de lactancia sobre las concentraciones de hormonas fue altamente significativo para todas las estructuras (P<0.001).
Las medias de cuadrados mínimos generalizados y errores estándares (EE), fueron asimismo afectados por el tipo de estructura de matriz de covarianzas. Por brevedad sólo se presentan los datos para las hormona progesterona, sin embargo las medias y EE para otras hormonas también se vieron afectadas por la estructura de covarianzas seleccionada. En el Cuadro 6 se observa que los EE más pequeños correspondieron a la estructura de covarianzas más simple (CV) y los mayores a las estructuras AR(1) y TOEP.
Cuadro 6. Medias de cuadrados mínimos por grupo racial para progesterona en sangre, utilizando diferentes estructuras de covarianzas | |||
Estructura de covarianzas |
Grupo Genético | ||
AZ |
B |
N | |
GLM random |
0.183+0.032a |
0.281+0.032ab |
0.238+0.034b |
GLM test |
0.183+0.032a |
0.281+0.032b |
0.238+0.034b |
Ante dependencia, ANTE(1) |
0.183+0.031a |
0.276+0.031b |
0.244+0.032ab |
Componente de varianza |
0.183+0.020a |
0.281+0.020b |
0.238+0.021ab |
Simetría compuesta, CS |
0.183+0.032a |
0.281+0.032b |
0.238+0.034ab |
Autoregresiva, AR(1) |
0.181+0.034a |
0.282+0.034b |
0.239+0.036ab |
Toeplitz, TOEP |
0.181+0.035a |
0.282+0.035b |
0.239+0.036ab |
No estructurada, UN |
0.188+0.032a |
0.280+0.032b |
0.234+0.033ab |
CS heterogénea |
0.182+0.030a |
0.279+0.030b |
0.241+0.032ab |
AR(1) heterogénea |
0.183+0.030a |
0.279+0.030b |
0.240+0.031ab |
TOEP heterogénea |
0.183+0.029a |
0.280+0.029b |
0.240+0.031ab |
a,b Medias de grupos genéticos con diferentes superíndices indican diferencia significativa (P<0.05). |
Como se aprecia en los Cuadros 2-5, con base en los criterios AICC y BIC, la estructura que peor describe los datos fue la estructura de covarianzas denominada componentes de varianzas (VC), la cual corresponde a la estructura más simple. Esta estructura da valores similares a los obtenidos por el procedimiento GLM, considerando las medidas repetidas como independientes, por lo que no se recomienda su uso, para experimentos con medidas repetidas en tiempo. Sin embargo, para diseños de parcelas dividas en espacio es el más apropiado (Gil 2001, Segura datos inéditos). Para P4 la mejor estructura de covarianzas fue ANTE(1). Esta estructura permite varianzas heterogéneas y correlaciones diferentes entre pares de mediciones que disminuyen con el tiempo, lo cual es compatible con la matriz de covarianzas del Cuadro 1. Algunos estudios con mediciones repetidas de progesterona han analizado la información usando modelos mixtos con estructuras simples, posiblemente CV que es la estructura predeterminada por el programa SAS (Mejia-Guadarrama et al 2002; Stegner et al 2004) lo cual podría haber resultado en el rechazo de la hipótesis nula cuando debería ser aceptada y con estimadores de efectos fijos con EE más pequeños. Wang and Goonewardene (2004) encontraron que la estructura ANTE(1) fue la mejor en un experimento balanceado de crecimiento en novillas en la que compararon cinco estructuras de covarianzas.
Para E2 la mejor estructura fue UN lo que indica diferentes varianzas para cada medición y diferentes correlaciones entre medidas repetidas. Stegner et al (2004) en un experimento en el que midieron E2 en vacas utilizaron el procedimiento MIXED, no mencionan el tipo de estructura de covarianzas por lo que muy probablemente utilizaron la estructura CV. La mejor estructura de covarianzas para las hormonas PRL e INS fue CS, la cual supone homogeneidad de varianzas y covarianzas. Mejía-Guadarrama et al (2002) utilizaron el procedimiento MIXED para analizar la concentración de insulina en cerdas después del destete, con mediciones cada 15 min de 0815 a 1615 h pero no mencionan que estructura de covarianzas utilizaron por lo que posiblemente hayan utilizando la estructura predeterminada de SAS y sus resultados pudieran estar sesgados a menos que tuvieran varianzas homogéneas y no existieran correlaciones entre medidas repetidas.
La estructura de la matriz de covarianzas cambia para cada tipo de estudio, la frecuencia de mediciones, cuando existen datos perdidos o pérdida de combinaciones de tratamientos, varianzas heterogéneas etc. Esto indica que utilizar la estructura CV predeterminada por el programa SAS y otros programas pudiera resultar en sesgo en los niveles de significancia de la prueba de F y en los estimadores de efectos fijos.
Como se mencionó anteriormente, los niveles de significancia de las pruebas de hipótesis (principalmente de grupo genético) se afectaron por el tipo de estructura de covarianzas utilizada. Esto demuestra la importancia de elegir la correcta estructura de covarianzas para la prueba de hipótesis de los efectos fijos en los experimentos. Similarmente, Littell et al (1998) y Wang y Goonewardene (2004) encontraron diferencias en los niveles de significancia según la estructura de covarianzas utilizada. La estructura CV rechazó más fácilmente la hipótesis de igualdad de grupos genéticos en comparación con la estructura ANTE(1), para el caso de la hormona P4, como ejemplo. Sin embargo, el uso de estructuras de covarianza más complejas no es garantía de mayor exactitud y precisión en los experimentos con mediciones repetidas. Por ejemplo, según Littell et al (1998) una desventaja de la estructura UN es que no permite tendencias en las covarianzas con el tiempo y a menudo resulta en patrones erráticos de los errores estándares. La estructura CV, proporciona resultados similares a los obtenidos con los procedimientos GLM sin considerar la existencia de medidas repetidas.
La medias de cuadrados mínimos fueron ligeramente diferentes para las distintas estructuras de covarianzas debido a que el experimento no estaba balanceado. Experimentos balanceados y sin datos perdidos dan similares medias de cuadrados mínimos (Cnaan et al 1997, Wang y Goonewardene 2004). Sin embargo, los EE de las medias de cuadrados mínimos para datos balanceados o no, son diferentes para las distintas estructuras de covarianzas, porque son ajustadas por los parámetros de covarianzas en el modelo mixto (Littell et al 1998). Los errores estándares para CV fueron los más bajos debido a que esta estructura supone varianzas constantes con el tiempo y observaciones independientes.
Los resultados de este estudio indican que la elección de la estructura de covarianzas para el análisis de datos de experimentos con medidas repetidas en tiempo afecta principalmente el nivel de significancia de la prueba de F y los errores estándares de las medias de cuadrados mínimos. El análisis de datos de las hormonas aquí estudiadas pero con frecuencias de medición diferentes o por periodos más cortos o prolongados a los aquí investigados, así como el estudio de diferentes hormonas u otras variables de respuesta, requería el examen de diferentes estructura de covarianzas para encontrar la más apropiada.
Cnaan A, Laird N M and Slasor P 1997 Using the general linear mixed model to analyze unbalanced repeated measures and longitudinal data. Statistics in Medicine 16:2349-2380.
Gil J L 2001 Comparación de los procedimientos GLM y MIXED del SAS para analizar diseños de parcelas divididas con bloques al azar Zootecnia Tropical 19(1):43-58.
Littell R C, Henry P R and Ammerman C B 1998 Statistical analysis of repeated measures data using SAS procedures. Journal of Animal Science 76:1216-1231.
Littell R C, Pendergast J and Natarajan R 2000 Modelling covariance structure in the analysis of repeated measures data. Statistics in Medicine 19(13):1973-1819.
Mejia-Guadarrama C A, Pasquier A, Dourmad J Y, Prunier A and Quesnel H 2002 Protein (lisine) restriction in primiparous lactating sows: Effects on metabolic state, somatotropic axis, and reproductive performance after weaning. Journal of Animal Science 80:3286-3300.
SAS 2000 SAS/STAT User's Guide. Version 8. SAS Institute Inc. Cary NC, USA.
Pérez Sánchez E R, Gutiérrez Vazquez E, Montes-Pérez R C, Aké López R, Centurión Castro F y Segura Correa J C 2005 (en prensa) Efecto del genotipo, peso al parto y concentración de prolactina en el intervalo destete-estro en cerdas lactantes. Veterinaria México (Enviado).
Segura J C y Osorio M M 2002 Choice of phenotypic (co)variance structure for test day records in Bos Taurus x Bos indicus cows under a dual-purpose cattle system. Livestock Research for Rural Development 14(1). Available http://www.lrrd.org/lrrd14/1/segu141.htm
Snedecor G W y Cochran W G
1978 Métodos Estadísticos. Editorial Continental SA (CECSA) México, DF
.
Stegner J E, Kojima F N,
Bader J F, Lucy M C, Ellersieck M R, Smith M F and Patterson D J 2004
Follicular dynamics and steroid profiles in cows during and after treatment with
progestin-based protocols for synchronization of estrus. Journal of Animal
Science 82:10022-1028.
Wang Z and Goonewardene L A 2004 The use of Mixed models in the analysis of animal experiments with repeated measures data. Canadian Journal of Animal Science 84:1-11.
ZoBell D R, Goonewardene L A, Olson K C, Stonecipher C A and Weidmeier R D 2003 Effects of feeding wheat middlings on production, digestibility, ruminal fermentation and carcass characteristics in beef cattle. Canadian Journal of Animal Science 83:551-557.
*** Programa para el análisis de datos de un experimento con medidas repetidas utilizando la opción RANDOM del procedimiento GLM del SAS;
PROC GLM;
CLASSES GENO TIEMPO ANIMAL;
MODEL P4 E2 PRL INS= GENO ANIMAL(GENO) TIEMPO/SS3;
RANDOM ANIMAL(GENO)/TEST;
LSMEANS GENO/E=ANIMAL(GENO) PDIFF STDERR;
LSMEANS TIEMPO/PDIFF STDERR;
RUN;
*** Programa para el análisis de datos de un experimento con medidas repetidas utilizando la opción TEST del procedimiento GLM del SAS;
PROC GLM;
CLASSES GENO TIEMPO ANIMAL;
MODEL P4 E2 PRL INS = GENO ANIMAL(GENO) TIEMPO /SS3;
TEST H = GENO E = ANIMAL(GENO);
LSMEANS GENO/E=ANIMAL(GENO) PDIFF STDERR;
LSMEANS TIEMPO/PDIFF STDERR;
RUN;
*** Programa para el análisis de datos de un experimento con medidas repetidas utilizando el procedimiento MIXED del SAS;
PROC MIXED;
CLASSES GENO TIEMPO ANIMAL;
MODEL P4 = GENO TIEMPO/ddfm=satterth;
REPEATED TIEMPO/TYPE=SIMPLE SUBJECT=ANIMAL(GENO);
LSMEANS GENO TIEMPO /DIFF;
RUN;
QUIT;
Nota: La
estructura de covarianzas SIMPLE o CV es la opción predeterminada para TYPE = en
el procedimiento MIXED. Otras estructuras pueden ser invocadas reemplazando la
opción simple SIMPLE por la opción CS, AR(1), ANTE(1), TOEP, UN, CSH, ARH(1) o
TOEPH. Ejemplo REPEATED TIEMPO /TYPE = ANTE(1) SUBJECT =
ANIMAL(GENO);
Received 5 July 2005; Accepted 13 December 2005; Published 13 February 2006