Jornal Vascular Brasileiro
https://jvascbras.org/article/doi/10.1590/1677-5449.200185
Jornal Vascular Brasileiro
Editorial

Análise de dados ordinais em estudos clínicos e experimentais

Analysis of ordinal data in clinical and experimental studies

Hélio Amante Miot

Downloads: 0
Views: 18


Há fenômenos que são representados por certos dados qualitativos em que cada categoria mantém uma dependência hierárquica em relação a outra (por exemplo, escolaridade, classe funcional, fototipo, gravidade dos sintomas). Esses dados são chamados ordinais e não devem ser interpretados como dados qualitativos nominais, que se caracterizam por categorias completamente independentes entre si (por exemplo, estado civil, gênero, tipagem ABO, tipo de amputação, tipo de aneurisma)1, tampouco como dados quantitativos (por exemplo, idade, peso, pressão arterial, fluxo arterial), já que não existe necessariamente uma escala quantitativa fixa que separa uma categoria de outra2.

As variáveis representadas por dados de natureza ordinal são muito comuns em pesquisa biomédica e retornam conceitos claros sobre um continuum de intensidade do efeito, ordenados segundo uma sequência lógica monotônica, mas não são necessariamente proporcionais. Por essa razão, suas características demandam técnicas estatísticas específicas, cuja inobservância leva a equívocos analíticos que podem prejudicar as conclusões3,4.

Dados ordinais apresentam menor precisão da informação do que suas alternativas quantitativas, reduzindo o poder da análise. Isso se torna ainda mais sensível para os resultados quando a variável ordinal é a variável dependente do estudo. De forma pragmática, toda categorização resulta de um reducionismo arbitrário; assim, os dados devem ser originalmente coletados como variáveis quantitativas, podendo se optar pela sua ordenação posterior. Além disso, a fusão de grupos (por exemplo, o estadiamento I vs. II vs. III + IV) ou a dicotomização dessas categorias ordenadas (por exemplo, melhora vs. piora) penitencia ainda mais a informação, favorecendo o erro tipo II5,6. Dessa forma, exceto para a apresentação dos resultados ou a discussão de conceitos, não há clara vantagem analítica na ordenação de dados quantitativos, e os resultados que mostram significância apenas pela análise dos dados categorizados devem ser interpretados com cautela sob o risco de erro tipo I7. A Tabela 1 apresenta as principais variáveis ordinais empregadas em pesquisa clínica, assim como suas alternativas quantitativas, preferidas na fase exploratória do estudo.

Variáveis de natureza ordinal comumente utilizadas em estudos clínicos e experimentais e suas alternativas quantitativas para coleta dos dados.:

Variável Categorias ordinais Alternativa quantitativa
Classe funcional I, II, III, IV N.D.
Escolaridade Analfabeto, fundamental, médio, superior Anos de estudo completos
Risco anestésico da American Society of Anesthesiologists (ASA) I, II, III, IV, V N.D.
Faixa etária Infância, adolescência, adulto, idoso Idade em anos
Estadiamento do câncer I, II, III, IV N.D.
Composição física Magro, eutrófico, sobrepeso, obeso, obeso mórbido Índice de massa corporal
Palidez 0, 1+, 2+, 3+, 4+ Hematócrito
Amplitude de pulso 0, 1+, 2+, 3+, 4+ Pletismografia
Marcação histopatológica 0, 1+, 2+, 3+, 4+ Percentual de células
Satisfação Muito insatisfeito, um pouco insatisfeito, neutro, satisfeito, muito satisfeito N.D.
Status econômico Classe A, B, C, D Renda familiar
N.D. = não disponível.

 


É critério do pesquisador representar ou analisar variáveis ordinais, seja porque não haja equivalente quantitativo (por exemplo, estadiamento do câncer, satisfação, alívio de sintomas, nível de amputação), porque representam mais adequadamente um conceito relacionado ao fenômeno (por exemplo, mortalidade em cirurgias de obesos mórbidos em comparação a eutróficos) ou mesmo porque o desfecho desejado está ligado a uma categoria ordinal (por exemplo, tornar-se normotenso é mais importante que uma redução quantitativa média de 10 mmHg da pressão arterial)8.

Na etapa de descrição de dados ordinais, deve-se atentar que, como as categorias são independentes, a representação da amostra como média e desvio padrão pode não permitir sua adequada caracterização, seja porque a distribuição não é unimodal, por não ter distribuição normal nem simétrica ou mesmo pelo ponto médio não representar nenhuma das categorias (por exemplo, estadiamento médio = 2,5; pulso médio = 3,2 cruzes). Dessa forma, deve-se preferir a descrição das frequências percentuais de cada categoria (por exemplo, 10% estadiamento I, 30% II, 40% III e 20% IV), e sua representação gráfica como diagrama de frequências (Figura 1)9,10. Em casos com numerosas categorias ordinais (≥ 5), deve-se optar pela mediana seguida pelas categorias que representam os quartis (p25-p75), desde que a amostra seja unimodal, por exemplo, escala visual analógica de dor (VAS), ou a classificação de risco anestésico da American Society of Anesthesiologists (ASA)11-15.

Diagrama de frequências da variável ordinal fototipo de pele (I a VI) de casos de melasma e controles provenientes do Hospital das Clínicas de Botucatu (n = 238)9.: A análise da diferença entre dados ordinais em duas ou mais categorias deve priorizar o uso de técnicas que incorporem a direção do efeito infligida pela ordenação das categorias. As opções para a comparação de duas categorias ordinais são o teste do qui-quadrado de tendência (preferível para poucas categorias ordinais) e o teste de Mann-Whitney; enquanto o teste de Kruskall-Wallis permite comparar mais grupos. A regressão ordinal (logit ou probit), além de possibilitar a comparação de várias categorias, permite o ajuste por covariáveis (como sexo, idade, comorbidades), possibilitando a análise multivariada de dados ordinais4,13,15-19.

A Tabela 2 apresenta uma análise de frequência segundo a escolaridade, de acordo com esses métodos ordinais. A análise desses mesmos dados pelo teste do qui-quadrado de independência (dados multinomiais) retorna um χ2 = 5,33 (p = 0,135), valorizando a importância de se considerar a ordenação na análise.

Dados de uma amostra hipotética que compara a frequência de uma doença de acordo com o nível de escolaridade (n = 60).:

  Fundamental (n = 18) Médio (n = 24) Superior (n = 18) Total (n = 60)
Doentes – n (%) 12 (67) 12 (50) 6 (33) 30 (50)
Não doentes – n (%) 6 (33) 12 (50) 12 (67) 30 (50)
Qui-quadrado de tendência (χ2 = 3,93; p = 0,046). Teste de Mann-Whitney (U = 324,00; p = 0,047). Regressão logística ordinal (χ2 = 4,07; p = 0,043)

Quando se compara o comportamento de uma variável quantitativa de acordo com categorias ordinais (por exemplo, a idade dos alunos segundo a classe social), a comparação para distribuições normais e homocedásticas deve ser feita pelo teste de análise de variância (ANOVA) com contraste linear, que incorpora a ordenação das categorias e permite a inferência quanto à tendência dos grupos. Para as outras condições, pode ser utilizada sua alternativa não-paramétrica: o teste de Jonckheere-Terpstra14,20.

A análise de correlações que envolvam ao menos uma variável com dados ordinais deve ser realizada através do coeficiente rho (ρ) de Spearman ou de Kendall tau-b21. Um caso especial é a correlação entre duas variáveis ordinais com pequeno número de categorias ordinais (< 5), como acontece nos itens de questionários de qualidade de vida. Nesses casos, a correlação policórica deve ser preferida por produzir um estimador menos enviesado. Já as análises de concordância podem ser conduzidas pelo teste kappa com pesos, que oferece estimativa semelhante ao coeficiente de correlação intraclasse (CCI) para completa concordância, ou pelo teste Kendall-W22-24.

Estudos longitudinais que envolvam dados ordinais podem ser analisados a partir de modelos não-paramétricos para dados dependentes (por exemplo, testes de Wilcoxon e de Friedman)25. Porém, quando há subgrupos para serem comparados em função do tempo, as diferenças temporais podem ser comparadas quanto às mudanças de cada categoria em função de cada observação (por exemplo, teste de Mann-Whitney ou regressão logística ordinal) ou de forma mais sensível, utilizando modelos multiníveis como equações de estimativas generalizadas (GEE) ou modelos lineares generalizados de efeitos mistos, ponderados para distribuições ordinais. Esses últimos requerem a supervisão de um profissional estatístico experiente26-29.

Os instrumentos de medida compostos por itens com escores ordinais (por exemplo, inquéritos de qualidade de vida) devem ser avaliados quanto à dimensionalidade e podem ser analisados de forma mais adequada a partir de modelos que utilizem a teoria de resposta ao item (TRI) para dados ordinais30,31.

Finalmente, há certa controvérsia sobre o uso exclusivo de técnicas estatísticas ordinais (não-paramétricas) para todos os casos, visto o menor poder estatístico comparado às técnicas paramétricas. Mesmo com o uso de técnicas exatas (por exemplo, o método de Monte Carlo) para a estimativa do p-valor, as variantes não-paramétricas apresentam resultados mais conservadores quanto à rejeição da hipótese nula.

De fato, em distribuições ordinais unimodais e simétricas, à medida que a amostra se torna mais numerosa (por exemplo, n > 30), o número de categorias ordinais aumenta (por exemplo, n ≥ 5) e haja intervalos relativamente constantes entre as categorias (por exemplo, faixas etárias, estações do ano), as técnicas estatísticas paramétricas apresentam desempenho inferencial adequado para a análise de dados ordinais. Esse argumento se fundamenta no teorema do limite central6,32,33 e no exemplo da Tabela 2 (n = 60), o teste t de Student resulta em t = 2,03 (p = 0,046). Entretanto, devido à característica própria da descontinuidade e finitude dos valores ordinais, o uso de técnicas paramétricas (que os consideram valores contínuos e infinitos bilateralmente) pode levar ao inflacionamento do erro tipo I3,8,19,34,35.

A decisão de empregar variáveis ordinais na pesquisa exige descrição minuciosa na metodologia tanto dos motivos que levaram a categorizar variáveis quantitativas quanto das estratégias descritiva e analítica empregadas36.

References

1 Cardoso NA, Cisneros LL, Machado CJ, Procópio RJ, Navarro TP. Risk factors for mortality among patients undergoing major amputations due to infected diabetic feet. J Vasc Bras. 2018;17(4):296-302. http://dx.doi.org/10.1590/1677-5449.010717. PMid:30787947.

2 Greenhalgh T. How to read a paper: Statistics for the non-statistician. I: different types of data need different statistical tests. BMJ. 1997;315(7104):364-6. http://dx.doi.org/10.1136/bmj.315.7104.364. PMid:9270463.

3 Kuzon WM Jr, Urbanchek MG, McCabe S. The seven deadly sins of statistical analysis. Ann Plast Surg. 1996;37(3):265-72. http://dx.doi.org/10.1097/00000637-199609000-00006. PMid:8883724.

4 Forrest M, Andersen B. Ordinal scale and statistics in medical research. Br Med J. 1986;292(6519):537-8. http://dx.doi.org/10.1136/bmj.292.6519.537. PMid:3081161.

5 Altman DG, Royston P. The cost of dichotomising continuous variables. BMJ. 2006;332(7549):1080. http://dx.doi.org/10.1136/bmj.332.7549.1080. PMid:16675816.

6 Wang ST, Yu ML, Wang CJ, Huang CC. Bridging the gap between the pros and cons in treating ordinal scales as interval scales from an analysis point of view. Nurs Res. 1999;48(4):226-9. http://dx.doi.org/10.1097/00006199-199907000-00006. PMid:10414686.

7 Altman DG, Lausen B, Sauerbrei W, Schumacher M. Dangers of using “optimal” cutpoints in the evaluation of prognostic factors. J Natl Cancer Inst. 1994;86(11):829-35. http://dx.doi.org/10.1093/jnci/86.11.829. PMid:8182763.

8 Cliff N. Answering ordinal questions with ordinal data using ordinal statistics. Multivariate Behav Res. 1996;31(3):331-50. http://dx.doi.org/10.1207/s15327906mbr3103_4. PMid:26741071.

9 D’Elia MP, Brandao MC, Ramos BRA, et al. African ancestry is associated with facial melasma in women: a cross-sectional study. BMC Med Genet. 2017;18(1):17. http://dx.doi.org/10.1186/s12881-017-0378-7. PMid:28212612.

10 Aragão JA, Santos RM, Neves OMG, et al. Quality of life in patients with peripheral artery disease. J Vasc Bras. 2018;17(2):117-21. PMid:30377420.

11 Jakobsson U. Statistical presentation and analysis of ordinal data in nursing research. Scand J Caring Sci. 2004;18(4):437-40. http://dx.doi.org/10.1111/j.1471-6712.2004.00305.x. PMid:15598252.

12 Senn S. Analysing ordered categorical data. BMJ. 1991;302(6767):51. http://dx.doi.org/10.1136/bmj.302.6767.51-b. PMid:1888348.

13 Moses LE, Emerson JD, Hosseini H. Analyzing data from ordered categories. N Engl J Med. 1984;311(7):442-8. http://dx.doi.org/10.1056/NEJM198408163110705. PMid:6749191.

14 Miot HA. Assessing normality of data in clinical and experimental trials. J Vasc Bras. 2017;16(2):88-91. http://dx.doi.org/10.1590/1677-5449.041117. PMid:29930631.

15 LaValley MP, Felson DT. Statistical presentation and analysis of ordered categorical outcome data in rheumatology journals. Arthritis Rheum. 2002;47(3):255-9. http://dx.doi.org/10.1002/art.10453. PMid:12115154.

16 Armstrong BG, Sloan M. Ordinal regression models for epidemiologic data. Am J Epidemiol. 1989;129(1):191-204. http://dx.doi.org/10.1093/oxfordjournals.aje.a115109. PMid:2910061.

17 Bender R, Grouven U. Ordinal logistic regression in medical research. J R Coll Physicians Lond. 1997;31(5):546-51. PMid:9429194.

18 Knapp TR. Treating ordinal scales as ordinal scales. Nurs Res. 1993;42(3):184-6. http://dx.doi.org/10.1097/00006199-199305000-00011. PMid:8506169.

19 Rana S, Roy S, Das K. On analyzing ordinal data when responses and covariates are both missing at random. Stat Methods Med Res. 2016;25(4):1564-78. http://dx.doi.org/10.1177/0962280213492063. PMid:23804969.

20 Rasheed A, Ali A, Siddiqui A, Naseer M, Wasim S, Akhtar W. Non-parametric test for ordered medians: The Jonckheere Terpstra test. Int J Stat Med Res. 2015;4(2):203-7. http://dx.doi.org/10.6000/1929-6029.2015.04.02.6.

21 Miot HA. Correlation analysis in clinical and experimental studies. J Vasc Bras. 2018;17(4):275-9. http://dx.doi.org/10.1590/1677-5449.174118. PMid:30787944.

22 Miot HA. Agreement analysis in clinical and experimental trials. J Vasc Bras. 2016;15(2):89-92. http://dx.doi.org/10.1590/1677-5449.004216. PMid:29930571.

23 Brianezi G, Minicucci EM, Marques ME, Miot HA. Evaluation epidermal p53 immunostaining by digital image analysis. Skin Res Technol. 2013;19(1):e108-12. http://dx.doi.org/10.1111/j.1600-0846.2012.00616.x. PMid:22672779.

24 Brianezi G, Grandi F, Bagatin E, Enokihara MM, Miot HA. Dermal type I collagen assessment by digital image analysis. An Bras Dermatol. 2015;90(5):723-7. http://dx.doi.org/10.1590/abd1806-4841.20153331. PMid:26560217.

25 Hilton JF. The appropriateness of the Wilcoxon test in ordinal data. Stat Med. 1996;15(6):631-45. http://dx.doi.org/10.1002/(SICI)1097-0258(19960330)15:6<631::AID-SIM206>3.0.CO;2-6. PMid:8731005.

26 Doyle OM, Ashburner J, Zelaya FO, Williams SCR, Mehta MA, Marquand AF. Multivariate decoding of brain images using ordinal regression. Neuroimage. 2013;81:347-57. http://dx.doi.org/10.1016/j.neuroimage.2013.05.036. PMid:23684876.

27 Raman R, Hedeker D. A mixed-effects regression model for three-level ordinal response data. Stat Med. 2005;24(21):3331-45. http://dx.doi.org/10.1002/sim.2186. PMid:16206246.

28 Johnson TR, Kim JS. A generalized estimating equations approach to mixed-effects ordinal probit models. Br J Math Stat Psychol. 2004;57(Pt 2):295-310. http://dx.doi.org/10.1348/0007110042307177. PMid:15511310.

29 Miola AC, Ferreira ER, Lima TRR, Schmitt JV, Abbade LPF, Miot HA. Effectiveness and safety of 0.5% colchicine cream vs. photodynamic therapy with methyl aminolaevulinate in the treatment of actinic keratosis and skin field cancerization of the forearms: a randomized controlled trial. Br J Dermatol. 2018;179(5):1081-7. http://dx.doi.org/10.1111/bjd.16824. PMid:29862491.

30 Garrido LE, Abad FJ, Ponsoda V. A new look at Horn’s parallel analysis with ordinal variables. Psychol Methods. 2013;18(4):454-74. http://dx.doi.org/10.1037/a0030005. PMid:23046000.

31 Forero CG, Maydeu-Olivares A. Estimation of IRT graded response models: Limited versus full information methods. Psychol Methods. 2009;14(3):275-99. http://dx.doi.org/10.1037/a0015825. PMid:19719362.

32 Cohen ME. Analysis of ordinal dental data: evaluation of conflicting recommendations. J Dent Res. 2001;80(1):309-13. http://dx.doi.org/10.1177/00220345010800010301. PMid:11269721.

33 Kampen J, Swyngedouw M. The ordinal controversy revisited. Qual Quant. 2000;34(1):87-102. http://dx.doi.org/10.1023/A:1004785723554.

34 Kahler E, Rogausch A, Brunner E, Himmel W. A parametric analysis of ordinal quality-of-life data can lead to erroneous results. J Clin Epidemiol. 2008;61(5):475-80. http://dx.doi.org/10.1016/j.jclinepi.2007.05.019. PMid:18394541.

35 Armstrong GD. Parametric statistics and ordinal data: a pervasive misconception. Nurs Res. 1981;30(1):60-2. http://dx.doi.org/10.1097/00006199-198101000-00019. PMid:6906020.

36 Bagatin E, Miot HA. How to design and write a clinical research protocol in Cosmetic Dermatology. An Bras Dermatol. 2013;88(1):69-75. http://dx.doi.org/10.1590/S0365-05962013000100008. PMid:23539006.
 


Submitted date:
09/23/2020

Accepted date:
09/23/2020

5fa9786f0e8825081da2072e jvb Articles

J Vasc Bras

Share this page
Page Sections