CoPEP

Uma análise funcional da Wong-Baker Faces Pain Rating Scale: linearidade, discriminabilidade e amplitude

Introdução As escalas de faces tornaram-se um instrumento comum de medida da dor a partir dos anos 80, especialmente em populações pediátricas. Algumas destas escalas dispõem de extensa validação empírica, sendo apontadas em revisões sistemáticas da literatura como medidas válidas da intensidade da dor por autorrelato (Stinson, Kavanagh, Yamada, Gill, & Stevens, 2006; Tomlinson, von Baeyer, Stinson, & Sung, 2010). A Wong Baker FACES Pain Rating Scale (FACES) (Wong & Baker, 1988), composta por seis faces de dor cotadas no formato 0-10, é uma dessas escalas, tomada como objeto do presente estudo.

Várias características contribuem para a adequação de uma medida de autorrelato da dor pediátrica: aplicabilidade, baixo custo, atratividade aos olhos das crianças, pais e profissionais de saúde (von Baeyer, 2006). Ainda que desejáveis, estas características não qualificam no entanto uma escala como válida e fiável, o que depende de um outro conjunto de propriedades, designadas psicométricas. A validação de escalas pediátricas de dor assenta habitualmente no estabelecimento da sua validade de conteúdo ou de construto (Ruskin, Amaria, Warnock, & McGrath, 2011). No caso das escalas de faces, a fiabilidade é usualmente estabelecida pelo método teste-reteste (Stinson et al., 2006). A sensibilidade à mudança ou responsividade das pontuações da escala (Stinson et al., 2006; Tomlinson et al., 2010), com impacto na sua utilidade clínica (Stinson et al., 2006), é também frequentemente avaliada. O presente estudo ocupa-se de uma quarta propriedade, mais raramente considerada, a do nível de medida proporcionado pela escala (ordinal, de intervalo ou de razão (Stevens, 1946; von Baeyer, 2009).

A título ilustrativo, comparar a intensidade absoluta da dor entre indivíduos exige medidas de nível de razão, com uma unidade comum e um zero absoluto. Tais medidas raramente se encontram disponíveis em psicologia, e certamente não para a dor (von Baeyer, 2009). Comparar as pontuações de um indivíduo ao longo do tempo requer apenas uma medida de nível ordinal, permitindo considerar que a dor aumentou ou diminuiu (von Baeyer, 2009). Por fim, declarar equivalentes duas reduções na pontuação duma escala (e.g., de 6 para 4 e de 4 para 2) implica medir a dor ao nível de intervalo, isto é, numa escala com unidade constante em toda a sua extensão.

Este último exemplo ilustra o interesse particular da medida de intervalo para a gestão eficaz da dor. Estabelecer quanto uma intervenção reduz a dor, ou quanto a aumenta, representa, de um ponto de vista prático, uma vantagem assinalável. A medida de intervalo é também essencial para a investigação das interações entre determinantes da dor. Uma interação manifesta-se pela diferença de funcionamento de um fator (e.g., intervenção analgésica em crianças) em função dos níveis de outro fator (e.g., presença ou ausência dos pais), implicando assim uma comparação entre diferenças (e.g., o quanto a dor decresceu com e sem presença dos pais).

Uma escala de intervalo define-se, desde Stevens (1946), pela legitimidade de aplicar às suas pontuações transformações afins (do tipo x´= ax + b). Esta definição é unicamente formal. Não fornece meios para avaliar, em cada caso, a relação entre a escala e a dimensão psicológica inobservável que se pretende medir (e.g., a dor). Como nota Anderson (1981), a condição para que a intervalos iguais na dimensão psicológica correspondam intervalos iguais na escala de resposta é a existência de uma relação funcional linear entre a escala de resposta exterior (R) e a resposta (avaliação) interna (r), de tal modo que R = b + ar (com a e b constantes). Uma escala de intervalos iguais é assim uma escala de resposta linear e testar a existência de propriedades de intervalo equivale finalmente a testar a linearidade da escala de resposta (Anderson, 1982, 2001).

Como a larga maioria das teorias da medida, a teoria formal dos tipos de escalas (Stevens, 1946) limita-se a pressupor o problema resolvido.

Diferentemente, a teoria da Medida Funcional (Anderson, 1981, 1982) assenta num critério empírico de validação da linearidade da resposta. O estudo seguinte propõe-se testar através de medida funcional a linearidade (propriedade de intervalos iguais) das pontuações da FACES em amostras pediátricas. Sendo a linearidade uma relação funcional entre uma dimensão psicológica interna e a sua expressão numa escala de resposta, resulta claro que o nível de medida depende tanto da escala como do sujeito que responde. Esta consideração é especialmente importante na avaliação da dor pediátrica, onde aspetos desenvolvimentais podem intervir de modo decisivo (von Baeyer, 2009). Em geral, uma mesma escala de resposta pode assim ser linear num grupo etário e não noutro e/ou numa condição determinada de dor e não noutra (e.g., dor crónica e dor aguda).

Enquadramento A Teoria da Integração da Informação (TII) e a teoria da Medida Funcional (MF) constituem o quadro teórico e metodológico deste estudo. A TII é uma teoria de natureza experimental que investiga o modo como diversos elementos de informação são integrados na produção de julgamentos (e.g., quão bom é algo, quão arriscado, quão doloroso). Assenta no princípio de que qualquer processo psicológico é multideterminado (princípio da multideterminação). Utiliza por isso tarefas de integração caracterizadas pela manipulação simultânea de pelo menos dois fatores (dimensões de informação) cujas combinações os participantes avaliam, exprimindo as suas avaliações numa escala de resposta contínua (i.e., variando em grau).

Um resultado essencial da TII, estabelecido em múltiplos domínios (Anderson, 1991; Athayde & Oliveira, 2006), é que a integração de informação obedece frequentemente a um número reduzido de regras de tipo algébrico: modelos aditivo, multiplicativo e de média (Anderson, 1981). O conjunto destes modelos constitui a álgebra cognitiva, base de todos os potenciais benefícios da TII.

Se nenhum modelo de integração for empiricamente estabelecido num domínio, a TII não tem aí aplicação. Se, pelo contrário, se verificar um modelo algébrico (ou vários), torna-se possível, a partir da estrutura do modelo, (1) testar a linearidade da escala de resposta e (2) medir as variáveis de estímulo numa escala de intervalo com unidade comum (Anderson, 1982).

A lógica de validação da linearidade da resposta ilustra-se do modo mais simples no caso do modelo aditivo. Se num gráfico fatorial correspondente a uma integração com dois fatores se observar um padrão de linhas paralelas, duas condições foram necessariamente satisfeitas: (1) a regra cognitiva de integração foi aditiva; (2) o resultado interno da integração (r) foi transformado numa resposta externa (R) por um operador linear. A violação de qualquer destas condições impediria o paralelismo, pelo que a observação de paralelismo pode tomar-se como suportando as duas condições em simultâneo (Anderson, 1981). Embora mais complexos, os restantes modelos de integração fornecem constrangimentos análogos, que permitem testar a linearidade da resposta em simultâneo com o estabelecimento do modelo de integração (Anderson, 1982).

A MF depende da álgebra cognitiva, consistindo em derivar a informação métrica contida nos modelos de integração. Para que o julgamento seja expresso numa escala de resposta contínua, a integração tem de operar sobre um valor atribuído a cada uma das informações (estímulos) a combinar. Esse valor diz-se funcional, no sentido em que não preexiste nos estímulos, decorrendo unicamente do modo como funcionam na integração. Os modelos algébricos contêm assim implicitamente uma quantificação psicológica das variáveis de estímulo, que a MF se limita a tornar explícita. No caso dos modelos aditivo e multiplicativo, as médias marginais do desenho fatorial constituem medidas funcionais dos estímulos numa escala de intervalo (Anderson, 1982). No caso dos modelos de média, é necessário um processo de estimação recorrente, com o apoio de programas informáticos (Vidotto & Vicentini, 2007).

Três características da MF merecem destaque para o presente estudo. (1) Porque derivam de uma operação de integração realizada pelas próprias crianças, todas as métricas derivadas serão, por definição, adequadas à idade (desenvolvimentalmente adequadas). (2) Porque a integração ocorre em cada participante individualmente, a MF oferece a possibilidade de medir ao nível individual. Esta característica distingue-a de outras propostas de medida intervalar, como o modelo de Thurstone (Kuttner & LePage, 1989), só aplicável ao nível do grupo (Anderson, 1981). (3) A MF permite, sob certas condições, medir dois tipos de parâmetros funcionais, com significados psicológicos distintos: a magnitude ou valor de escala dos estímulos, e a sua importância ou peso para o julgamento (Anderson, 1981, 1982).

Questões de investigação O presente trabalho propõe-se investigar as propriedades métricas da FACES através de uma metodologia de Medida Funcional. Tem como primeiro objetivo verificar a existência de modelos de integração algébrica no domínio do julgamento da dor em crianças, condição para a aplicação da MF. A existirem, tais modelos implicam, por si só, a existência de um sentido métrico (intervalar) da dor nas crianças.

Avaliar a extensão da ocorrência destes modelos em crianças de diferentes idades, em particular entre as mais jovens, abaixo dos oito anos, e com diferentes experiências de dor (sem dor, dor crónica e dor pós-operatória), constitui um segundo propósito do estudo.

Um terceiro objetivo é o de testar, mantendo a perspetiva comparativa entre grupos de idade e condições de dor, o pressuposto de intervalos iguais assumido na cotação da FACES. Para além da estrutura da separação entre diferentes expressões da FACES, a amplitude total de variação da escala e a natureza dos desvios à linearidade serão objeto de comparação entre os grupos considerados.

Metodologia Participantes O estudo envolveu seis amostras de crianças distribuídas por dois grupos etários (6-8 e 9-11 anos) e três tipos de experiência de dor: 1) sem experiência regular de dor (condição sem dor); 2) dor pós-operatória (condição dor aguda); 3) dor persistente há mais de três meses (condição dor crónica). A Tabela_1 caracteriza os diferentes grupos quanto à experiência de dor, idade, género, e efetivo amostral (n). Os participantes sem dor frequentavam jardins- de-infância, colégios e escolas C + S da região Centro. As crianças na condição de pós-operatório com dor aguda encontravam-se internadas em serviços de Cirurgia, Ortopedia e Neuro Cirurgia e as crianças na condição dor crónica eram seguidas nas consultas de ambulatório dos serviços de Oncologia de dois Hospitais com serviços pediátricos. Nenhuma tarefa foi realizada por crianças sob o efeito de dor. A amostragem dos participantes foi de conveniência.

Estímulos Pares de faces esquemáticas, resultantes da combinação aos pares das seis expressões da FACES com as seis expressões da Facial Pain Scale-Revised (FPS-R) (Hicks, von Baeyer, Spafford, van Korlaar, & Goodenough, 2001) (ver Fig._1) A construção dos estímulos obedeceu aos seguintes passos: recorte das faces num editor gráfico; redimensionamento das imagens, de modo a ocuparem uma área semelhante no ecrã; montagem de todas as possíveis combinações aos pares entre expressões da FACES e da FPS-R (ver Fig._2).

Desenho Experimental e Análise de Dados Cada escala foi tomada como um fator e os níveis (expressões) das duas escalas cruzados entre si, originando 36 condições experimentais, representadas por igual número de pares de faces. Todos os participantes julgaram todos os pares de faces. A tarefa experimental correspondeu assim a um desenho fatorial completo de medidas repetidas 6 (FACES) × 6 (FPS-R). Ao desenho principal adicionaram-se os 2 subdesenhos de um fator, correspondendo à apresentação isolada de cada uma das expressões da FACES e da FPS-R. A inclusão de subdesenhos é necessária para o teste entre os modelos aditivo e de média, e para a estimação independente de valores de escala e de importância em caso de média (Anderson, 1982). A análise de dados baseou-se em ANOVAs mistas e de medidas repetidas. Nos casos de violação da esfericidade, utilizou-se a correção de Greenhouse-Geisser para os graus de liberdade.

Procedimento Os estímulos foram apresentados um a um, de forma aleatória, no ecrã de um computador. A tarefa foi realizada individualmente, em espaço reservado na própria escola ou serviço hospitalar. Um período de familiarização, compreendendo um número variável de ensaios treino, precedeu a experiência. As instruções incluíram um diálogo sobre a noção de dor e a sua variação em grau, apoiado por ilustrações. Solicitou-se às crianças que avaliassem a dor total comunicada por cada par de faces.

No grupo dos 9-11 anos as respostas foram dadas pelo posicionamento do rato numa escala gráfica horizontal, ancorada nas extremidades em nenhuma dor e muita dor, seguido de um clique. No grupo dos 6-8 anos, a resposta consistiu em premir um botão numa caixa de resposta durante um certo tempo, medido em ms. Na fase de instrução foi apresentado um cão mágico animado, controlado pela caixa de resposta, cujas lambidelas transferiam dor para um copo que surgia no ecrã, enchendo-se até ao limite máximo de 13 segundos (copo cheio). As crianças premiam o botão durante o tempo julgado necessário para que toda a dor comunicada por um par de faces fosse transferida para o copo. Durante os primeiros três segundos o copo não enchia, permitindo à criança libertar o botão sem transferir qualquer dor.

Resultados Álgebra Cognitiva Os gráficos da Figura_3 ilustram o padrão fatorial obtido nas condições sem dor e dor crónica nos dois grupos etários. Os gráficos para a condição dor aguda, omitidos por razões de espaço, apresentam um padrão similar. A convergência das linhas à direita é consistente com um modelo de média de pesos diferenciais no qual a importância das expressões de dor cresce com a sua intensidade. A linha tracejada corresponde a apresentações isoladas dos níveis do fator em abcissa (a FACES). O facto de apresentar um declive superior, cruzando as outras linhas, exclui a regra de adição e suporta a regra de média (Anderson, 1981).

As indicações da inspeção gráfica foram suportadas por ANOVAs de medidas repetidas, que documentaram em todos os grupos efeitos principais dos dois fatores e termos de interação significativos (menor F para efeitos principais = 38,4, p <,001; menor F para a interação = 2,28, p =,018).

Em todos os casos foram identificados subgrupos de crianças exibindo uma regra de média de pesos iguais, assinalada por um padrão de linhas paralelas cruzadas pela linha tracejada. Estes subgrupos foram maioritários entre as crianças mais velhas nas condições de dor aguda (14 participantes em 26) e dor crónica (13 em 20). A emergência de paralelismo nestes subgrupos contribuiu, a par do bom ajuste da regra de média (testado por ANOVAs conduzidas sobre os resíduos do modelo: ver Anderson, 1982), para validar as escalas de resposta como lineares.

Medida Funcional Com base no modelo de média estabelecido foram estimados separadamente os valores de escala e a importância das expressões em cada escala de faces, utilizando o programa R-AVERAGE (Vidotto & Vicentini, 2007). Os valores de escala refletem o espaçamento percebido entre as expressões de dor na FACES e na FPS-R, independentemente de outros fatores potencialmente envolvidos no julgamento (e.g., prioridade atencional ou ressonância afetiva de certas expressões), cujos efeitos se manifestam, por sua vez, na importância ou peso atribuído para o julgamento.

Linearidade Os gráficos reproduzidos na Figura_4 permitem comparar o perfil dos valores de escala da FACES entre grupos etários e condições de dor. Caso a FACES fosse linear (implicando intervalos percetivos iguais entre as suas expressões), as curvas do gráfico deveriam corresponder a segmentos de reta. Maior afastamento a uma reta significa assim maior afastamento ao ideal de intervalos iguais.

O painel A mostra que as crianças mais novas apresentam, globalmente, maiores desvios à linearidade. Esta indicação foi confirmada por uma interação significativa FACES × grupo etário numa ANOVA mista conduzida sobre as estimativas dos valores de escala, F(5,580) = 4,2; p <,001. O painel B mostra que, globalmente, a condição de dor não apresenta efeitos apreciáveis: as comparações estatísticas associadas concluíram pela ausência de efeitos significativos da condição de dor: F (2,12) = 2,6; p =,079 para o efeito principal; F < 1 para as interações.

Os painéis C, D, e E detalham a interação FACES × grupo etário em cada uma das condições de dor. A curva das crianças mais novas aproxima-se mais da linearidade e da curva das crianças mais velhas nas condições com dor. Apesar de não dar lugar a uma interação significativa FACES × grupo etário × condição de dor, a tendência aponta para uma melhoria da linearidade da escala, nas crianças mais novas, na condição dor crónica. O mesmo sucede com as crianças mais velhas, que apresentam o melhor ajustamento da curva ao modelo linear nessa condição (r = 0,998). Os painéis F e G detalham a interação FACES × condição de dor em cada grupo etário. No grupo dos 6-8 anos pode observar-se a melhoria da linearidade com a passagem da condição sem dor à condição dor aguda e, sobretudo, à condição dor crónica. Como indicado antes, esta tendência não teve expressão estatística. No grupo dos 9-11 anos as curvas encontram-se virtualmente sobrepostas (com uma leve vantagem do grupo com dor crónica). Os desvios à linearidade, em particular nas crianças mais novas, assumem a forma de uma curvatura negativa da porção superior da escala, contribuindo assim para reduzir a sua amplitude total de variação.

Amplitude e Discriminabilidade A Figura_5 reproduz as separações percetivas entre expressões da FACES nos seis grupos considerados. As estimativas de valores funcionais têm nível de intervalo, dando sentido à comparação de distâncias entre expressões. A estrutura geral da distribuição das expressões de dor foi replicada em todos os grupos: contiguidade percetiva das expressões 1 e 2, saliência isolada da expressão 3 e, em graus variáveis, proximidade entre as expressões 4, 5 e 6.

A amplitude de variação da escala (diferença entre o valor máximo e o valor mínimo) é claramente inferior nas crianças com 6-8 anos. A comparação das distribuições de amplitude numa ANOVA com grupo etário e condição de dor como fatores entre-sujeitos confirmou a existência de um efeito significativo do grupo etário, F (1,116) = 87,34, p <,001. Nem a condição de dor nem a interação grupo etário × condição de dor produziram resultados significativos, F < 1,7.

A ordenação média das expressões obedeceu em todos os grupos à ordem normativa da FACES. A questão de saber se expressões de dor consecutivas são discrimináveis entre si não coincide inteiramente com a da sua separação percetiva, referindo-se antes à consistência com que são discriminadas. Tomamos aqui como indicador de discriminabilidade a existência de uma diferença significativa (critério: p = ,025) entre os valores de duas faces de dor. As médias dos valores funcionais das diferentes faces foram comparadas em cada grupo através de uma ANOVA de medidas repetidas, seguida de testes de comparação múltipla entre pares de faces. As chavetas inseridas na Figura_5 assinalam diferenças significativas entre expressões, ilustrando assim o perfil de discriminabilidade nos diferentes grupos.

O maior número de intervalos discrimináveis no grupo dos 6-8 anos foi de 3 (envolvendo 4 níveis de expressão, um dos quais agregando as faces 4 e 5). No grupo dos 9-11 anos, o número de intervalos foi de 3 na condição sem dor e de 4 nas restantes condições, envolvendo assim a discriminação de 5 níveis de expressão. Como notado na secção anterior, a melhor aproximação ao ideal de intervalos iguais regista-se entre as crianças mais velhas, na condição dor crónica.

Discussão Os resultados documentam a viabilidade da utilização duma metodologia de integração da informação no domínio da avaliação da dor em crianças jovens (e.g., 6 anos). Saber se no caso da avaliação da dor esta metodologia poderá estender-se a idades inferiores a 6 anos é uma questão empírica em aberto. O facto das crianças em ambos os grupos etários fornecerem padrões de integração algébricos significa que mesmo as crianças mais jovens foram capazes de uma compreensão intervalar, e não apenas ordinal, da dor.

Em ambos os grupos de idade e em todas as condições de dor o modelo de integração verificado foi de média, com maior prevalência de médias de pesos iguais (igual importância concedida a todas as expressões da escala) no grupo dos 9-11 anos. A estrutura geral da separação percetiva entre as expressões, derivada por medida funcional, foi replicada em todos os grupos: indistinção das duas faces iniciais, saliência percetiva da face 3 e compressão relativa dos intervalos entre os três últimos níveis da escala. A replicação consecutiva desta estrutura demonstra a sua consistência e generalidade, afastando objeções baseadas no efetivo relativamente reduzido dos grupos que realizaram a tarefa (para o papel da replicação no estabelecimento da generalidade dos resultados ver Anderson, 2001).

Os participantes nas condições de dor crónica apresentam a melhor aproximação ao ideal de intervalos iguais em ambos os grupos etários. Isso poderá dever-se a uma experiência mais consolidada da variação quantitativa da dor, ou a um contacto mais frequente com instrumentos de avaliação da dor. Este resultado confirma a linearidade como uma propriedade dependente tanto da escala como do sujeito que responde e, a esse título, suscetível de aperfeiçoamento pela aprendizagem.

O padrão de discriminabilidade entre expressões revelou que as crianças mais jovens podiam apenas distinguir entre quatro níveis de expressão da dor (dois deles agregados: faces 1-2 e 4-5). Sendo o primeiro nível representado como a ausência de dor, os níveis de dor discrimináveis na FACES foram assim em número de 3. Esta indicação é consistente com dados da literatura que apontam para a distinção de dois ou três níveis de dor entre os três e os sete anos (Belter, McIntosh, Finch Jr., & Sylor, 1988; Decruynaere, Thonnard, & Plaghki, 2009). Nas crianças mais velhas, nas condições de dor aguda e crónica, este número subiu para 4 (5, se incluída a ausência de dor).

A medida das expressões da FACES ao nível de intervalo abre caminho à utilização de critérios gerais para a identificação de diferenças clinicamente significativas. Alterações de 10 a 20% nas pontuações da Escala Visual Analógica (VAS) para a dor têm sido apontadas como clinicamente significativas (Powell, Kelly, & Williams, 2001). Numa escala como a FACES, isto corresponderia a uma alteração de uma ou duas faces. A incerteza quanto à propriedade de intervalos iguais não permitia todavia garantir que essa alteração tivesse o mesmo significado em diferentes pontos da escala (Bulloch & Tenenbein, 2002). Diferentemente, uma vez localizadas as expressões numa métrica de intervalo (ver Figura_5), a percentagem de referência (10-20%) pode legitimamente aplicar-se, esclarecendo quais as diferenças entre expressões que satisfazem o critério de significância clínica.

Conclusão A FACES apresentou desvios assinaláveis à linearidade. Estes desvios operam genericamente no sentido de diminuir a amplitude de variação da escala, reduzindo os espaçamentos entre os três últimos níveis. Os valores dos dois primeiros níveis (expressões com sorrisos) não se mostraram discrimináveis entre si em nenhum dos grupos. Constituem assim elementos informativos redundantes, sendo razoável sugerir a eliminação de um deles. Em geral, a prática de cotar a FACES numa métrica de 0 a 10, com intervalos iguais de duas unidades, não parece justificável. Os desvios à linearidade foram mais pronunciados no grupo das crianças mais novas, e menos acentuados na condição de dor crónica. Em crianças com idades inferiores a oito anos, deverá por isso evitar tratar-se as pontuações da FACES como medidas de intervalo. Em crianças acima dos oito anos e com um historial de dor crónica parece razoável tomá-las como uma aproximação a medidas de nível intervalar.

EuPTCVHe0874-02832014000300014

EuPTCVHe0874-02832014000300014

Opções de representação