Uma análise funcional da Wong-Baker Faces Pain Rating Scale: linearidade,
discriminabilidade e amplitude
Introdução
As escalas de faces tornaram-se um instrumento comum de medida da dor a partir
dos anos 80, especialmente em populações pediátricas. Algumas destas escalas
dispõem de extensa validação empírica, sendo apontadas em revisões sistemáticas
da literatura como medidas válidas da intensidade da dor por autorrelato
(Stinson, Kavanagh, Yamada, Gill, & Stevens, 2006; Tomlinson, von Baeyer,
Stinson, & Sung, 2010). A Wong Baker FACES Pain Rating Scale (FACES) (Wong
& Baker, 1988), composta por seis faces de dor cotadas no formato 0-10, é
uma dessas escalas, tomada como objeto do presente estudo.
Várias características contribuem para a adequação de uma medida de autorrelato
da dor pediátrica: aplicabilidade, baixo custo, atratividade aos olhos das
crianças, pais e profissionais de saúde (von Baeyer, 2006). Ainda que
desejáveis, estas características não qualificam no entanto uma escala como
válida e fiável, o que depende de um outro conjunto de propriedades, designadas
psicométricas. A validação de escalas pediátricas de dor assenta habitualmente
no estabelecimento da sua validade de conteúdo ou de construto (Ruskin, Amaria,
Warnock, & McGrath, 2011). No caso das escalas de faces, a fiabilidade é
usualmente estabelecida pelo método teste-reteste (Stinson et al., 2006). A
sensibilidade à mudança ou responsividade das pontuações da escala (Stinson et
al., 2006; Tomlinson et al., 2010), com impacto na sua utilidade clínica
(Stinson et al., 2006), é também frequentemente avaliada. O presente estudo
ocupa-se de uma quarta propriedade, mais raramente considerada, a do nível de
medida proporcionado pela escala (ordinal, de intervalo ou de razão (Stevens,
1946; von Baeyer, 2009).
A título ilustrativo, comparar a intensidade absoluta da dor entre indivíduos
exige medidas de nível de razão, com uma unidade comum e um zero absoluto. Tais
medidas raramente se encontram disponíveis em psicologia, e certamente não para
a dor (von Baeyer, 2009). Comparar as pontuações de um indivíduo ao longo do
tempo requer apenas uma medida de nível ordinal, permitindo considerar que a
dor aumentou ou diminuiu (von Baeyer, 2009). Por fim, declarar equivalentes
duas reduções na pontuação duma escala (e.g., de 6 para 4 e de 4 para 2)
implica medir a dor ao nível de intervalo, isto é, numa escala com unidade
constante em toda a sua extensão.
Este último exemplo ilustra o interesse particular da medida de intervalo para
a gestão eficaz da dor. Estabelecer quanto uma intervenção reduz a dor, ou
quanto a aumenta, representa, de um ponto de vista prático, uma vantagem
assinalável. A medida de intervalo é também essencial para a investigação das
interações entre determinantes da dor. Uma interação manifesta-se pela
diferença de funcionamento de um fator (e.g., intervenção analgésica em
crianças) em função dos níveis de outro fator (e.g., presença ou ausência dos
pais), implicando assim uma comparação entre diferenças (e.g., o quanto a dor
decresceu com e sem presença dos pais).
Uma escala de intervalo define-se, desde Stevens (1946), pela legitimidade de
aplicar às suas pontuações transformações afins (do tipo x´= ax + b). Esta
definição é unicamente formal. Não fornece meios para avaliar, em cada caso, a
relação entre a escala e a dimensão psicológica inobservável que se pretende
medir (e.g., a dor). Como nota Anderson (1981), a condição para que a
intervalos iguais na dimensão psicológica correspondam intervalos iguais na
escala de resposta é a existência de uma relação funcional linear entre a
escala de resposta exterior (R) e a resposta (avaliação) interna (r), de tal
modo que R = b + ar (com a e b constantes). Uma escala de intervalos iguais é
assim uma escala de resposta linear e testar a existência de propriedades de
intervalo equivale finalmente a testar a linearidade da escala de resposta
(Anderson, 1982, 2001).
Como a larga maioria das teorias da medida, a teoria formal dos tipos de
escalas (Stevens, 1946) limita-se a pressupor o problema resolvido.
Diferentemente, a teoria da Medida Funcional (Anderson, 1981, 1982) assenta num
critério empírico de validação da linearidade da resposta. O estudo seguinte
propõe-se testar através de medida funcional a linearidade (propriedade de
intervalos iguais) das pontuações da FACES em amostras pediátricas. Sendo a
linearidade uma relação funcional entre uma dimensão psicológica interna e a
sua expressão numa escala de resposta, resulta claro que o nível de medida
depende tanto da escala como do sujeito que responde. Esta consideração é
especialmente importante na avaliação da dor pediátrica, onde aspetos
desenvolvimentais podem intervir de modo decisivo (von Baeyer, 2009). Em geral,
uma mesma escala de resposta pode assim ser linear num grupo etário e não
noutro e/ou numa condição determinada de dor e não noutra (e.g., dor crónica e
dor aguda).
Enquadramento
A Teoria da Integração da Informação (TII) e a teoria da Medida Funcional (MF)
constituem o quadro teórico e metodológico deste estudo. A TII é uma teoria de
natureza experimental que investiga o modo como diversos elementos de
informação são integrados na produção de julgamentos (e.g., quão bom é algo,
quão arriscado, quão doloroso). Assenta no princípio de que qualquer processo
psicológico é multideterminado (princípio da multideterminação). Utiliza por
isso tarefas de integração caracterizadas pela manipulação simultânea de pelo
menos dois fatores (dimensões de informação) cujas combinações os participantes
avaliam, exprimindo as suas avaliações numa escala de resposta contínua (i.e.,
variando em grau).
Um resultado essencial da TII, estabelecido em múltiplos domínios (Anderson,
1991; Athayde & Oliveira, 2006), é que a integração de informação obedece
frequentemente a um número reduzido de regras de tipo algébrico: modelos
aditivo, multiplicativo e de média (Anderson, 1981). O conjunto destes modelos
constitui a álgebra cognitiva, base de todos os potenciais benefícios da TII.
Se nenhum modelo de integração for empiricamente estabelecido num domínio, a
TII não tem aí aplicação. Se, pelo contrário, se verificar um modelo algébrico
(ou vários), torna-se possível, a partir da estrutura do modelo, (1) testar a
linearidade da escala de resposta e (2) medir as variáveis de estímulo numa
escala de intervalo com unidade comum (Anderson, 1982).
A lógica de validação da linearidade da resposta ilustra-se do modo mais
simples no caso do modelo aditivo. Se num gráfico fatorial correspondente a uma
integração com dois fatores se observar um padrão de linhas paralelas, duas
condições foram necessariamente satisfeitas: (1) a regra cognitiva de
integração foi aditiva; (2) o resultado interno da integração (r) foi
transformado numa resposta externa (R) por um operador linear. A violação de
qualquer destas condições impediria o paralelismo, pelo que a observação de
paralelismo pode tomar-se como suportando as duas condições em simultâneo
(Anderson, 1981). Embora mais complexos, os restantes modelos de integração
fornecem constrangimentos análogos, que permitem testar a linearidade da
resposta em simultâneo com o estabelecimento do modelo de integração (Anderson,
1982).
A MF depende da álgebra cognitiva, consistindo em derivar a informação métrica
contida nos modelos de integração. Para que o julgamento seja expresso numa
escala de resposta contínua, a integração tem de operar sobre um valor
atribuído a cada uma das informações (estímulos) a combinar. Esse valor diz-se
funcional, no sentido em que não preexiste nos estímulos, decorrendo unicamente
do modo como funcionam na integração. Os modelos algébricos contêm assim
implicitamente uma quantificação psicológica das variáveis de estímulo, que a
MF se limita a tornar explícita. No caso dos modelos aditivo e multiplicativo,
as médias marginais do desenho fatorial constituem medidas funcionais dos
estímulos numa escala de intervalo (Anderson, 1982). No caso dos modelos de
média, é necessário um processo de estimação recorrente, com o apoio de
programas informáticos (Vidotto & Vicentini, 2007).
Três características da MF merecem destaque para o presente estudo. (1) Porque
derivam de uma operação de integração realizada pelas próprias crianças, todas
as métricas derivadas serão, por definição, adequadas à idade
(desenvolvimentalmente adequadas). (2) Porque a integração ocorre em cada
participante individualmente, a MF oferece a possibilidade de medir ao nível
individual. Esta característica distingue-a de outras propostas de medida
intervalar, como o modelo de Thurstone (Kuttner & LePage, 1989), só
aplicável ao nível do grupo (Anderson, 1981). (3) A MF permite, sob certas
condições, medir dois tipos de parâmetros funcionais, com significados
psicológicos distintos: a magnitude ou valor de escala dos estímulos, e a sua
importância ou peso para o julgamento (Anderson, 1981, 1982).
Questões de investigação
O presente trabalho propõe-se investigar as propriedades métricas da FACES
através de uma metodologia de Medida Funcional. Tem como primeiro objetivo
verificar a existência de modelos de integração algébrica no domínio do
julgamento da dor em crianças, condição para a aplicação da MF. A existirem,
tais modelos implicam, por si só, a existência de um sentido métrico
(intervalar) da dor nas crianças.
Avaliar a extensão da ocorrência destes modelos em crianças de diferentes
idades, em particular entre as mais jovens, abaixo dos oito anos, e com
diferentes experiências de dor (sem dor, dor crónica e dor pós-operatória),
constitui um segundo propósito do estudo.
Um terceiro objetivo é o de testar, mantendo a perspetiva comparativa entre
grupos de idade e condições de dor, o pressuposto de intervalos iguais assumido
na cotação da FACES. Para além da estrutura da separação entre diferentes
expressões da FACES, a amplitude total de variação da escala e a natureza dos
desvios à linearidade serão objeto de comparação entre os grupos considerados.
Metodologia
Participantes
O estudo envolveu seis amostras de crianças distribuídas por dois grupos
etários (6-8 e 9-11 anos) e três tipos de experiência de dor: 1) sem
experiência regular de dor (condição sem dor); 2) dor pós-operatória (condição
dor aguda); 3) dor persistente há mais de três meses (condição dor crónica). A
Tabela_1 caracteriza os diferentes grupos quanto à experiência de dor, idade,
género, e efetivo amostral (n). Os participantes sem dor frequentavam jardins-
de-infância, colégios e escolas C + S da região Centro. As crianças na condição
de pós-operatório com dor aguda encontravam-se internadas em serviços de
Cirurgia, Ortopedia e Neuro Cirurgia e as crianças na condição dor crónica eram
seguidas nas consultas de ambulatório dos serviços de Oncologia de dois
Hospitais com serviços pediátricos. Nenhuma tarefa foi realizada por crianças
sob o efeito de dor. A amostragem dos participantes foi de conveniência.
Estímulos
Pares de faces esquemáticas, resultantes da combinação aos pares das seis
expressões da FACES com as seis expressões da Facial Pain Scale-Revised (FPS-R)
(Hicks, von Baeyer, Spafford, van Korlaar, & Goodenough, 2001) (ver Fig._1)
A construção dos estímulos obedeceu aos seguintes passos: recorte das faces num
editor gráfico; redimensionamento das imagens, de modo a ocuparem uma área
semelhante no ecrã; montagem de todas as possíveis combinações aos pares entre
expressões da FACES e da FPS-R (ver Fig._2).
Desenho Experimental e Análise de Dados
Cada escala foi tomada como um fator e os níveis (expressões) das duas escalas
cruzados entre si, originando 36 condições experimentais, representadas por
igual número de pares de faces. Todos os participantes julgaram todos os pares
de faces. A tarefa experimental correspondeu assim a um desenho fatorial
completo de medidas repetidas 6 (FACES) × 6 (FPS-R). Ao desenho principal
adicionaram-se os 2 subdesenhos de um fator, correspondendo à apresentação
isolada de cada uma das expressões da FACES e da FPS-R. A inclusão de
subdesenhos é necessária para o teste entre os modelos aditivo e de média, e
para a estimação independente de valores de escala e de importância em caso de
média (Anderson, 1982). A análise de dados baseou-se em ANOVAs mistas e de
medidas repetidas. Nos casos de violação da esfericidade, utilizou-se a
correção de Greenhouse-Geisser para os graus de liberdade.
Procedimento
Os estímulos foram apresentados um a um, de forma aleatória, no ecrã de um
computador. A tarefa foi realizada individualmente, em espaço reservado na
própria escola ou serviço hospitalar. Um período de familiarização,
compreendendo um número variável de ensaios treino, precedeu a experiência. As
instruções incluíram um diálogo sobre a noção de dor e a sua variação em grau,
apoiado por ilustrações. Solicitou-se às crianças que avaliassem a dor total
comunicada por cada par de faces.
No grupo dos 9-11 anos as respostas foram dadas pelo posicionamento do rato
numa escala gráfica horizontal, ancorada nas extremidades em nenhuma dor e
muita dor, seguido de um clique. No grupo dos 6-8 anos, a resposta consistiu em
premir um botão numa caixa de resposta durante um certo tempo, medido em ms. Na
fase de instrução foi apresentado um cão mágico animado, controlado pela caixa
de resposta, cujas lambidelas transferiam dor para um copo que surgia no ecrã,
enchendo-se até ao limite máximo de 13 segundos (copo cheio). As crianças
premiam o botão durante o tempo julgado necessário para que toda a dor
comunicada por um par de faces fosse transferida para o copo. Durante os
primeiros três segundos o copo não enchia, permitindo à criança libertar o
botão sem transferir qualquer dor.
Resultados
Álgebra Cognitiva
Os gráficos da Figura_3 ilustram o padrão fatorial obtido nas condições sem dor
e dor crónica nos dois grupos etários. Os gráficos para a condição dor aguda,
omitidos por razões de espaço, apresentam um padrão similar. A convergência das
linhas à direita é consistente com um modelo de média de pesos diferenciais no
qual a importância das expressões de dor cresce com a sua intensidade. A linha
tracejada corresponde a apresentações isoladas dos níveis do fator em abcissa
(a FACES). O facto de apresentar um declive superior, cruzando as outras
linhas, exclui a regra de adição e suporta a regra de média (Anderson, 1981).
As indicações da inspeção gráfica foram suportadas por ANOVAs de medidas
repetidas, que documentaram em todos os grupos efeitos principais dos dois
fatores e termos de interação significativos (menor F para efeitos principais =
38,4, p <,001; menor F para a interação = 2,28, p =,018).
Em todos os casos foram identificados subgrupos de crianças exibindo uma regra
de média de pesos iguais, assinalada por um padrão de linhas paralelas cruzadas
pela linha tracejada. Estes subgrupos foram maioritários entre as crianças mais
velhas nas condições de dor aguda (14 participantes em 26) e dor crónica (13 em
20). A emergência de paralelismo nestes subgrupos contribuiu, a par do bom
ajuste da regra de média (testado por ANOVAs conduzidas sobre os resíduos do
modelo: ver Anderson, 1982), para validar as escalas de resposta como lineares.
Medida Funcional
Com base no modelo de média estabelecido foram estimados separadamente os
valores de escala e a importância das expressões em cada escala de faces,
utilizando o programa R-AVERAGE (Vidotto & Vicentini, 2007). Os valores de
escala refletem o espaçamento percebido entre as expressões de dor na FACES e
na FPS-R, independentemente de outros fatores potencialmente envolvidos no
julgamento (e.g., prioridade atencional ou ressonância afetiva de certas
expressões), cujos efeitos se manifestam, por sua vez, na importância ou peso
atribuído para o julgamento.
Linearidade
Os gráficos reproduzidos na Figura_4 permitem comparar o perfil dos valores de
escala da FACES entre grupos etários e condições de dor. Caso a FACES fosse
linear (implicando intervalos percetivos iguais entre as suas expressões), as
curvas do gráfico deveriam corresponder a segmentos de reta. Maior afastamento
a uma reta significa assim maior afastamento ao ideal de intervalos iguais.
O painel A mostra que as crianças mais novas apresentam, globalmente, maiores
desvios à linearidade. Esta indicação foi confirmada por uma interação
significativa FACES × grupo etário numa ANOVA mista conduzida sobre as
estimativas dos valores de escala, F(5,580) = 4,2; p <,001. O painel B mostra
que, globalmente, a condição de dor não apresenta efeitos apreciáveis: as
comparações estatísticas associadas concluíram pela ausência de efeitos
significativos da condição de dor: F (2,12) = 2,6; p =,079 para o efeito
principal; F < 1 para as interações.
Os painéis C, D, e E detalham a interação FACES × grupo etário em cada uma das
condições de dor. A curva das crianças mais novas aproxima-se mais da
linearidade e da curva das crianças mais velhas nas condições com dor. Apesar
de não dar lugar a uma interação significativa FACES × grupo etário × condição
de dor, a tendência aponta para uma melhoria da linearidade da escala, nas
crianças mais novas, na condição dor crónica. O mesmo sucede com as crianças
mais velhas, que apresentam o melhor ajustamento da curva ao modelo linear
nessa condição (r = 0,998). Os painéis F e G detalham a interação FACES ×
condição de dor em cada grupo etário. No grupo dos 6-8 anos pode observar-se a
melhoria da linearidade com a passagem da condição sem dor à condição dor aguda
e, sobretudo, à condição dor crónica. Como indicado antes, esta tendência não
teve expressão estatística. No grupo dos 9-11 anos as curvas encontram-se
virtualmente sobrepostas (com uma leve vantagem do grupo com dor crónica). Os
desvios à linearidade, em particular nas crianças mais novas, assumem a forma
de uma curvatura negativa da porção superior da escala, contribuindo assim para
reduzir a sua amplitude total de variação.
Amplitude e Discriminabilidade
A Figura_5 reproduz as separações percetivas entre expressões da FACES nos seis
grupos considerados. As estimativas de valores funcionais têm nível de
intervalo, dando sentido à comparação de distâncias entre expressões. A
estrutura geral da distribuição das expressões de dor foi replicada em todos os
grupos: contiguidade percetiva das expressões 1 e 2, saliência isolada da
expressão 3 e, em graus variáveis, proximidade entre as expressões 4, 5 e 6.
A amplitude de variação da escala (diferença entre o valor máximo e o valor
mínimo) é claramente inferior nas crianças com 6-8 anos. A comparação das
distribuições de amplitude numa ANOVA com grupo etário e condição de dor como
fatores entre-sujeitos confirmou a existência de um efeito significativo do
grupo etário, F (1,116) = 87,34, p <,001. Nem a condição de dor nem a interação
grupo etário × condição de dor produziram resultados significativos, F < 1,7.
A ordenação média das expressões obedeceu em todos os grupos à ordem normativa
da FACES. A questão de saber se expressões de dor consecutivas são
discrimináveis entre si não coincide inteiramente com a da sua separação
percetiva, referindo-se antes à consistência com que são discriminadas. Tomamos
aqui como indicador de discriminabilidade a existência de uma diferença
significativa (critério: p = ,025) entre os valores de duas faces de dor. As
médias dos valores funcionais das diferentes faces foram comparadas em cada
grupo através de uma ANOVA de medidas repetidas, seguida de testes de
comparação múltipla entre pares de faces. As chavetas inseridas na Figura_5
assinalam diferenças significativas entre expressões, ilustrando assim o perfil
de discriminabilidade nos diferentes grupos.
O maior número de intervalos discrimináveis no grupo dos 6-8 anos foi de 3
(envolvendo 4 níveis de expressão, um dos quais agregando as faces 4 e 5). No
grupo dos 9-11 anos, o número de intervalos foi de 3 na condição sem dor e de 4
nas restantes condições, envolvendo assim a discriminação de 5 níveis de
expressão. Como notado na secção anterior, a melhor aproximação ao ideal de
intervalos iguais regista-se entre as crianças mais velhas, na condição dor
crónica.
Discussão
Os resultados documentam a viabilidade da utilização duma metodologia de
integração da informação no domínio da avaliação da dor em crianças jovens
(e.g., 6 anos). Saber se no caso da avaliação da dor esta metodologia poderá
estender-se a idades inferiores a 6 anos é uma questão empírica em aberto. O
facto das crianças em ambos os grupos etários fornecerem padrões de integração
algébricos significa que mesmo as crianças mais jovens foram capazes de uma
compreensão intervalar, e não apenas ordinal, da dor.
Em ambos os grupos de idade e em todas as condições de dor o modelo de
integração verificado foi de média, com maior prevalência de médias de pesos
iguais (igual importância concedida a todas as expressões da escala) no grupo
dos 9-11 anos. A estrutura geral da separação percetiva entre as expressões,
derivada por medida funcional, foi replicada em todos os grupos: indistinção
das duas faces iniciais, saliência percetiva da face 3 e compressão relativa
dos intervalos entre os três últimos níveis da escala. A replicação consecutiva
desta estrutura demonstra a sua consistência e generalidade, afastando objeções
baseadas no efetivo relativamente reduzido dos grupos que realizaram a tarefa
(para o papel da replicação no estabelecimento da generalidade dos resultados
ver Anderson, 2001).
Os participantes nas condições de dor crónica apresentam a melhor aproximação
ao ideal de intervalos iguais em ambos os grupos etários. Isso poderá dever-se
a uma experiência mais consolidada da variação quantitativa da dor, ou a um
contacto mais frequente com instrumentos de avaliação da dor. Este resultado
confirma a linearidade como uma propriedade dependente tanto da escala como do
sujeito que responde e, a esse título, suscetível de aperfeiçoamento pela
aprendizagem.
O padrão de discriminabilidade entre expressões revelou que as crianças mais
jovens podiam apenas distinguir entre quatro níveis de expressão da dor (dois
deles agregados: faces 1-2 e 4-5). Sendo o primeiro nível representado como a
ausência de dor, os níveis de dor discrimináveis na FACES foram assim em número
de 3. Esta indicação é consistente com dados da literatura que apontam para a
distinção de dois ou três níveis de dor entre os três e os sete anos (Belter,
McIntosh, Finch Jr., & Sylor, 1988; Decruynaere, Thonnard, & Plaghki,
2009). Nas crianças mais velhas, nas condições de dor aguda e crónica, este
número subiu para 4 (5, se incluída a ausência de dor).
A medida das expressões da FACES ao nível de intervalo abre caminho à
utilização de critérios gerais para a identificação de diferenças clinicamente
significativas. Alterações de 10 a 20% nas pontuações da Escala Visual
Analógica (VAS) para a dor têm sido apontadas como clinicamente significativas
(Powell, Kelly, & Williams, 2001). Numa escala como a FACES, isto
corresponderia a uma alteração de uma ou duas faces. A incerteza quanto à
propriedade de intervalos iguais não permitia todavia garantir que essa
alteração tivesse o mesmo significado em diferentes pontos da escala (Bulloch
& Tenenbein, 2002). Diferentemente, uma vez localizadas as expressões numa
métrica de intervalo (ver Figura_5), a percentagem de referência (10-20%) pode
legitimamente aplicar-se, esclarecendo quais as diferenças entre expressões que
satisfazem o critério de significância clínica.
Conclusão
A FACES apresentou desvios assinaláveis à linearidade. Estes desvios operam
genericamente no sentido de diminuir a amplitude de variação da escala,
reduzindo os espaçamentos entre os três últimos níveis. Os valores dos dois
primeiros níveis (expressões com sorrisos) não se mostraram discrimináveis
entre si em nenhum dos grupos. Constituem assim elementos informativos
redundantes, sendo razoável sugerir a eliminação de um deles. Em geral, a
prática de cotar a FACES numa métrica de 0 a 10, com intervalos iguais de duas
unidades, não parece justificável. Os desvios à linearidade foram mais
pronunciados no grupo das crianças mais novas, e menos acentuados na condição
de dor crónica. Em crianças com idades inferiores a oito anos, deverá por isso
evitar tratar-se as pontuações da FACES como medidas de intervalo. Em crianças
acima dos oito anos e com um historial de dor crónica parece razoável tomá-las
como uma aproximação a medidas de nível intervalar.