Bron:

| 1607 x gelezen

De grootste studie naar herhaalde cardiopulmonale inspanningstesten bij myalgische encefalomyelitis/ chronischevermoeidheidssyndroom (ME/cvs) kon geen sterk effect vinden. Afnames tijdens de tweede inspanningstest zijn ook aanwezig in veel gezonde controles en correleren niet goed met functionele beperkingen. Deze resultaten zetten vraagtekens bij de validiteit van 2-daagse inspanningstesten als diagnostische biomarker voor ME/cvs of malaise na inspanning. 

Dit hoeft echter niet het einde van het verhaal te zijn. ME/cvs-patiënten gaan meer achteruit dan controles op de meeste uitkomsten en de gegevens over piek-VO2 en werkbelasting bij de ventilatoire drempel zijn consistent met een klein tot matig effect.

Inleiding

Herhaalde inspanningstesten, uitgevoerd op opeenvolgende dagen, zijn de afgelopen 15 jaar een van de meest opwindende benaderingen geweest in ME/cvs-onderzoek. Inspanningstesten bieden een objectieve meting van cardiopulmonale fitheid en studiedeelnemers kunnen normaal gesproken hun resultaten op de tweede dag reproduceren. Sinds 2007 rapporteerden meerdere onderzoeken echter dat ME/cvs-patiënten hun inspanningsresultaten niet kunnen reproduceren, een merkwaardige bevinding die vermoedelijk een weerspiegeling is van postexertionele malaise (PEM), een belangrijk kenmerk van de ziekte. ME/cvs-patiënten melden een duidelijke functionele achteruitgang en toename van symptomen wanneer ze hun energielimieten overschrijden. Door twee inspanningstesten uit te voeren met slechts 24 uur ertussen, hopen onderzoekers een objectieve meting van dit PEM-fenomeen te vinden.

Eén studie, bijvoorbeeld, stelde dat afname op de 2e dag inspanningstest “een objectieve biomarker kan zijn die gebruikt kan worden om te helpen bij de diagnose van ME/cvs.”  Een andere groep beweerde dat 2-daagse inspanningstesten “objectief bewijs bieden van stoornissen die toe te schrijven zijn aan de effecten van PEM, helpen bij het management van patiënten, informatie geven over therapeutische interventies en de progressie van de ziekte volgen.” Ondanks de opwinding en gedurfde beweringen zijn de meeste uitgevoerde 2-daagse inspanningsstudies extreem klein, vaak met minder dan 20 ME/cvs-deelnemers.

De grootste studie tot nu toe

In juli 2024 publiceerde het onderzoeksteam van Dr. Betsy Keller echter de grootste studie naar 2-daagse inspanningstesten tot nu toe. 84 ME/cvs-patiënten werden gerekruteerd door deskundige artsen John Chia, Susan Levine en Geoff Moore met behulp van de Canadese Consensus Criteria. 71 sedentaire maar gezonde deelnemers werden opgenomen als controlegroep. De auteurs koppelden 55 ME/cvs-patiënten en controles qua leeftijd, geslacht en fitheid om er zeker van te zijn dat deze factoren de resultaten niet konden beïnvloeden. Keller en collega’s maakten hun gegevens ook openbaar (wat zou moeten, maar niet gebruikelijk is in medisch onderzoek) op mapmecfs.org. Hierdoor kunnen andere onderzoekers (en de auteurs van deze blog) de gegevens zelf analyseren.

In hun artikel rapporteren Keller en collega’s dat ME/cvs-patiënten veel inspanningsuitkomsten niet kunnen reproduceren op de tweede test en dat dit een verminderd herstel bij ME/cvs onderbouwt. De auteurs vergeleken echter inspanningsmetingen tussen groepen (ME/cvs-patiënten versus controles) en tussen testen (CPET1-CPET2), maar niet beide tegelijk. Het is deze interactie waarin wij geïnteresseerd zijn. We willen graag weten of veranderingen tussen twee inspanningstesten anders zijn bij ME/cvs-patiënten versus controles. Als de resultaten van ME/cvs-patiënten bijvoorbeeld met 10% afnemen, willen we graag weten hoe vaak dit voorkomt bij controles en of het verschil toevallig zou kunnen zijn.

Piek-VO2: het grootste effect

De grafiek hieronder toont de veranderingen voor VO2; de maximale hoeveelheid zuurstof die wordt verbruikt tijdens de inspanningstest. Omdat zuurstof cruciaal is voor het produceren van energie tijdens langdurige inspanningen, wordt VO2 gezien als een maat voor algemene fitheid. Het wordt meestal uitgedrukt in verhouding tot het lichaamsgewicht. Van alle resultaten die Keller en collega’s testten, vertoonden de piekwaarden voor VO2 het sterkste effect.

Zoals de grafiek hierboven laat zien, gingen de resultaten van ME/cvs-patiënten (in oranje) meer achteruit dan die van de controlegroep (in blauw). We gebruiken procentuele verschillen zodat de resultaten van elke deelnemer even zwaar wegen, ongeacht hun uitgangswaarde. De mediane verandering voor de ME/cvs-groep was -5,1% vergeleken met -2% bij de controles. Als u willekeurig een deelnemer uit elke groep kiest en hun procentuele verandering van test 1 naar test 2 vergelijkt, zal de ME/cvs-waarde gemiddeld 64% van de tijd lager zijn. Dat suggereert een matig effect (geen effect zou een 50/50 kans op een lagere waarde betekenen).

De grafiek toont echter ook een grote overlap tussen de twee groepen. De drempelwaarde die hen het beste scheidt, is een waarde van -9,3%, zoals weergegeven door de gestippelde grijze lijn. Ongeveer een derde van de ME/cvs-patiënten zit onder deze lijn (sensitiviteit), terwijl 90% van de controles erboven zit (specificiteit). Deze getallen suggereren dat deze uitkomst grote moeite heeft om ME/cvs-patiënten van controles te onderscheiden en dat het geen sterk potentieel heeft als diagnostische biomarker.

Meervoudig testprobleem

Er zijn verschillende bijkomende problemen. Ten eerste is er het meervoudig testprobleem. Onderzoekers gebruiken statistische testen om te onderzoeken of een effect toevallig kan zijn opgetreden. Ze nemen eerst aan dat er geen verschil is tussen de twee groepen (de nulhypothese) en berekenen dan hoe groot de kans is dat we gegevens vinden zoals die in de grafiek hierboven, waar de ene groep (iets) lagere waarden heeft. Voor het VO2-piekverschil is er slechts een kans van 0,5% om een verschil te vinden dat zo extreem is als het gevonden verschil als er echt geen verschil is tussen de groepen (Mann-Whitney, p = 0,005). Slechts 1 op de 200 keer zouden we ten onrechte concluderen dat er een effect is, terwijl het gewoon toeval is.

Dat lijkt solide, maar omdat Keller en collega’s meer dan 20 uitkomsten testten op twee verschillende tijdstippen (bij piekinspanning en de ventilatoire drempel), is er een verhoogd risico op valspositieven waar we rekening mee moeten houden. Met behulp van de Benjamini-Hochberg-methode om te controleren op valse ontdekkingsgraad, schatten we dat de kans op een valspositief resultaat voor piek-VO2 wel 8-20% kan zijn, afhankelijk van het type en het aantal tests dat wordt bekeken. Met andere woorden, hoewel de gegevens consistent zijn met een matig effect, leveren ze niet sterk genoeg bewijs om uit te sluiten dat dit door toeval en willekeurige variatie is gebeurd. VO2 gemeten op een ander tijdstip (de ventilatoire drempel) liet ook een zwakker effect zien dat niet significant verschilde tussen beide groepen (Mann-Whitney, p = 0,18, zie tabel 2).

OutcomeCommon-Language Effect Size (CLES)p-value Mann_WhitheyBenjamini–Hochberg corrected p-valuesCohen’s d Winsorized  data (2.5%)p-value Welch test Winsorized  data (2.5%) Benjamini–Hochberg corrected p-values
VO20.640.0050.10.48 [0.14, 0.81]0.0040.08
time_sec0.620.0120.120.41 [0.08, 0.74]0.0150.15
Ve_BTPS0.590.0520.30.38 [0.05, 0.71]0.0250.16
O2_pulse0.590.0620.30.31 [-0.02, 0.64]0.0640.21
Workload0.580.0930.30.25 [-0.08, 0.58]0.1270.31
VCO20.580.0990.30.36 [0.03, 0.69]0.0310.16
HR0.580.120.30.23 [-0.1, 0.56]0.1730.31
HR_predicted0.580.120.30.23 [-0.1, 0.56]0.1730.31
DBP0.590.1880.420.33 [-0.0, 0.66]0.0530.21
Vt_BTPS_L0.550.3060.520.15 [-0.18, 0.48]0.3740.58
RPP0.560.3080.520.24 [-0.09, 0.57]0.160.31
RR0.550.310.520.26 [-0.07, 0.59]0.1250.31
RPE0.660.3690.570.11 [-0.22, 0.44]0.5260.66
RER0.540.4160.590.12 [-0.21, 0.45]0.4660.64
Ve_VCO20.530.4920.660.15 [-0.18, 0.48]0.3620.58
SBP0.540.5320.660.12 [-0.21, 0.45]0.4770.64
Ve_VO20.510.7890.90.01 [-0.32, 0.34]0.9330.95
PETO20.50.8410.90.04 [-0.29, 0.37]0.820.91
PP0.50.8960.90.01 [-0.32, 0.34]0.9540.95
PETCO20.510.90.90.05 [-0.28, 0.38]0.760.89
Tabel 1. Effectgroottes voor inspanningsuitkomsten bij piekwaarden.

Geen correlatie met invaliditeit

Ten tweede correleren VO2-piekverschillen tussen test 1 en test 2 niet goed met functiebeperking. Keller en collega’s gebruikten de Bell-invaliditeitsschaal waarbij deelnemers hun invaliditeit konden aangeven met een cijfer van 0 (bedlegerig) tot 100 (geen symptomen). De VO2-piekverschillen binnen de ME/cvs-groep vertonen geen significante correlatie met scores op de Bell-schaal (Spearman rho = -0,009, p = 0,94), wat hun klinische betekenis in twijfel trekt.

Ten derde is er een inconsistentie met eerdere studies. Een meta-analyse uit 2022 van 6 patiënt-controleonderzoeken naar 2-daagse inspanningstesten bij ME/cvs, vond slechts een klein effect voor VO2-piekwaarden (Cohen’s d = -0,23), dat statistisch niet significant was. Eerdere studies wezen in de richting van een andere maat als de meest consistente bevinding waar het effect aanzienlijk groter was: werkbelasting op de ventilatoire drempel.

Ventilatoire drempel voor belasting

De belasting (workload) verwijst naar het vermogen, het aantal watt, dat je tijdens de inspanningstest gebruikt, meestal op een hometrainer. De ventilatoire drempel (VT) is het punt waarop de ademsnelheid onevenredig toeneemt met het zuurstofverbruik. Dit suggereert dat het lichaam overschakelt van aerobe energieproductie (die afhankelijk is van zuurstof) naar een grotere afhankelijkheid van anaerobe stofwisseling (die lactaat en CO2 als bijproduct produceert). Er is gesuggereerd dat deze ventilatoire drempel relevanter is voor het dagelijks leven met ME/cvs omdat patiënten zelden activiteiten op maximale intensiteit uitvoeren.

OutcomeCommon-Language Effect Size (CLES)p-value Mann_WhitheyBenjamini–Hochberg corrected p-valuesCohen’s d Winsorized  data (2.5%)p-value Welch test Winsorized  data (2.5%)Benjamini–Hochberg corrected p-values
PETCO20.620.0420.440.28 [-0.05, 0.6]0.0850.36
Workload0.600.0440.440.16 [-0.16, 0.48]0.3180.63
Ve_VCO20.580.0820.530.32 [-0.0, 0.64]0.0450.36
time_sec0.570.1450.530.02 [-0.3, 0.34]0.9010.96
PETO20.550.1700.530.33 [0.01, 0.65]0.0430.36
VO20.560.1840.530.23 [-0.09, 0.55]0.1360.36
O2_pulse0.570.1860.530.25 [-0.07, 0.57]0.1190.36
Ve_VO20.550.2480.620.29 [-0.03, 0.61]0.0730.36
VCO20.550.3280.720.13 [-0.19, 0.45]0.4080.68
SBP0.550.3600.720.26 [-0.06, 0.58]0.1140.36
Vt_BTPS_L0.540.4160.730.10 [-0.22, 0.42]0.5390.77
PP0.550.4380.730.24 [-0.08, 0.56]0.1430.36
RPP0.530.5660.750.15 [-0.16, 0.47]0.3440.63
DBP0.540.6000.750.11 [-0.21, 0.43]0.5010.77
RR0.510.6110.750.15 [-0.17, 0.47]0.3470.63
Ve_BTPS0.520.6470.750.01 [-0.31, 0.33]0.9450.96
HR_predicted0.530.6780.750.03 [-0.29, 0.35]0.8640.96
HR0.530.6780.750.03 [-0.29, 0.35]0.8640.96
RER0.500.9730.990.02 [-0.3, 0.34]0.9000.96
RPE0.560.9940.990.01 [-0.31, 0.33]0.9580.96
Tabel 2. Effectgroottes voor inspanningsresultaten op de ventilatoire drempel.

In tegenstelling tot eerdere studies laten de gegevens van Keller et al. echter geen duidelijk verschil zien voor Workload VT. Zo zien de gegevens eruit:

Het eerste dat opvalt is dat workload VT veel meer variatie heeft dan piek-VO2. Terwijl de meeste procentuele veranderingen op piek-VO2 tussen -40% en +40% lagen, liggen de veranderingen op workload VT tussen -100% en +100%. Er zijn zelfs 4 uitschieters die buiten dit bereik liggen (daarover later meer).

De overlap tussen de ME/cvs- en controlegroep is ook groter. Een eerdere Australische studie stelde voor om een drempel van -9,8% te gebruiken omdat “een afname van deze omvang waarschijnlijk niet voorkomt bij iemand die geen ME/cvs heeft.”  In de gegevens van Keller en collega’s had echter bijna 40% van de controles deze afname, terwijl dit bij slechts 53% van de ME/cvs-patiënten het geval was. De berekende optimale drempelwaarde die de groepen het beste scheidde, was -14,9%. De helft van de ME/cvs-patiënten zit onder deze grens (sensitiviteit) terwijl ongeveer 70% van de controles erboven zit (specificiteit).

De ME/cvs-deelnemers hebben lagere waarden dan de controles, maar het effect is kleiner dan voor de VO2-piek. Als je willekeurig een ME/cvs-patiënt en een controle zou kiezen, zou de eerste 59 van de 100 keer een lagere procentuele verandering hebben. Zo’n effect zou 4,5% van de tijd optreden, zelfs als er geen verschil was (Mann-Whitney, p=0,045), en is niet statistisch significant na correctie voor meervoudige tests. De verschillen correleren ook niet goed met de Bell-invaliditeitsschaal (Spearman R = 0,058, p = 0,60) en zijn zwakker in de subgroep van gematchte paren (Mann-Whitney, p=0,346). De piekwaarden van de werkbelasting vertoonden ook een zwakker effect dat niet significant verschilde tussen de groepen (Mann-Whitney, p=0,093, zie tabel 1).

De uitschieters

De vier uitschieters (outliers) verdienen nadere aandacht omdat ze de grafiek vertekenen en een toename van meer dan 100% bij de tweede inspanningstest nogal bizar is. Als we ze zouden verwijderen, zou de effectgrootte toenemen tot die van piek- VO2 met een bijbehorende Mann-Whitney p-waarde van 0,009.

Het verwijderen van gegevens zonder duidelijke rechtvaardiging is echter controversieel. Als we kijken naar de absolute waarden van deze 4 deelnemers, zien we dat ze waarschijnlijk geen meetfout vertegenwoordigen. Ze schoven op van de onderkant naar het midden en bovenkant van de ME/cvs-groep.

Deze uitschieters zijn deels het gevolg van het werken met percentages in plaats van absolute veranderingen. Andere uitkomsten hebben ook last van deze uitschieters (hoewel niet zo extreem als workload VT). We hebben ze op twee manieren aangepakt: ten eerste gebruikten we niet-parametrische tests op basis van rangordes (in plaats van tests die uitgaan van gemiddelden) in onze belangrijkste analyse. Ten tweede hebben we ook een methode geprobeerd (Winsorizing op 2,5%) die de extreme waarden vervangt door de dichtstbijzijnde datapunten die niet als uitschieters worden beschouwd. Met beide methoden zijn de resultaten voor Workload VT niet statistisch significant. Of er een significant effect is voor Workload VT, hangt af van hoe je omgaat met de 4 uitschieters.

Criteria voor maximale inspanning

We gaan verder met enkele algemene opmerkingen over de dataset. Over het algemeen waren de resultaten redelijk vergelijkbaar in de subgroep van paren die waren gematcht voor leeftijd, geslacht en fitheid. Het lijkt erop dat dit geen sterke invloed had op de resultaten.

Keller en collega’s gebruikten criteria om te bepalen of deelnemers zich maximaal probeerden in te spannen tijdens de test. Deze zijn gebaseerd op objectieve metingen zoals de hartslag die deelnemers bereikten en de hoeveelheid CO2 die ze uitademden, wat een afhankelijkheid van anaerobe energieproductie weerspiegelt. Keller en collega’s beargumenteerden dat ze deze criteria niet toepasten voor ME/cvs-patiënten op de tweede inspanningstest, omdat het niet-behalen van deze criteria onderdeel kan zijn van de ziekte. Onze analyse liet echter zien dat slechts 10 deelnemers (8 ME/cvs-patiënten en 2 controles) deze criteria niet haalden en dat het uitsluiten van hen niet veel verschil maakte. Onze analyses en grafieken hierboven werden berekend met uitsluiting van deze 10 deelnemers.

De studie van Keller et al. liet wel interessante verschillen zien tussen ME/cvs-patiënten en controles op een enkele inspanningstest. Een voorbeeld hiervan is een lage polsdruk die ook in een eerdere studie werd gerapporteerd. Hopelijk geven deze verdere aanwijzingen voor onderzoek.

Toekomstige richtingen

Belasting en VO2 zijn het meest onderzocht en in de studie van Keller uit 2024 vertonen ze enkele van de grootste effectgroottes. Toekomstige studies moeten zich richten op deze maatstaven om het probleem van meervoudig testen te voorkomen.

Hoewel kleiner, gaat het effect van Workload VT in dezelfde richting als in eerdere studies, wat de hypothese ondersteunt dat ME/cvs-patiënten hun vermogensoutput niet reproduceren op de tweede test. Toekomstige studies moeten proberen de grote variatie in de procentuele veranderingen van Workload VT  te verminderen om de precisie te vergroten. Enkele suggesties, gedaan op het Science for ME-forum zijn:

  • het matchen van patiënten en controles voor workload in plaats van VO2. Omdat extreme uitschieters alleen werden gevonden bij deelnemers met een zeer lage VT-belasting, zou dit een disbalans tussen de twee groepen kunnen hebben veroorzaakt.
  • Het verlagen van het bereik waarop deelnemers geïnstrueerd worden om te trappen. In het onderzoek van Keller was dit 50-80 omwentelingen per minuut. Misschien kan dit verlaagd worden om ervoor te zorgen dat deelnemers constant op dezelfde snelheid fietsen.
  • Het verhogen van de tijdsperiode waarover de VT-metingen van de belasting worden gemiddeld. Dit wordt meestal automatisch gedaan door de hometrainer om stabiele metingen te verkrijgen. Het verhogen van dit interval kan de variatie tussen verschillende inspanningstests verminderen.

e bevelen ook aan om meer invaliditeitsmaatstaven op te nemen, in het bijzonder een beoordeling van PEM, zodat we de relatie tussen de resultaten van inspanningstesten en ME/cvs-symptomen grondiger kunnen testen. Het is opvallend dat geen van de 2-daagse inspanningsonderzoeken tot nu toe een meting van PEM heeft opgenomen.

Conclusie

Concluderend vond de grootste en kwalitatief beste studie naar 2-daagse inspanningstesten geen sterk bewijs van verminderd herstel bij ME/cvs-patiënten. Dit suggereert dat de effecten kleiner zijn dan aanvankelijk gedacht en dat de procedure moeite heeft om nauwkeurig onderscheid te maken tussen patiënten en controles. De gegevens zijn echter consistent met een klein tot matig effect voor piek-VO2 en misschien ook voor Workload VT, afhankelijk van hoe je de gegevens analyseert.

In een toekomstige blogpost zullen we eerdere studies naar 2-daagse inspanningstesten bij ME/cvs-patiënten onder de loep nemen.

Erkenningen

Veel dank aan forestglip op het Science for ME-forum wiens doordachte analyse zeer behulpzaam was bij het begrijpen van de dataset van Keller et al..

De volgende dataset werd gebruikt van www.mapmecfs.org: Keller et al. Cardiopulmonary and metabolic responses during a 2-day CPET in ME/CFS [Cardiopulmonaire en metabole reacties tijdens een tweedaagse CPET bij ME/cvs]. Laatst bijgewerkt: 12 september 2024, 4:29 PM (UTC+02:00).

© ME/CFS Skeptic, 18 september 2024.

Geef een reactie

Zijbalk

Volg ons
ma
di
wo
do
vr
za
zo
m
d
w
d
v
z
z
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
1
2
3
4
5
Datum/Tijd Evenement
25/11/2024
19:00 - 21:00
Webinar epigenetisch onderzoek bij ME/cvs en fibromyalgie
27/11/2024
20:00 - 21:00
Webinar voor huisartsen over post-COVID
07/12/2024
13:00 - 17:30
Creatief kerstmarktje
Parkresidentie Institut Moderne, Gent
Recente Links