Sur les calculs statistiques incorrects du progiciel Kinetica dans les conceptions déséquilibrées

Sch ü tz et al. (1,2) ont identifié que le logiciel Kinetica (version 5.0.10, Thermo Fisher Scientific 2007) fournit des intervalles de confiance incorrects à 90% pour le rapport test / référence lorsque les groupes sont déséquilibrés dans des conceptions croisées à deux séquences à deux séquences ( 1) et parallèles (2). Les auteurs suggèrent que ce problème semble provenir de l’utilisation d’une formule simplifiée qui implique que la taille de l’échantillon est égale dans les deux séquences ou groupes. Par conséquent, la largeur de l’intervalle de confiance est différente du résultat correct obtenu lorsqu’on utilise la formule qui considère différemment la taille de l’échantillon pour chaque séquence ou groupe. De plus, l’estimation ponctuelle est également biaisée parce que, selon les auteurs, elle pourrait refléter les valeurs des traitements bruts logarithmisés plutôt que d’utiliser les effets de traitement qui résultent de la minimisation des sommes des carrés. Les auteurs déclarent qu’ils apprécieraient les commentaires des autres utilisateurs de Kinetica.À cet égard, en tant qu’évaluateurs de bioéquivalence dans un organisme de réglementation, nous avons remarqué que Kinetica fournit des résultats incorrects avant 2000, lorsque l’un de nous a commencé à évaluer les études de bioéquivalence. Nous avons simplement remarqué que Kinetica utilise les calculs décrits dans l’exemple de la ligne directrice canadienne de 1992 pour une étude équilibrée (3), reprise dans la nouvelle ligne directrice canadienne de 2012 (4). L’estimation ponctuelle était incorrecte pour les conceptions croisées car le calcul ignorait la séquence d’où provenaient les observations. L’estimation ponctuelle a été calculée avec des moyennes arithmétiques (moyenne de toutes les observations de test et de référence indépendamment de la séquence) au lieu de la moyenne des moindres carrés, des moyennes marginales ou des moyennes ajustées (moyennes des observations dans chaque séquence). . Les deux moyens, arithmétique et moyen des moindres carrés, conviennent lorsque les études sont équilibrées. Par conséquent, il est biaisé uniquement pour les conceptions déséquilibrées. Bien sûr, l’estimation ponctuelle n’est pas biaisée dans les conceptions parallèles car dans ce cas il n’y a pas de séquences d’administration. Ensuite, dans les conceptions parallèles, le seul problème est le calcul de la largeur de l’intervalle de confiance, comme l’ont montré ces auteurs (2). Certains peuvent craindre que Kinetica soit un ensemble statistique couramment utilisé et, par conséquent, de nombreuses autorisations de mise sur le marché ont été émis pour lesquels les dossiers sous-jacents contiennent des intervalles de confiance calculés de manière incorrecte. Cependant, une revue des rapports d’évaluation de la bioéquivalence d’avant 2000 jusqu’à aujourd’hui, élaborée en Espagne par l’agence de régulation Agencia Espa ñ ola de Medicamentos y Productos Sanitarios, qui inclut le logiciel utilisé pour les calculs pharmacocinétiques et statistiques, atténue ces préoccupations. . Un examen de toutes les demandes nationales, centralisées et décentralisées ou de demandes de reconnaissance mutuelle dans lesquelles l’Espagne était concernée (veuillez noter que l’Espagne réévalue pour cohérence toutes les études de bioéquivalence même si elles ont déjà été évaluées par l’État membre de référence). jamais été utilisé dans l’analyse statistique d’une étude de bioéquivalence avec un plan parallèle.Kinetica a été utilisé uniquement pour l’analyse statistique de 21 études de bioéquivalence pendant toutes ces années mal de dos (lombalgie). Par conséquent, au moins pour l’Espagne, il est inexact de considérer que Kinetica est un ensemble statistique couramment utilisé ou l’un des paquets les plus couramment utilisés.En outre, ces 21 études ont été soumises dans 18 applications sur 18 000 demandes environ. Treize études ont appuyé l’approbation de 12 demandes et huit n’ont pas été acceptées. Quatre études acceptées étaient équilibrées alors que neuf études acceptées étaient déséquilibrées. Six de ces études déséquilibrées ont été évaluées dans des applications nationales, une dans une procédure de reconnaissance mutuelle et deux dans des procédures décentralisées. Dans le cadre de la procédure de reconnaissance mutuelle évaluée en 2004, nous avons demandé à la société de fournir une analyse statistique correcte, étant donné que l’Espagne ne peut que reconnaître l’autorisation préalable accordée par l’État membre de référence. Dans les huit autres études, la réanalyse a été réalisée par l’agence espagnole avec SAS (voir le tableau   I). En raison d’un léger déséquilibre, les résultats étaient presque identiques et la conclusion de bioéquivalence n’a pas été modifiée après l’analyse statistique correcte. Par conséquent, ce problème ne peut pas être considéré comme un problème significatif d’un point de vue réglementaire. Tableau des résultats des études de bioéquivalence croisée acceptée avec taille d’échantillon déséquilibrée qui ont été analysées à l’origine avec Kinetica et réanalysées par l’Agence espagnole des médicaments et des produits de soins de santé une étude échouée basée sur l’analyse originale aurait pu démontrer la bioéquivalence avec l’analyse statistique correcte, parce que nous n’avons pas réanalysé les études échouées, mais cela ne peut pas être considéré comme un risque pour les patients. Dans une étude rejetée, le déséquilibre était notable parce que les sujets ont été randomisés complètement au hasard, alors que les études de bioéquivalence sont généralement randomisées en blocs. En fait, c’est la seule étude de bioéquivalence que nous ayons jamais vue sans randomisation en bloc. Par conséquent, les séquences étaient initialement déséquilibrées et les abandons se produisaient plus fréquemment dans la séquence avec moins de sujets. Enfin, le déséquilibre était de 18 sujets dans une séquence et de neuf sujets dans l’autre séquence. En raison de la petite taille de l’échantillon (n   =   27) et du déséquilibre notable (18/9), le biais d’estimation ponctuelle était significatif (de 92,70 à 80,62%), mais dans les deux cas, le intervalle était en dehors des limites d’acceptation. Ce scénario d’une taille d’échantillon limitée avec un tel déséquilibre notable est très improbable. Cette faible probabilité associée à l’utilisation peu fréquente de ce progiciel rend cette question très improbable sur le plan clinique.Enfin, dans d’autres juridictions réglementaires comme les États-Unis ou le Canada, toutes les études de bioéquivalence sont réanalysées à partir des données brutes et, par conséquent, le logiciel utilisé par le demandeur / CRO n’est pas pertinent et cette déficience n’affecte pas ces pays. Certes, cet exemple devrait être suivi par tous les organismes de réglementation.