Comment les nouvelles technologies peuvent-elles faciliter le dépistage de l’autisme ?

Nada Kojovic et Marie Schaer

Résumé
De plus en plus d’études scientifiques démontrent qu’il est possible de quantifier de manière précise et automatisée les manifestations de l’autisme grâce aux nouvelles technologies. Nous présentons ici une revue de cette littérature, ainsi que des résultats de notre groupe de recherche qui montrent que l’analyse automatisée de vidéos pourrait représenter un excellent moyen de dépister l’autisme précocement. Ainsi, notre algorithme basé sur l’intelligence artificielle a pu dans 81 % des cas correctement distinguer les vidéos des enfants présentant un TSA des enfants ayant un développement typique sur la base de caractéristiques uniquement non verbales de l’interaction sociale réciproque.

Zusammenfassung
Immer mehr wissenschaftliche Studien belegen, dass es mithilfe neuer Technologien möglich ist, die Erscheinungsformen von Autismus präzise und automatisiert zu quantifizieren. Wir präsentieren hier einen Überblick über diese Literatur. Die Ergebnisse unserer Forschungsgruppe zeigen, dass die automatisierte Videoanalyse ein hervorragendes Mittel zur Früherkennung von Autismus sein könnte. So konnte unser auf künstlicher Intelligenz basierter Algorithmus in 81 Prozent der Fälle Kinder mit ASS korrekt von Kindern mit neurotypischer Entwicklung unterscheiden, und zwar auf der Grundlage ausschliesslich nonverbaler Merkmale in der sozialen Interaktion.

Keywords : diagnostic, trouble du spectre de l’autisme, Intelligence artificielle, dépistage / Diagnose, Autismus-Spektrum-Störung, Künstliche Intelligenz, Vorsorgeuntersuchung

DOI : https://doi.org/10.57161/r2023-01-02

Revue Suisse de Pédagogie Spécialisée, Vol. 13, 01/2023

Creative Common BY

L’importance d’un diagnostic précoce : défis et opportunités

Les Troubles du Spectre de l’Autisme (TSA) [1] représentent un ensemble de troubles neurodéveloppementaux fréquents. L’étude à grande échelle la plus récente, effectuée sur un échantillon de 220 281 enfants aux États-Unis en 2018, estime qu’un enfant sur 44 est diagnostiqué avec un TSA (Maenner, 2021). Il n’existe actuellement aucun biomarqueur fiable de l’autisme, de sorte que le diagnostic repose uniquement sur l’identification précise de manifestations comportementales. Le TSA se caractérise par la présence de différences précoces et persistantes dans les interactions sociales et les aptitudes à la communication, et par la présence de comportements restreints et répétitifs (American Psychiatric Association, 2013).

La détection précoce des TSA est primordiale pour commencer une intervention adaptée le plus tôt possible, car les premières années de vie représentent une période de plasticité cérébrale maximale où le cerveau est particulièrement sensible à ces interventions (Dawson, 2008). L’intervention au-delà de cette fenêtre développementale sensible est toujours bénéfique, mais les gains les plus impressionnants sont observés lorsque l’intervention commence avant l’âge de 24 mois (Lombardo et al., 2021).

La littérature scientifique a montré que les interventions précoces et intensives axées sur les compétences sociales réduisent significativement les manifestations autistiques et apportent des gains cognitifs substantiels (Dawson, 2008 ; Godel et al., 2022 ; Klintwall et al., 2015 ; Robain et al., 2020).

La possibilité pour un enfant d’accéder à une intervention précoce qui pourra potentiellement changer son avenir repose sur un dépistage précoce efficace de l’autisme. Cependant, la plupart des tests de dépistage actuellement utilisés sont basés sur des questionnaires, dont la précision est faible à modérée (Yuen et al., 2018). En outre, ces tests sont sujets à des biais de rappel et de subjectivité. Pour surmonter ces limites, il est nécessaire de disposer d’outils permettant une quantification objective et à grande échelle des signes révélateurs de l’autisme.

Bien qu’un TSA puisse être détecté par des cliniciennes ou cliniciens expérimentés dès l’âge de 14 mois (Landa, 2013) et avec une grande certitude avant l’âge de deux ans (Ozonoff, 2015), les derniers rapports de prévalence révèlent que plus de 70 % des enfants concernés ne sont pas diagnostiqués avant l’âge de 50 mois (Maenner, 2020). Un des éléments contribuant à l’âge tardif du diagnostic est le manque de ressources disponibles. En effet, les formations en autisme sont longues et la plupart des centres spécialisés sont confrontés à des listes d’attente importantes.

Afin d’obtenir de mesures fiables des manifestations de l’autisme, les cliniciennes et les cliniciens utilisent en général des outils standardisés basés sur l’observation, tels que l’ Autism Diagnostic Observation Schedule (ADOS-2, Échelle d’observation pour le diagnostic de l’autisme) (Lord et al., 2000, 2012), qui nécessitent une formation spécifique. Dans l’ADOS-2, chaque caractéristique autistique est évaluée sur une échelle allant de 0 (aucune anomalie évidente) à 3 (comportement très sévèrement atypique). Comme le but principal de ces tests est de permettre la standardisation de la pratique clinique de diagnostic, ils n’amènent pas une granularité suffisante pour définir des sous-types d’autisme, qui nécessiteraient des méthodes d’interventions variées, ou pour suivre l’évolution des enfants au cours du temps. Or mesurer leur développement et leur fonctionnement régulièrement est indispensable afin de pouvoir redéfinir les principaux objectifs pour les soutenir au mieux. À ce stade, les outils standardisés disponibles dans le domaine de l’autisme sont insuffisamment fiables pour y parvenir. Dans ce contexte, les nouvelles technologies représentent une avancée prometteuse pour faciliter le dépistage , contribuer au diagnostic et au suivi quantitatifs de l’autisme.

Le potentiel des nouvelles technologies

Afin de pallier les limites des outils existants, un nombre croissant d’études scientifiques proposent de développer des outils de quantification automatisée et objective des comportements pertinents pour l’autisme, en utilisant les progrès en machine learning [2] et en computer vision [3] (pour une revue de littérature, voir de Belen et al., 2020). La stratégie la plus souvent adoptée est de cibler des comportements isolés présentant une grande pertinence clinique pour pouvoir, dans un deuxième temps, élargir le champ d’application en se concentrant sur un plus grand nombre de comportements. À terme, l’objectif global est de créer des mesures comportementales qui soient indépendantes de l’évaluation humaine, qui seraient donc plus fines, plus objectives et entièrement automatisées.

Certaines études se sont intéressées, par exemple, à la réponse au prénom. En effet, un des premiers signes d’autisme rapporté par les parents est que leur enfant ne répond pas toujours à son prénom. La réponse au prénom implique que l’enfant détecte et porte son attention sur un signal qui est socialement significatif pour lui (par exemple, en tournant la tête et en regardant la personne qui l’appelle). Chez les enfants ayant un développement typique, ce comportement est habituellement présent vers l’âge de 9 mois. Des chercheurs de l’Université Duke aux États-Unis ont mis en œuvre un protocole d’appel par prénom couplé à des méthodes de computer vision pour parvenir à une mesure automatisée de ce comportement (Campbell et al., 2018). Dans cette étude, alors que les enfants regardaient des vidéos sur une tablette, un adulte appelait l’enfant par son prénom. Ensuite, une analyse vidéo a été utilisée pour détecter le changement d’orientation du visage de manière automatique. Outre sa grande fiabilité, cette technique a permis de comprendre les aspects dynamiques de l’orientation du visage à l’appel du prénom, qui échapperaient même à l’œil clinique le plus aiguisé dans des conditions standards. En effet, lorsque les enfants ayant un TSA répondent à leur prénom, ils ont tendance à le faire avec une latence d’environ une seconde par rapport aux enfants ayant un développement typique (Campbell et al., 2018). Cette mesure très subtile de la vitesse d’orientation à l’appel du prénom illustre bien comment les techniques de computer vision peuvent contribuer au dépistage, en permettant une mesure objective et quantifiable d’un signe de nature autistique.

Un autre exemple qui a reçu beaucoup d’attention est l’analyse des mouvements du corps et des mimiques faciales. En effet, l’autisme se caractérise par une « signature motrice » spécifique, souvent traduite par des expressions faciales atténuées, des postures du corps atypiques et une fréquence réduite des gestes communicatifs. L’utilisation de la capture de mouvement et de techniques de computer vision permet de mesurer plus précisément ces aspects du comportement moteurs caractéristiques de l’autisme. Ainsi, une étude a comparé des données de capture de mouvement obtenues auprès de personnes présentant un TSA et de sujets ayant un développement typique pendant qu’ils produisaient diverses expressions faciales (Guha et al., 2018). Cette étude a mis en avant une complexité réduite de l’expression émotionnelle chez les personnes ayant un TSA, en particulier dans la région des yeux. D’autres études utilisant la capture de mouvement et des techniques de computer vision ont mis en avant un contrôle postural atypique chez les enfants présentant un TSA (Hashemi et al., 2014), suggérant des difficultés à maintenir la position de leur tête dans la ligne médiane lorsque leur attention est engagée dans une tâche. Ainsi, ces études montrent de quelle manière les technologies de computer vision et de machine learning peuvent faire progresser la compréhension de l’autisme en ayant le potentiel de fournir une caractérisation précise, objective et rapide de comportements complexes.

Vers des mesures plus globales de l’interaction sociale ?

Les études présentées ci-dessus illustrent comment la mesure de comportements précis caractéristiques de l’autisme peut être automatisée à l’aide des nouvelles technologies. Cependant, l’autisme est un trouble qui est caractérisé par de nombreux signes, qui varient dans leur qualité, modalité et intensité. Chacun des comportements mesurés dans ces études ne suffit pas à poser un diagnostic s’il est pris séparément. En outre, les contextes de mesure de ces études sont peu représentatifs de la vie de tous les jours. Dans le but d’atteindre des mesures comportementales plus globales, qui soient emblématiques de l’ensemble des manifestations de l’autisme et utilisables au quotidien à plus grande échelle, nous avons récemment proposé de cibler les comportements non verbaux impliqués dans l’interaction sociale (Kojovic et al., 2021). Ces comportements non verbaux incluent par exemple le pointage, les gestes communicatifs, comme applaudir ou hocher la tête pour dire oui ou non ; ils précèdent et guident le développement de la communication verbale. En plus de la pertinence de ces comportements pour le dépistage précoce du trouble, ils sont aussi d’une grande importance clinique au-delà de l’enfance. En effet, les personnes ayant un TSA présentent d’importantes difficultés dans l’usage et la modulation des aspects non verbaux de l’interaction sociale à travers les âges (Lord et al., 2000, 2012).

Dans notre étude, nous avons utilisé les vidéos d’une évaluation diagnostique semi-standardisée impliquant une interaction ludique entre l’enfant et l’examinateur. Cette échelle – l’ADOS-2 (Lord et al., 2000, 2012) – comprend des activités choisies pour refléter des routines de jeu habituelles et régulières (comme cachecache, le jeu de bulles de savon, les chatouilles, le jeu imaginaire avec les objets miniatures…). L’aspect semi-standardisé de ces évaluations permet non seulement de susciter, mais aussi de mesurer différents comportements caractéristiques de l’autisme.

En utilisant des vidéos de scènes beaucoup plus complexes et moins standardisées que celles utilisées dans les études présentées auparavant, nous faisions face à un défi majeur. Leur complexité est en effet un obstacle pour que l’intelligence artificielle puisse apprendre à identifier efficacement les caractéristiques associées à l’autisme. Nous avons donc choisi d’extraire de ces vidéos uniquement l’essence de l’interaction sociale, puisque des différences dans la manière d’interagir et de communiquer sont au cœur des caractéristiques de l’autisme. Ainsi, afin de faciliter l’apprentissage automatique de ces outils, nous avons décidé d’éliminer toutes les informations sonores et visuelles non pertinentes pour la classification (détails de l’environnement, identité de personnes, etc.) et de nous concentrer uniquement sur le langage corporel utilisé par l’enfant dans un moment d’interaction ludique avec un adulte (p. ex., la manière dont l’enfant fait une demande pour recommencer une activité plaisante). Pour répondre à ces objectifs, nous avons utilisé un programme nommé OpenPose pour identifier la posture des personnes (Cao et al., 2021). De cette façon, nous avons pu obtenir les coordonnées des points clés du corps de chaque personne présente dans une scène visuelle donnée (voir Figure 1), réduisant ainsi la quantité d’information à analyser.

Figure 1 : Illustration d’extraction des « squelettes » en utilisant l’estimation de pose par OpenPose (Cao et al., 2021) sur une image extraite d’une séquence vidéo d’une interaction sociale
figure illustrant les propos décrits dans le texte.

(A) Points clés d’OpenPose superposés à une image issue de l’enregistrement vidéo. (B) Points clés d’OpenPose sur un arrière-plan noir, permettant d’obtenir l’anonymat des personnes impliquées tout en préservant la structure essentielle de l’interaction sociale. Adapté de Kojovic et al. (2021).

Nous avons ensuite développé un algorithme d’intelligence artificielle, en utilisant un réseau de neurones artificiels [4] sensible aux relations temporelles entre les éléments. L’algorithme a d’abord « appris » à distinguer les séquences vidéos d’enfants avec un développement typique et de celles réalisées avec des enfants ayant un TSA. L’échantillon d’apprentissage contenait 68 vidéos d’enfants âgés de 1,2 à 5,1 ans, dont la moitié présentant un TSA. Après la phase d’apprentissage automatique, nous avons testé la performance de l’algorithme sur deux échantillons indépendants, le premier composé de 68 enfants (dont 34 avec un TSA) et le deuxième constitué de 101 enfants ayant un TSA. Notre modèle a été capable de correctement identifier les enfants avec autisme dans 81 % des cas, et ceci dans les deux échantillons respectifs. Ces résultats prometteurs suggèrent qu’il est possible de développer des outils automatisés de dépistage de l’autisme qui peuvent être utilisés à grande échelle. Actuellement, notre modèle produit une prédiction du TSA, mais ne permet pas encore de mesurer les différentes caractéristiques de l’autisme de manière automatisée. Nous avons cependant à cœur de pouvoir développer des outils plus fins pour mesurer les manifestations autistiques.

Comme première étape, nous avons confronté les résultats de notre modèle à des mesures standardisées de 27 signes différents d’autisme. Ces analyses ont montré que, sur les 27 signes caractéristiquement analysés dans l’ADOS-2, ceux qui sont les plus liés à la probabilité de TSA, estimée par le réseau de neurones artificiels, étaient ceux ayant une composante non verbale prédominante (l’utilisation atypique/limitée de gestes, la difficulté à diriger
les expressions faciales, des ouvertures sociales inhabituelles, des comportements répétitifs et des intérêts sensoriels inhabituels…). Ces résultats soulignent également le potentiel des séquences vidéos pour renseigner de la particularité des modèles d’interaction non verbale chez les jeunes enfants présentant un TSA. En effet, sur le plan clinique, l’usage atypique du contact visuel et des gestes figurent parmi les caractéristiques les plus visibles et les plus précoces de ce trouble (Lord et al., 1989, 2000, 2012). Nous sommes actuellement en train de travailler à une amélioration de ces outils pour quantifier plus finement ces interactions non verbales.

Conclusion

Dans un futur proche, on peut espérer voir émerger des outils fiables qui identifient de manière automatisée les comportements révélateurs de l’autisme. Ces outils auront le potentiel de révolutionner le dépistage de l’autisme, permettant un accès plus précoce au diagnostic et à l’intervention pour de nombreux enfants. Des mesures plus fines des manifestations autistiques permettraient aussi d’une part à contribuer à soutenir les cliniciennes et cliniciens dans la démarche diagnostique et potentiellement à identifier des sous-groupes distincts dans le large spectre de l’autisme. D’autre part, elles permettraient d’orienter les familles vers des interventions individualisées qui répondent mieux aux besoins de leur enfant.

Autrices

Nada Kojovic
Psychologue, Dr en neurosciences

Département de Psychiatrie UNIGE

nada.kojovic@unige.ch

Marie Schaer
Professeure Associée

Département de Psychiatrie UNIGE

Fondation Pôle Autisme

marie.schaer@unige.ch

Références

American Psychiatric Association [APA]. (2013). Diagnostic and Statistical Manual of Mental Disorders (DSM-5). APA.

Campbell, K., Carpenter, K. L., Hashemi, J., Espinosa, S., Marsan, S., Borg, J. S., Chang, Z., Qiu, Q., Vermeer, S., Adler, E., Tepper, M., Egger, H. L., Baker, J. P., Sapiro, G., & Dawson, G. (2018). Computer vision analysis captures atypical attention in toddlers with autism. Autism , 23 (3), 619-628. https://doi.org/10.1177/1362361318766247

Cao, Z., Hidalgo, G., Simon, T., Wei, S.-E., & Sheikh, Y. (2021). OpenPose: Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields. IEEE Transactions on Pattern Analysis and Machine Intelligence , 43 (1), 172–183. https://doi.org/10.1109/TPAMI.2019.2929257

Dawson, G. (2008). Early behavioral intervention, brain plasticity, and the prevention of autism spectrum disorder. Development and Psychopathology , 20 (3), 775 –803. https://doi.org/10.1017/S0954579408000370

De Belen, R. A. J., Bednarz, T., Sowmya, A., & Del Favero, D. (2020). Computer vision in autism spectrum disorder research: A systematic review of published studies from 2009 to 2019. Translational Psychiatry , 10 (1), Article 1. https://doi.org/10.1038/s41398-020-01015-w

Godel, M., Robain, F., Kojovic, N., Franchini, M., Wood de Wilde, H., & Schaer, M. (2022). Distinct Patterns of Cognitive Outcome in Young Children With Autism Spectrum Disorder Receiving the Early Start Denver Model. Frontiers in Psychiatry , 13 , 835580. https://doi.org/10.3389/fpsyt.2022.835580

Guha, T., Yang, Z., Grossman, R. B., & Narayanan, S. S. (2018). A Computational Study of Expressive Facial Dynamics in Children with Autism. IEEE Transactions on Affective Computing , 9 (1), 14 –20. https://doi.org/10.1109/TAFFC.2016.2578316

Hashemi, J., Tepper, M., Vallin Spina, T., Esler, A., Morellas, V., Papanikolopoulos, N., Egger, H., Dawson, G., & Sapiro, G. (2014). Computer Vision Tools for Low-Cost and Noninvasive Measurement of Autism-Related Behaviors in Infants. Autism Research and Treatment , 2014 , Article 935686. https://doi.org/10.1155/2014/935686

Klintwall, L., Eldevik, S., & Eikeseth, S. (2015). Narrowing the gap: Effects of intervention on developmental trajectories in autism. Autism,19 (1), 53–63. https://doi.org/10.1177/1362361313510067

Kojovic, N., Natraj, S., Mohanty, S. P., Maillart, T., & Schaer, M. (2021). Using 2D video-based pose estimation for automated prediction of autism spectrum disorders in young children. Scientific Reports , 11 (1), Article 15069. https://doi.org/10.1038/s41598-021-94378-z

Lombardo, M. V., Busuoli, E. M., Schreibman, L., Stahmer, A. C., Pramparo, T., Landi, I., Mandelli, V., Bertelsen, N., Barnes, C. C., Gazestani, V., Lopez, L., Bacon, E. C., Courchesne, E., & Pierce, K. (2021). Pre-treatment clinical and gene expression patterns predict developmental change in early intervention in autism. Molecular Psychiatry , 26 , 7641–7651. https://doi.org/10.1038/s41380-021-01239-2

Lord, C., DiLavore, P. C., Gotham, K., Guthrie, W., Luyster, R. J., Risi, S., Rutter, M., & Western Psychological Services (Firm). (2012). Autism diagnostic observation schedule : ADOS-2 . Western Psychological Services.

Lord, C., Risi, S., Lambrecht, L., Cook, E. H., Leventhal, B. L., DiLavore, P. C., Pickles, A., & Rutter, M. (2000). The autism diagnostic observation schedule-generic: A standard measure of social and communication deficits associated with the spectrum of autism. Journal of Autism and Developmental Disorders , 30 (3), 205–223. https://doi.org/10.1023/A:1005592401947

Lord, C., Rutter, M., Goode, S., Heemsbergen, J., Jordan, H., Mawhood, L., & Schopler, E. (1989). Autism diagnostic observation schedule : A standardized observation of communicative and social behavior. Journal of Autism and Developmental Disorders , 19 (2), 185–212. https://link.springer.com/article/10.1007/BF02211841

Maenner, M. J. (2020). Prevalence of Autism Spectrum Disorder Among Children Aged 8 Years –Autism and Developmental Disabilities Monitoring Network, 11 Sites, United States, 2016. MMWR. Surveillance Summaries , 69 (4), 1-12. https://doi.org/10.15585/mmwr.ss6904a1

Robain, F., Franchini, M., Kojovic, N., Wood de Wilde, H., & Schaer, M. (2020). Predictors of Treatment Outcome in Preschoolers with Autism Spectrum Disorder: An Observational Study in the Greater Geneva Area, Switzerland. Journal of Autism and Developmental Disorders , 50 (11), 3815 –3830. https://doi.org/10.1007/s10803-020-04430-6

Yuen, T., Penner, M., Carter, M. T., Szatmari, P., & Ungar, W. J. (2018). Assessing the accuracy of the Modified Checklist for Autism in Toddlers: A systematic review and meta-analysis. Developmental Medicine & Child Neurology , 60 (11), 1093-1100. https://doi.org/10.1111/dmcn.13964

  1. Les termes « Troubles du Spectre de l’Autisme (TSA) » et « autisme » seront utilisés de manière interchangeable.

  2. Le machine learning concerne l’ensemble d’outils de l’intelligence artificielle, qui repose sur la capacité de la machine à apprendre automatiquement à partir de données et d’expériences passées dans le but d’identifier des modèles et faire des prédictions avec un minimum d’intervention humaine.

  3. Le computer vision est un sous-domaine de l’intelligence artificielle permettant aux ordinateurs de dériver des informations à partir d’images, de vidéos et d’autres données.

  4. Le réseau neuronal permet aux programmes de reconnaitre des modèles et de résoudre des problèmes courants dans les domaines de l’intelligence artificielle.