Vue d’artiste de l’intérieur d’une cellule. Les éléments colorés sont des protéines. « Digital Renders by Evan Ingersoll & Gael McGill Paintings by David Goodsell ». Vue d’artiste de l’intérieur d’une cellule. Les éléments colorés sont des protéines. « Digital Renders by Evan Ingersoll & Gael McGill Paintings by David Goodsell ».

Entre physique et biologie déchiffrer le mouvement des protéines

Dossier : Nouvelles du PlatâlMagazine N°782 Février 2023
Par Hippolyte VERDIER (X14)

Observ­er le mou­ve­ment des pro­téines, c’est suiv­re le détail du fonc­tion­nement de la machiner­ie cel­lu­laire. Avec la thèse présen­tée ici, on con­tribue à la con­struc­tion d’une méthodolo­gie robuste qui per­me­t­tra aux chercheurs de tir­er les con­clu­sions les plus exactes pos­si­bles de leurs obser­va­tions, aus­si bien pour la mise au point de médica­ments que pour des expéri­ences de biolo­gie cellulaire.

Selon les prob­lé­ma­tiques abor­dées, le biol­o­giste s’intéressera tan­tôt aux pro­priétés d’un être tout entier, d’un organe, d’un embry­on, d’un amas de cel­lules, voire encore d’une sim­ple cel­lule, d’une de ses sous-par­ties ou même à la chimie des molécules qui con­stituent la matière biologique. Bien qu’entremêlées les unes aux autres, ces dif­férentes échelles du vivant requièrent cha­cune l’utilisation de méth­odes expéri­men­tales et d’outils d’analyse adaptés.

Au cours de ma thèse, j’ai dévelop­pé une nou­velle méthode d’analyse du mou­ve­ment des pro­téines, dont l’échelle car­ac­téris­tique se situe entre celle de la cel­lule et celle de la molécule : plus « macro » que l’échelle de la chimie, mais suff­isam­ment petite pour que les phénomènes aléa­toires dus à l’agitation ther­mique y soient prépondérants – une échelle pour laque­lle la physique et les sta­tis­tiques offrent de pré­cieuses clés de com­préhen­sion. J’ai notam­ment util­isé cette méthode pour aider Sanofi à valid­er une nou­velle immunothérapie et pour analyser les expéri­ences d’un chercheur s’intéressant aux orig­ines molécu­laires de la mal­adie de Parkinson.


En illus­tra­tion : Vue d’artiste de l’intérieur d’une cel­lule. Les élé­ments col­orés sont des pro­téines. « Dig­i­tal Ren­ders by Evan Inger­soll & Gael McGill Paint­ings by David Goodsell ».


Le mouvement aléatoire des protéines

Pour com­pren­dre l’intérêt et la com­plex­ité de l’étude du mou­ve­ment des pro­téines dans les cel­lules, il est bon d’avoir à l’esprit quelques ordres de grandeur. Tout d’abord, le diamètre typ­ique d’une cel­lule est de quelques micromètres. Un niveau plus petit, l’ordre de grandeur de la taille des organelles, c’est-à-dire des com­par­ti­ments ou des unités fonc­tion­nelles d’une cel­lule, est le micromètre. Pour com­pren­dre le fonc­tion­nement de ces dernières, on peut notam­ment s’intéresser à leurs prin­ci­paux com­posants « act­ifs » : les protéines.

Ces gross­es molécules sont les petites mains de la cel­lule, ce sont elles qui con­som­ment l’énergie, régu­lent les flux, trans­met­tent les sig­naux, etc. Elles mesurent quelques nanomètres de diamètre et sont per­cutées en per­ma­nence par les molécules d’eau qui les entourent, ce qui rend leur mou­ve­ment erra­tique – il est dit « dif­fusif ». En quelques sec­on­des, au gré de ces fluc­tu­a­tions aléa­toires, une pro­téine peut ain­si tra­vers­er la cel­lule dans laque­lle elle se trou­ve. Cepen­dant, les pro­priétés dynamiques d’une même pro­téine peu­vent vari­er con­sid­érable­ment au cours du temps, selon sa géométrie, qui déter­mine notam­ment sa propen­sion à se lier avec d’autres, ou selon l’endroit où elle se trou­ve : enchevêtrée dans une zone peu­plée d’obstacles, elle sera cer­taine­ment moins mobile.

Un désordre bien organisé

Le mou­ve­ment d’une pro­téine sem­ble donc, à pre­mière vue, en grande par­tie gou­verné par le hasard. Pour­tant, la machiner­ie cel­lu­laire, pour rem­plir ses fonc­tions, ne saurait évidem­ment pas se con­tenter d’un désor­dre « homogène » : chaque pro­téine doit être achem­inée là où elle a son rôle, de manière à ce que des sous-unités fonc­tion­nelles appa­rais­sent au sein de la cel­lule. Par exem­ple, les canaux respon­s­ables de l’équilibre des ions entre l’intérieur et l’extérieur de la cel­lule sont com­posés de plusieurs pro­téines dif­férentes, qui doivent être local­isées au même endroit pour que le canal puisse être assemblé.

De même, les récep­teurs chargés de détecter la présence de l’une ou l’autre molécule dans l’environnement de la cel­lule doivent être con­duits à la mem­brane pour rem­plir leur fonc­tion. En fait, la dynamique de dif­fu­sion est intime­ment reliée à la fonc­tion des pro­téines et est donc sus­cep­ti­ble de vari­er grande­ment d’un type de pro­téine à l’autre. Ain­si, puisque toutes les pro­téines n’ont pas les mêmes pro­priétés de dif­fu­sion aux mêmes endroits, cer­taines pré­domi­nent là où d’autres se font rares ; d’autres encore sont con­finées à cer­taines régions.

Certains médicaments affectent le mouvement des protéines

Pen­dant ma thèse, je me suis attaché à tra­vailler sur des exem­ples d’applications, pour lesquels il était impor­tant de com­pren­dre le mou­ve­ment de ces si petits com­posants de la cel­lule. J’ai notam­ment tra­vail­lé avec une équipe de recherche de Sanofi chargée d’évaluer les molécules en développe­ment et de sélec­tion­ner les meilleurs can­di­dats. Le pro­jet auquel ont con­tribué mes travaux por­tait sur la mise au point de nou­velles immunothérapies con­tre le can­cer, c’est-à-dire de traite­ments visant à stim­uler les cel­lules T (qui sont au cœur de la réponse immu­ni­taire) pour qu’elles « s’activent » et attaque­nt les cel­lules cancéreuses.

Plus pré­cisé­ment, je me suis intéressé au mou­ve­ment de récep­teurs con­nus pour être capa­bles de déclencher ou d’atténuer l’activation des cel­lules T. Situées à la mem­brane, et donc en con­tact à la fois avec l’intérieur et avec l’extérieur de la cel­lule, ces pro­téines enclenchent un mécan­isme dans la cel­lule lorsque se fix­ent à leur par­tie externe des anti­corps présents dans l’environnement de la cel­lule. En temps nor­mal, ces anti­corps sont pro­duits par les cel­lules de l’organisme qui dys­fonc­tion­nent, pour sig­naler leur état aux cel­lules T voisines afin d’être élim­inées ; mais cer­taines cel­lules can­céreuses blo­quent cette sig­nal­i­sa­tion, passent donc inaperçues et pro­lifèrent. Les immunothérapies visent à con­tr­er cette stratégie en intro­duisant de façon arti­fi­cielle des anti­corps capa­bles, en quelque sorte, d’appuyer sur l’interrupteur.

Observer l’action des anticorps

Les dif­férents mécan­ismes d’activation sont encore assez mécon­nus, et l’on sait notam­ment peu de chose de leurs toutes pre­mières étapes, qui suiv­ent la détec­tion des anti­corps. Quel que soit l’effet de l’anticorps sur le récep­teur auquel il se lie, il est prob­a­ble que le mou­ve­ment de ce dernier s’en trou­ve affec­té, de façon plus ou moins mar­quée : il a été observé dans cer­tains cas que les récep­teurs s’immobilisent com­plète­ment, mais le change­ment n’est pas tou­jours aus­si mar­qué. Au cours d’expériences, nous avons cher­ché à observ­er les éventuels change­ments de dynamique induits par les anti­corps can­di­dats, pour car­ac­téris­er d’éventuelles vari­a­tions d’intensité, voire de nature, dans les effets pro­duits sur le mou­ve­ment du récepteur.

Pour mesur­er son mou­ve­ment, nous avons mar­qué le récep­teur afin de pou­voir l’observer et avons filmé son déplace­ment dans des cel­lules activées avec cha­cun des dif­férents anti­corps. L’objet de ma thèse a été de dévelop­per une méthode pour com­par­er les tra­jec­toires ain­si observées et détecter d’éventuelles dif­férences. Avant d’être ain­si éval­ués, les anti­corps sont bien sûr testés d’autres manières : on sait par exem­ple qu’ils sont capa­bles, dans des con­di­tions bien pré­cis­es, de se lier à leur cible. Mais les expéri­ences qui le prou­vent sont effec­tuées dans des milieux très sim­pli­fiés, loin de repro­duire toute la com­plex­ité d’une cellule.

“Les protéines sont percutées par les molécules d’eau, ce qui rend leur mouvement erratique.”

Ain­si, il est pos­si­ble qu’un anti­corps se fixe bien à sa cible dans un tube à essai, mais en soit inca­pable lorsque ce récep­teur est situé à la mem­brane d’une cel­lule, parce que des con­traintes géométriques l’empêchent de se lier de la même façon ou bien parce qu’il se lie mieux à une autre pro­téine présente à la sur­face de la cel­lule, qui le détourn­era de sa cible ini­tiale. Il existe d’autres moyens de véri­fi­er que les anti­corps ont bien provo­qué le stim­u­lus atten­du, par exem­ple en mesurant la con­cen­tra­tion de cer­taines pro­téines sécrétées par les cel­lules lorsqu’elles sont activées.

Mais mon tra­vail de thèse per­met d’observer une étape inter­mé­di­aire, elle donne accès à un nou­veau niveau de détail sur le mode d’action des anti­corps sur leur cible. Au-delà de la com­para­i­son de molécules can­di­dates, l’analyse du mou­ve­ment des pro­téines est un out­il générique qui per­met, selon le pro­to­cole expéri­men­tal choisi, une meilleure com­préhen­sion de leur rôle au sein de la cel­lule et de la manière dont ce mou­ve­ment par­ticipe aux dif­férentes fonc­tions dans lesquelles les pro­téines sont impliquées.

Décrire des trajectoires très diverses

L’exploitation des obser­va­tions de tra­jec­toires de pro­téines n’en est pour­tant qu’à ses bal­bu­tiements : plusieurs dif­fi­cultés com­pliquent en effet l’analyse, et je me suis attaché durant cette thèse à con­stru­ire une méthodolo­gie qui y soit la moins vul­nérable pos­si­ble. La pre­mière dif­fi­culté est d’identifier un « mod­èle » générique, dont les tra­jec­toires seraient une réal­i­sa­tion et dont on s’attachera à déter­min­er les paramètres. Un mod­èle sim­ple de mou­ve­ment aléa­toire est celui du mou­ve­ment brown­ien, dans lequel chaque déplace­ment est indépen­dant des précé­dents, suiv­ant une dis­tri­b­u­tion cen­trée dont la vari­ance con­stitue le seul paramètre du modèle. 

Bien qu’il soit une bonne pre­mière approx­i­ma­tion, celui-ci est loin de cap­tur­er toute la com­plex­ité du mou­ve­ment des pro­téines dans les cel­lules : comme nous l’avons vu plus haut, leur dynamique change en fonc­tion de la région de la cel­lule dans laque­lle elles se trou­vent. Heureuse­ment, les physi­ciens n’avaient pas atten­du de pou­voir observ­er le mou­ve­ment de pro­téines pour s’intéresser aux march­es aléa­toires : celles-ci ont, entre autres appli­ca­tions, été étudiées dès le siè­cle dernier pour mieux com­pren­dre le mou­ve­ment des élec­trons dans les métaux, qui déter­mine leurs pro­priétés de con­duc­tion. Plusieurs mod­èles de march­es aléa­toires, prenant cha­cun en compte un type de « dévi­a­tion » du mod­èle cen­tral qu’est le mou­ve­ment brown­ien, ont donc été imaginés. 

Une méthode qui emprunte à plusieurs modèles physiques

Pour que les pro­priétés du mou­ve­ment soient cal­cu­la­bles ana­ly­tique­ment, ces mod­èles sont restés rel­a­tive­ment sim­ples, ou en tout cas trop sim­ples pour qu’on puisse raisonnable­ment les estimer capa­bles de ren­dre compte de toute la com­plex­ité du mou­ve­ment des pro­téines dans les cel­lules. Il est plus raisonnable de s’attendre à ce que plusieurs des effets que mod­élisent les types de march­es aléa­toires « clas­siques » agis­sent simul­tané­ment sur la dif­fu­sion des pro­téines dans les cel­lules. C’est pourquoi la méthode que j’ai dévelop­pée per­met d’interpoler entre plusieurs de ces modèles. 

Par ailleurs, comme dans pra­tique­ment tous les cas d’analyse de don­nées, il est néces­saire de définir un niveau de gran­u­lar­ité adap­té à la quan­tité et à la qual­ité des obser­va­tions dont on dis­pose. Les con­di­tions expéri­men­tales font que la quan­tité de tra­jec­toires observées varie de plusieurs ordres de grandeur selon les expéri­ences, le type de pro­téine observé, etc. Ma méthode asso­cie un mod­èle à un ensem­ble de tra­jec­toires : plus l’ensemble est grand, plus le mod­èle sera déter­miné avec pré­ci­sion, mais une cen­taine de tra­jec­toires don­nent sou­vent une bonne pre­mière approx­i­ma­tion et la gran­u­lar­ité peut donc être ajustée en con­séquence : si l’on dis­pose de mil­liers de tra­jec­toires par cel­lule, on pour­ra com­par­er entre elles les dif­férentes régions de la cel­lule. Cepen­dant, si l’on n’en observe qu’une cen­taine par cel­lule, on pour­ra tout de même ne con­sid­ér­er qu’un ensem­ble par cel­lule et utilis­er ma méthode pour com­par­er entre elles ces dernières. 

Un algorithme entraîné sur des simulations

Au début de ma thèse, j’ai par­ticipé à un con­cours sci­en­tifique – une manière de sus­citer beau­coup d’émulation au sein d’une com­mu­nauté de chercheurs et de com­par­er les méth­odes pro­posées selon des métriques com­munes – dont les résul­tats ont mon­tré que les réseaux de neu­rones sont aujourd’hui les meilleurs algo­rithmes con­nus pour estimer les paramètres de dif­fu­sion. J’ai donc choisi, pour car­ac­téris­er les tra­jec­toires, d’utiliser un tel réseau, c’est-à-dire une fonc­tion paramé­tra­ble dont les coef­fi­cients sont ajustés au cours d’une phase d’apprentissage (appelée aus­si « entraînement »).

“L’analyse du mouvement des protéines permet une meilleure compréhension de leur rôle au sein de la cellule.”

Ces out­ils sont large­ment util­isés pour l’analyse d’images et ce sont eux qui ont tiré le développe­ment de l’intelligence arti­fi­cielle ces dernières décen­nies. Cepen­dant, leur entraîne­ment requiert sou­vent d’importantes quan­tités de don­nées : par exem­ple, les algo­rithmes qui se pro­posent d’aider les radi­o­logues à iden­ti­fi­er les zones les plus intéres­santes sur une radi­ogra­phie néces­si­tent de dis­pos­er de mil­liers d’exemples préal­able­ment annotés. Ici, on a l’avantage de pou­voir créer à la fois les don­nées et les anno­ta­tions : puisque la physique des march­es aléa­toires est assez bien con­nue, il est pos­si­ble de simuler des tra­jec­toires dont on con­naît les paramètres de diffusion. 

Ain­si, en util­isant unique­ment des tra­jec­toires simulées, j’ai entraîné un réseau de neu­rones à infér­er les paramètres de dif­fu­sion et ai pu l’utiliser pour analyser des tra­jec­toires de pro­téines observées dans les cel­lules. La con­di­tion pour que cette approche fonc­tionne est que les tra­jec­toires simulées à l’entraînement « ressem­blent » assez aux tra­jec­toires observées. Je me suis donc assuré que les échelles de temps et d’espace cor­re­spon­dent, et j’ai util­isé plusieurs types de march­es aléa­toires à l’entraînement, de façon à cou­vrir une grande var­iété de dynamiques de diffusion.

Trajectoires de protéines à la membrane d’une cellule. Les moins mobiles sont en bleu, les plus rapides en jaune. Toutes les protéines sont du même type. © Hippolyte Verdier
Tra­jec­toires de pro­téines à la mem­brane d’une cel­lule. Les moins mobiles sont en bleu, les plus rapi­des en jaune. Toutes les pro­téines sont du même type. © Hip­poly­te Verdier

Décrire les trajectoires avec un réseau de neurones 

Pour pro­duire l’estimation qu’on l’a entraîné à fournir, un réseau de neu­rones applique à la tra­jec­toire une série d’opérations. Le plus sou­vent, seul importe le résul­tat de la dernière opéra­tion, qui con­stitue la sor­tie du réseau. Dans notre cas, il s’agit d’estimations de deux paramètres physiques couram­ment util­isés pour décrire les march­es aléa­toires. Mais, si l’on regarde quelques étapes en amont, il est pos­si­ble de « décom­pos­er » l’estimation en plusieurs fac­teurs, un peu comme plusieurs axes d’une carte sur laque­lle le réseau plac­erait chaque trajectoire. 

Pen­dant son appren­tis­sage, le réseau con­stru­it des axes de plus en plus per­ti­nents, et cal­cule sa pré­dic­tion à par­tir de la posi­tion des tra­jec­toires sur cette carte. Appelée « espace latent », cette représen­ta­tion n’est pas directe­ment inter­prétable, parce que le réseau n’explique pas à quoi cor­re­spond chaque dimen­sion ; néan­moins, elle con­tient plus d’informations sur la tra­jec­toire que la sim­ple sor­tie du réseau – elle a été opti­misée pour encap­suler au mieux l’information qui lui per­met d’estimer ensuite des grandeurs physiques. 

J’ai donc choisi d’utiliser l’espace latent pour com­par­er les tra­jec­toires : ma méthode con­siste en fait à com­par­er les dis­tri­b­u­tions dans l’espace latent issues de deux ensem­bles de tra­jec­toires, afin d’estimer si elles présen­tent des dif­férences sta­tis­tique­ment sig­ni­fica­tives. Cela per­met, plutôt que de se con­cen­tr­er sur un critère préétabli, de com­par­er les tra­jec­toires selon plusieurs aspects en même temps, ce qui est par­ti­c­ulière­ment utile lorsque l’on n’a pas d’a pri­ori, c’est-à-dire lorsque l’on n’a pas d’hypothèse pré­cise au sujet de la dif­fu­sion des pro­téines qu’on observe – une sit­u­a­tion fréquente quand on s’intéresse à un sys­tème biologique encore peu exploré.

Une plateforme web pour l’analyse

Tout au long de ma thèse, j’ai échangé avec de nom­breux biol­o­gistes, au sein de Sanofi et dans des lab­o­ra­toires de recherche académique, afin de com­pren­dre les out­ils qu’ils utilisent aujourd’hui pour analyser le mou­ve­ment des pro­téines aux­quelles ils s’intéressent. J’ai pu con­stater que les méth­odes vari­ent grande­ment selon les domaines et les lab­o­ra­toires, néces­si­tent plusieurs out­ils logi­ciels plus ou moins acces­si­bles et faciles d’usage, ce qui nuit par­fois à la portée des résul­tats obtenus et à leur repro­ductibil­ité. De plus, peu d’études esti­ment aujourd’hui la sig­ni­fica­tiv­ité sta­tis­tique des résul­tats tirés d’analyses de trajectoire.

Après avoir éprou­vé ma méthode sur des don­nées provenant de plusieurs expéri­ences dif­férentes, de Sanofi et d’ailleurs, j’ai donc voulu la ren­dre acces­si­ble au plus grand nom­bre, via un out­il d’analyse en ligne. J’ai dévelop­pé pour cela un por­tail sur lequel les chercheurs peu­vent dépos­er leurs tra­jec­toires, les analyser avec mon algo­rithme et visu­alis­er puis télécharg­er les résul­tats. À terme, j’espère que cette plate-forme per­me­t­tra d’intégrer plusieurs autres types d’analyses, pour pren­dre en compte de nou­veaux cas d’usage, et d’en partager les résul­tats, afin de per­me­t­tre une plus grande trans­parence sur l’ensemble de l’analyse.

Conclusion

Observ­er le mou­ve­ment des pro­téines, c’est suiv­re le détail du fonc­tion­nement de la machiner­ie cel­lu­laire. Avec cette thèse, j’espère avoir con­tribué à la con­struc­tion d’une méthodolo­gie robuste qui per­me­t­tra aux chercheurs de tir­er les con­clu­sions les plus exactes pos­si­bles de leurs obser­va­tions, aus­si bien pour la mise au point de médica­ments que pour des expéri­ences de biolo­gie cellulaire.


Informations sur la thèse

J’ai réal­isé ma thèse entre le lab­o­ra­toire « Déci­sion et proces­sus Bayésien » dirigé par Jean-Bap­tiste Mas­son à l’institut Pas­teur, et une équipe du départe­ment « Médecine de pré­ci­sion » de Sanofi, située sur le site de Vit­ry-sur-Seine. J’ai béné­fi­cié pour cela d’un con­trat CIFRE (Con­ven­tion indus­trielle de for­ma­tion par la recherche), une forme de col­lab­o­ra­tion qui per­met aux lab­o­ra­toires phar­ma­ceu­tiques de nouer des liens avec la recherche académique. La thèse a été soutenue le 4 octo­bre 2022 devant un jury com­posé de :

  • BERRY Hugues, Directeur de recherche INRIA
  • PRESSE Steve,
  • ALEXANDROU Antigo­ni,
  • ALLASSONNIERE Stéphanie,
  • Mme EL KAROUI Meriem,
  • FRANÇOIS Paul,
  • LOUPE Gilles,
  • SAUER Markus,
  • CASSE Alhas­san,
  • MASSON Jean-Bap­tiste


Informations sur le laboratoire

Le lab­o­ra­toire de Jean-Bap­tiste Mas­son vient d’être con­fir­mé pour dix nou­velles années à l’Institut. On y étudie les moyens sélec­tion­nés par l’évolution pour servir de méth­odes de déci­sion aux organ­ismes biologiques. Plusieurs doc­tor­ants, post-doc­tor­ants, ingénieurs de recherche et chercheurs per­ma­nents (dont des poly­tech­ni­ciens) s’intéressent pour cela, avec plusieurs approches, au com­porte­ment de la larve de mouche – un des rares organ­ismes dont la struc­ture de con­nex­ion des neu­rones entre eux soit entière­ment connue.

Cela per­met de mieux com­pren­dre les liens entre les stim­uli aux­quels sont soumis les larves, l’activation de leurs neu­rones, la réponse de leur sys­tème moteur et in fine l’influence sur leur com­porte­ment. D’autres tra­vail­lent sur un dis­posi­tif de réal­ité virtuelle qui per­met aux médecins de visu­alis­er des scan­ners en trois dimen­sions afin de mieux pré­par­er cer­taines opéra­tions, ou d’affiner des diag­nos­tics. Le lab­o­ra­toire col­la­bore sur cer­tains sujets avec la start-up Avatar Med­ical, cofondée par Jean-Bap­tiste Mas­son et un de ses anciens étudiants.


Poster un commentaire