Le premier assistant de laboratoire IA alimenté par GPT-4 dirige de manière indépendante les réactions organiques clés
Des chimistes computationnels basés aux États-Unis ont développé un assistant de recherche en intelligence artificielle (IA) de bout en bout appelé Coscientist, qui prend en charge des tâches fastidieuses telles que la décision des conditions de réaction et l’écriture de code pour les systèmes automatisés. L’équipe de Gabe Gomes de l’Université Carnegie Mellon de Pittsburgh a adapté le modèle de langage étendu (LLM) GPT-4 qui alimente la version payante de ChatGPT pour exécuter différentes fonctions au sein de Coscientist. Les scientifiques ont maintenant officiellement publié la première démonstration de Coscientist permettant de concevoir, planifier et réaliser de manière autonome des réactions de formation de liaisons carbone-carbone catalysées par le palladium, initialement décrites dans une prépublication en avril 2023.
« Coscientist planifie puis conçoit les expériences de manière à ce qu’elles puissent être réalisées avec le matériel dont il dispose, puis les exécute et analyse les résultats », explique Gomes. Monde de la chimie. « Ce cadre de bout en bout est ce qui rend les choses si différentes. »
Les LLM, comme ChatGPT, apprennent les relations entre les mots et les expressions à partir de milliards d’exemples écrits. Ils peuvent ensuite répondre aux invites des utilisateurs en langage naturel. Cette orientation linguistique signifiait que les LLM étaient moins adaptés aux tâches chimiques que d’autres systèmes d’IA tels que les réseaux neuronaux graphiques, qui représentent mieux les structures moléculaires. Cependant, des chercheurs, dont des scientifiques d’IBM, ont utilisé avec succès l’IA de traitement du langage naturel en chimie.
L’équipe de Gomes a commencé à expérimenter les LLM en octobre 2022. Cela signifie que les lancements du système ChatGPT d’OpenAI en novembre 2022 et du GPT-4 encore plus avancé en mars 2023 étaient parfaitement synchronisés. Les chercheurs de Carnegie Mellon ont rapidement exploité GPT-4. « Mon prototype déjanté était capable de vraiment bien faire des choses », se souvient Gomes.
Un coscientifique sur la bonne voie
Bientôt, l’équipe de Gomes a exploité GPT-4 dans quatre modules logiciels. L’un d’entre eux, au cœur de Coscientist, est un module de planification. Il fait référence à d’autres modules, dont un qui recherche sur Internet et dans des articles universitaires des informations publiques sur les composés chimiques. Un troisième module intègre le texte des manuels d’instructions des équipements de laboratoire robotique et demande au LLM de rechercher des informations sur la façon de contrôler cet équipement. Un quatrième module analyse les données des expériences pour voir ce qui a fonctionné et ce qui n’a pas fonctionné. Le module de planification de base de Coscientist peut également faire référence à un cinquième module qui n’utilise pas GPT-4, mais qui exécute séparément le code du langage de programmation Python pour effectuer des calculs afin d’aider à préparer les expériences.
Le système qui en résulte planifie, conçoit et exécute de manière autonome des réactions chimiques, « à partir d’une seule invite en anglais », selon Gomes. Le principal exemple initial de son équipe demande à Coscientist d’effectuer des réactions de formation de liaisons carbone-carbone catalysées par le palladium de Suzuki et Sonogashira. L’invite utilisée par les doctorants de Gomes, Daniil Boiko et Robert MacKnight, indique au Coscientist où se trouvent les réactifs dans une plaque en plastique multipuits. Ils comprenaient quatre halogénures d’aryle, un alcyne, un acide boronique, deux catalyseurs au palladium et deux bases aminés, ainsi qu’un solvant. En moins de quatre minutes, Coscientist a conçu des procédures de réaction précises. La chromatographie en phase gazeuse et la spectrométrie de masse ont montré que Coscientist avait réussi à fabriquer ses produits cibles.
Capacités et préoccupations
D’autres exercices démontrent également les capacités de Coscientist. Certains montrent qu’il peut distribuer avec précision des liquides colorés dans des plaques multipuits en plastique selon des modèles décrits dans une invite. D’autres n’impliquaient pas d’expériences en laboratoire, comme la planification de procédures chimiques pour fabriquer des analgésiques courants tels que l’aspirine, l’acétaminophène et l’ibuprofène. L’équipe de Gomes a également demandé à Coscientist d’optimiser les conditions de réaction, en utilisant les informations provenant d’ensembles de données préexistants – plutôt que de nouvelles expériences – pour savoir si l’opération avait réussi.
Les limites et les préoccupations soulignées par l’équipe de Gomes incluent le fait que lorsqu’on demande à Coscientist d’effectuer de nouvelles tâches comportant des risques inconnus, il est important d’avoir un humain « au courant ». « Si vous faites quelque chose qui a été fait des centaines de fois, c’est sans danger », ajoute Gomes. « Absolument rien ne vous empêche de gérer Coscientist de manière totalement autonome. Un autre problème est que les tests de l’équipe de Carnegie Mellon montrent que Coscientist peut produire des drogues contrôlées et des armes chimiques lorsqu’on le lui demande. « Nous résolvons certains de ces problèmes par nous-mêmes, mais la réalité est également que nous avons besoin d’aide. »
Alán Aspuru-Guzik de l’Université de Toronto compare avec enthousiasme Coscientist au type d’assistant que lui et d’autres chimistes avaient imaginé en 2018. « Cet article montre que les données d’Internet sont suffisantes pour pouvoir planifier des réactions chimiques », ajoute Aspuru-Guzik. . Un autre point fort est qu’il utilise la technologie d’automatisation de laboratoire existante, plutôt qu’une technologie de type humanoïde moins bien établie que l’équipe de Toronto a utilisée dans un système alimenté par GPT-3 révélé en août 2023.
Niveau supérieur
Coscientist se classe aux côtés d’un système similaire alimenté par GPT-4 appelé ChemCrow, note Aspuru-Guzik. La première prépublication de ChemCrow a été publiée en même temps que celle de Coscientist en avril 2023. À ce stade, ChemCrow n’était pas intégré à l’automatisation, ce que ses développeurs ont réalisé dans les versions mises à jour de la prépublication plus tard en 2023. Pendant ce temps, Coscientist n’a pas encore produit de prépublication. De nouvelles découvertes qui ont été publiées, poursuit Aspuru-Guzik, et il veut également des preuves démontrant qu’elles sont « très robustes ». « Davantage de travail sera effectué. Mais ce document est un bon premier pas.
L’une des implications potentielles de ces assistants IA est de mettre fin aux longues journées de laboratoire pour les doctorants, ce que Gomes se félicite. Cela ne signifiera pas nécessairement moins de travail pour un doctorat, dit-il, mais cela changera simplement ce que font les gens. « Les scientifiques peuvent avoir des idées bien plus avancées. »
Aujourd’hui, des mois après les expériences décrites dans cet article, Coscientist réalise déjà des analyses de synthèse automatisées beaucoup plus importantes, ajoute Gomes. « Le week-end dernier, nous avons reçu plus de 1 000 réactions en un seul week-end », dit-il, contre seulement une poignée dans le journal récemment publié. «Nous construisons le plus grand ensemble de données de réactions expérimentales avec cinétique – Coscientist dirige ces efforts.»