Haut
MaisonMaison > Blog > Haut

Haut

Jan 02, 2024

Nature Biotechnology (2023)Citer cet article

Accès 24k

5 Citations

172 Altmétrique

Détails des métriques

Les cultures bactériennes pures restent essentielles pour des études expérimentales et mécanistes détaillées dans la recherche sur le microbiome, et les méthodes traditionnelles pour isoler des bactéries individuelles d'écosystèmes microbiens complexes demandent beaucoup de travail, sont difficiles à mettre à l'échelle et manquent d'intégration phénotype-génotype. Nous décrivons ici une plate-forme d'isolement de souche robotique à haut débit open-source pour la génération rapide d'isolats à la demande. Nous développons une approche d'apprentissage automatique qui exploite la morphologie des colonies et les données génomiques pour maximiser la diversité des microbes isolés et permettre une sélection ciblée de genres spécifiques. L'application de cette plateforme sur des échantillons fécaux de 20 humains donne des biobanques de microbiome intestinal personnalisées totalisant 26 997 isolats qui représentaient > 80 % de tous les taxons abondants. L'analyse spatiale de plus de 100 000 colonies capturées visuellement révèle des modèles de co-croissance entre les familles Ruminococcaceae, Bacteroidaceae, Coriobacteriaceae et Bifidobacteriaceae qui suggèrent d'importantes interactions microbiennes. L'analyse comparative de 1 197 génomes de haute qualité provenant de ces biobanques montre une évolution, une sélection et un transfert horizontal intéressants des souches intra et interpersonnelles. Ce cadre de culturomique devrait permettre de nouveaux efforts de recherche pour systématiser la collecte et l'analyse quantitative des phénotypes basés sur l'imagerie avec des données génomiques à haute résolution pour de nombreuses études émergentes sur le microbiome.

La métagénomique offre la possibilité d'étudier largement la composition de divers écosystèmes microbiens allant des communautés du sol au microbiome intestinal. Pourtant, les microbes doivent être isolés et cultivés pour disséquer mécaniquement leurs rôles fonctionnels dans l'habitat et la myriade de processus interspécifiques qui se produisent. Les méthodes de culture traditionnelles reposant sur la cueillette aléatoire de colonies par «force brute» sont fastidieuses et à forte intensité de main-d'œuvre1,2,3,4. Les méthodes d'isolement basées sur la dilution en série utilisant 96 ou 384 puits sont gourmandes en ressources et entraînent l'isolement répété des mêmes souches dominantes de la population5. Les systèmes microfluidiques permettent la croissance dans des réacteurs nanolitres, mais les isolats clonaux sont difficiles à extraire6,7. Étant donné qu'un microbiome typique peut contenir des centaines à des milliers d'espèces uniques présentant une distribution d'abondance à longue queue8 (c'est-à-dire que peu dominent alors que la plupart sont rares), la génération de collections complètes de souches via la culturomique systématique reste un défi important et exceptionnel.

Les microbes peuvent être distingués en fonction de leurs divers phénotypes, que ce soit par leur capacité à se développer dans certains milieux ou par les métabolites qu'ils produisent9,10,11,12. La sélection basée sur la croissance peut améliorer l'isolement d'espèces rares, par exemple, avec des milieux de croissance contenant différents nutriments ou antibiotiques1,2,13. Les spectres de spectrométrie de masse peuvent être utilisés pour différencier les espèces14,15, mais l'approche est à faible débit et nécessite un traitement manuel. Le tri cellulaire activé par l'imagerie a été développé pour isoler les cellules eucaryotes sur la base d'images multidimensionnelles, mais cette méthode nécessite une instrumentation sophistiquée et n'a pas été mise en œuvre pour les bactéries16. Avec les progrès récents de l'intelligence artificielle (IA) et des modèles d'apprentissage en profondeur formés pour discerner les caractéristiques nuancées de l'imagerie multidimensionnelle et des données biologiques17, l'apprentissage automatique (ML) de flux de données phénotypiques et génomiques combinés est sur le point de transformer la culturomique microbienne de nouvelle génération.

Nous décrivons ici une plate-forme robotique d'isolement et de génotypage de souches guidée par ML qui permet la génération rapide et à haut débit de biobanques cultivées à la demande. Ce système utilise un algorithme intelligent basé sur l'imagerie pour augmenter la diversité taxonomique de la culturomique par rapport à une méthode de sélection aléatoire. Nous avons démontré l'utilité de ce système en générant de manière anaérobie des biobanques d'isolats personnalisées pour 20 participants humains, produisant un total de 26 997 isolats avec 1 197 projets de génomes de haute qualité, couvrant 394 variants de séquence d'amplicon 16S (ASV). En utilisant les informations génomiques et morphologiques appariées pour chaque isolat, nous avons formé un modèle ML qui peut prédire l'identité taxonomique en se basant uniquement sur la morphologie de la colonie. L'application de ce modèle ML a conduit à une amélioration de l'isolement ciblé des microbes d'intérêt. L'analyse par imagerie à grande échelle de toutes les colonies cultivées sur des plaques de gélose a révélé d'intéressants schémas de croissance spécifiques à l'espèce et des interactions interespèces. L'analyse du génome entier à partir de biobanques personnalisées a révélé une variation au niveau de la souche spécifique à la personne et des signatures de transfert horizontal de gènes (HGT) au sein des principaux phylums intestinaux. Nous avons en outre développé une base de données Web en libre accès (http://microbial-culturomics.com/) contenant des données génotypiques, morphologiques et phénotypiques consultables de tous les isolats générés par la culturomique automatisée en tant que ressource communautaire unique et en expansion pour le domaine du microbiome.

Le prélèvement de colonies est une méthode microbiologique classique pour isoler par clonage des souches bactériennes. La croissance des colonies sur les plaques dépend de nombreux facteurs, dont la composition du milieu (par exemple, les nutriments disponibles), les conditions atmosphériques (par exemple, le niveau d'oxygénation), la présence de molécules inhibitrices (par exemple, les antibiotiques), le pH, l'humidité et les effets d'autres métabolites diffusibles dérivés de colonies voisines18,19,20. Différentes morphologies de colonies sont observées en fonction des différences physiologiques spécifiques à la souche, influencées par la forme cellulaire, la rigidité, la motilité et la cinétique de croissance, ainsi que la production de molécules pigmentées ou de matrices extracellulaires et de surfactants9,10,11,12. Bien que ces traits de colonie soient facilement quantifiables, ils sont rarement documentés lors de l'isolement de la colonie. En conséquence, la cueillette sélective de colonies à l'aide de caractéristiques visuelles est généralement qualitative et non standardisée, et les résultats peuvent varier considérablement entre les expériences et les expérimentateurs. Pour remédier à ces lacunes, nous avons conçu une plate-forme baptisée Culturomics by Automated Microbiome Imaging and Isolation (CAMII) pour systématiser la culturomique avec des données morphologiques et génotypiques pour l'isolement des colonies et l'analyse fonctionnelle.

La plate-forme CAMII se compose de quatre éléments clés (Fig. 1a) discutés comme suit : (1) un système d'imagerie qui collecte les données morphologiques des colonies et un algorithme de sélection de colonies guidé par l'IA, (2) un robot automatisé de prélèvement de colonies pour les hautes isolement et mise en réseau des isolats, (3) un pipeline rentable pour générer rapidement des données génomiques pour les isolats sélectionnés et (4) une biobanque physique d'isolats et une base de données numérique avec des informations consultables sur la morphologie, le phénotype et le génotype des colonies. Ainsi, cette plate-forme culturomique de bout en bout peut produire des collections d'isolats à partir de divers microbiomes d'entrée avec un travail manuel minimisé. L'ensemble du système d'imagerie et d'isolement est construit à l'aide de composants prêts à l'emploi logés dans une chambre anaérobie qui permet de contrôler en temps réel la température, l'humidité et les niveaux d'oxygène (Fig. 1b et tableau supplémentaire 1). Le robot CAMII a un débit d'isolement de 2 000 colonies par heure et peut gérer 12 000 colonies par cycle, ce qui est une capacité > 20 fois supérieure et plus rapide que l'isolement manuel des colonies par une personne. Pour nous assurer que notre capacité d'analyse génomique correspond au débit d'isolement robotique, nous avons également développé un pipeline de séquençage à faible coût et à haut débit qui tire parti de l'automatisation de la manipulation des liquides pour générer des bibliothèques de codes à barres pour le séquençage d'ARNr 16S ou le séquençage du génome entier (WGS ; Méthodes). Le coût par isolat dans ce pipeline est de 0,45 USD pour l'isolement de colonies et la préparation de l'ADN génomique (ADNg), de 0,46 USD pour le séquençage de l'ARNr 16S et de 6,37 USD pour le WGS avec une couverture > 60 × sur une plate-forme Illumina HiSeq, ce qui est nettement moins cher que les services commerciaux ( Tableau supplémentaire 2).

a, Cadre d'isolement des souches basé sur le phénotype et la morphologie et collecte de données sur le microbiome intestinal humain. Des échantillons fécaux humains ont été étalés et cultivés sous différentes sélections d'antibiotiques et des colonies morphologiquement diverses ont ensuite été isolées, biobanquées et analysées par séquençage en aval. b, Mise en place du système automatisé d'isolement et de culture microbienne anaérobie CAMII. c, Illustration de l'isolement de colonie guidé par la morphologie sur CAMII. Les colonies cultivées sur des plaques sont imagées sous trans- et épi-illumination et soumises à la segmentation des contours et à l'extraction des caractéristiques morphologiques. Les données sont analysées par PCA pour identifier l'ensemble des colonies les plus diversifiées sur le plan morphologique qui sont ensuite isolées par un sélecteur de colonies intégré. d, Illustration de diverses morphologies de colonies sur plaques. Les caractéristiques de taille et de forme des colonies ont été extraites d'images transilluminées, et les caractéristiques de couleur des colonies ont été extraites d'images épi-illuminées. e, l'échantillon fécal H1t1 a été cultivé avec sept antibiotiques différents pour évaluer leur capacité à produire les bactéries les plus uniques et les plus diverses par analyse 16S au niveau familial. La ciprofloxacine, le triméthoprime et la vancomycine ont été sélectionnés pour les isolements de colonies ultérieurs. f, nombre d'ASV uniques obtenus à partir d'un isolement guidé par le phénotype par rapport à l'isolement aléatoire de trois échantillons fécaux humains H1t4, H5t1 et H6t1. L'isolement a été réalisé par CAMII ; un isolement aléatoire a été effectué sur un sous-ensemble aléatoire de toutes les colonies détectées sur les plaques, et un isolement guidé par le phénotype a été effectué sur des colonies sélectionnées par la morphologie par l'algorithme (Fig. 1b supplémentaire). La valeur P est calculée par un test t apparié bilatéral sur l'aire sous la courbe. Les rubans sur les courbes représentent les écarts-types du nombre d'ASV uniques obtenus par l'algorithme.

Une caractéristique clé unique de la plate-forme CAMII est le système d'imagerie qui collecte et apprend à partir des données morphologiques des colonies bactériennes (Fig. 1c). Plus précisément, les images transilluminées, qui montrent la hauteur, le rayon et la circularité d'une colonie et les images épi-illuminées, qui montrent la couleur et les caractéristiques morphologiques complexes telles que les rides, sont capturées sur CAMII pour produire un ensemble de données morphologiques multidimensionnelles et quantifiables. Nous avons développé un pipeline d'analyse de colonies personnalisé qui segmente les colonies selon diverses caractéristiques morphologiques (Méthodes; Tableau supplémentaire 3 et Fig. 1 supplémentaire). L'aire, le périmètre et le rayon moyen reflètent la taille de la colonie, tandis que la circularité, la convexité et l'inertie révèlent la forme de la colonie. Les intensités de pixels et leurs variances dans les canaux rouge, vert et bleu (RVB) mettent en évidence toutes les gradations de densité et les couleurs à travers une colonie (Fig. 1d). Nous avons ensuite estimé que les colonies morphologiquement distinctes sont plus susceptibles d'être phylogénétiquement diverses, ce qui pourrait être utilisé pour améliorer l'isolement des colonies. Ainsi, nous avons développé une stratégie de `` sélection intelligente '' guidée par imagerie pour isoler des isolats plus divers en incorporant des colonies dans un espace euclidien multidimensionnel basé sur des caractéristiques capturées et en sélectionnant des points les plus éloignés dans cet espace représentant les colonies les plus morphologiquement distinctes (Fig. 1 supplémentaire; Méthodes). Pour augmenter encore la diversité des bactéries qui peuvent être cultivées et examinées, CAMII utilise également différents suppléments antibiotiques pour enrichir les sous-ensembles les plus uniques et les plus divers de microbes1,13 (Fig. 2a,b supplémentaire). Par exemple, dans un échantillon de microbiome intestinal humain sain (H1t1), trois antibiotiques (ciprofloxacine, Cip ; triméthoprime, Tmp ; vancomycine, Van) avec différents mécanismes d'action ont suscité les cultures d'enrichissement les plus distinctes (Fig. 1e et Fig. 2c supplémentaire) .

Pour évaluer systématiquement la capacité et la fidélité de l'isolement de colonies guidé par imagerie, nous avons appliqué CAMII à des échantillons de microbiome intestinal de trois volontaires humains (H1t4, H5t1 et H6t1; Tableau supplémentaire 4). Les données morphologiques des colonies plaquées ont été analysées par analyse en composantes principales (ACP) pour évaluer les caractéristiques visuelles les plus informatives (Fig. 1c et Fig. 1c supplémentaire; Méthodes). Fait intéressant, la densité et la taille des colonies étaient les signatures les plus dominantes (composantes principales 1 et 2, respectivement) qui représentaient ensemble 72, 0% de la variance morphologique (Fig. 3 supplémentaire). Nous avons ensuite utilisé le robot CAMII pour isoler 6 144 colonies, dont environ la moitié ont été prélevées au hasard dans des plaques mGAM et une autre moitié en utilisant notre stratégie de « sélection intelligente » guidée par imagerie et notre sélection d'antibiotiques. Les isolats ont été cultivés dans 384 puits et soumis à un séquençage d'ARNr 16S pour l'identification taxonomique. Les séquences 16S V4 uniques ont ensuite été regroupées en ASV (seuil d'identité à 100 %) qui fournissent une identité approximative au niveau de l'espèce21. Remarquablement, l'isolement des colonies informé par les données phénotypiques a produit un ensemble d'ASV beaucoup plus diversifié que par rapport à l'isolement aléatoire pour les trois échantillons de microbiome (Fig. 1f). Par exemple, pour obtenir 30 ASV uniques, nous n'avons besoin que de 85 ± 11 colonies à isoler à l'aide de notre stratégie sélective d'imagerie, contre 410 ± 218 colonies nécessaires par sélection aléatoire. Notamment, cette efficacité d'isolement améliorée a été maintenue tout au long de la cueillette, ce qui implique qu'il existe un avantage durable à utiliser notre stratégie dans une plage de profondeur d'isolement souhaitée (Fig. 4a supplémentaire), et la collection d'isolats générée représentait mieux la diversité microbienne d'entrée sous-jacente et était sensiblement plus uniforme dans la composition telle que mesurée par l'équitabilité de Shannon (Fig. 4b supplémentaire). L'analyse phylogénétique des isolats a montré que la cueillette de colonies optimisée par CAMII améliorait considérablement la diversité des microbes obtenus (Fig. 5 supplémentaire). Cet avantage est particulièrement évident étant donné que la recherche d'ASV uniques devient asymptotiquement plus difficile avec un nombre croissant d'isolats. Dans l'ensemble, ces résultats ont démontré que notre cadre d'isolement basé sur les données guidé par l'IA dans la plate-forme CAMII peut augmenter considérablement l'efficacité de la culturomique et réduire le travail nécessaire pour isoler des espèces particulièrement rares.

Alors que les microbiomes de différentes personnes peuvent partager des ensembles similaires d'espèces bactériennes, les souches appartenant à ces espèces sont très uniques à l'individu et peuvent co-coloniser le même hôte pendant de nombreuses années22,23. Nous avons cherché à montrer l'utilité de CAMII pour générer des collections personnalisées d'isolats intestinaux pour 20 personnes en bonne santé (tableau supplémentaire 4 et Fig. 6a, b supplémentaires). Un total de 102 071 colonies ont été analysées visuellement et 26 997 colonies ont été sélectionnées et identifiées taxonomiquement par séquençage d'ARNr 16S (Fig. 2a), produisant 394 ASV uniques qui couvrent une grande diversité de microbiomes intestinaux commensaux sains (Fig. 2b, c et Tableau supplémentaire 5 ).

a, Statistiques de 20 biobanques personnalisées d'isolats intestinaux. b, Arbre phylogénétique de 394 ASV couverts par 26 997 isolats de microbiome intestinal dans cette étude. L'arbre de phylogénie voisin-joignant a été construit sur la base des séquences 16S V4. La couleur des branches distingue le phylum bactérien et le cercle extérieur montre la prévalence des ASV isolés dans les 20 biobanques. c, nombre d'isolats pour les 20 top taxonomies au niveau de la famille. d, Abondance relative accumulée des ASV représentées par des isolats de biobanques personnalisées dans des échantillons fécaux originaux. Les barres montrent les isolats de n'importe quel individu dans l'ensemble de la collection et les lignes rouges montrent les isolats dérivés de la même personne. e, Heatmaps pour l'abondance relative d'ASV abondants dans les échantillons fécaux d'origine et la présence ou l'absence dans les biobanques. Les ASV avec une abondance relative moyenne> 0,1% sont affichés et la barre latérale à gauche représente leur taxonomie au niveau de la famille. Les ASV trouvés dans les biobanques personnalisées sont affichés sous forme de barres noires dans la carte thermique de droite et les ASV non cultivés qui ne se trouvent dans aucune biobanque sont mis en évidence. f, Corrélation de l'abondance relative moyenne dans l'échantillon de matières fécales d'origine et du nombre d'isolats dans l'ensemble de la collection pour les ASV. Les ASV très abondants et difficiles à cultiver, c'est-à-dire avec moins d'isolats, sont mis en évidence. g, Abondance relative moyenne des ASV les plus abondants mais avec pas plus de 2 isolats dans l'ensemble de la collection. La couleur des barres représente la taxonomie au niveau de la famille.

Pour évaluer l'exhaustivité de cette collection d'isolats, nous avons calculé l'abondance d'ASV isolés dans les échantillons fécaux correspondants par séquençage d'ARNr 16S en vrac (Fig. 2d). Remarquablement, pour chaque individu, 80,9 ± 9,4% des ASV par abondance sont représentés au moins une fois dans l'ensemble de la collection d'isolats. Les isolats dérivés de chaque personne constituaient en moyenne 45, 6 ± 21, 6% de l'abondance bactérienne totale d'ASV chez cet individu (Fig. 2d). De plus, la comparaison des collections d'isolats et des échantillons de matières fécales en vrac a montré que la plupart des ASV très abondants et répandus sont isolés au moins une fois dans la collection (Fig. 6c – e supplémentaire). De plus, chaque collection d'isolats personnalisée imite l'échantillon de matières fécales en vrac avec des profils de microbiome comparables et l'indice de diversité de Shannon (Fig. 6f, g supplémentaires).

Au total, nous avons démontré l'utilisation de CAMII pour construire une collection d'isolats intestinaux humains profonds contenant 26 997 isolats couvrant 394 ASV, avec un riche ensemble de données morphologiques, phénotypiques, taxonomiques et WGS liées. Pour accroître son utilité pour la communauté de recherche, nous avons développé une ressource en ligne consultable (http://microbienne-culturomics.com) pour héberger toutes les données de la biobanque activée par CAMII, y compris les génomes, les phénotypes et les images. Nous envisageons que ce portail facilitera d'autres analyses de génotype à phénotype et conduira à davantage de collections d'isolats partagés provenant d'autres environnements.

Des études antérieures ont observé que de nombreux microbes provenant de différents environnements sont difficiles à cultiver en laboratoire24,25. Nous avons donc tiré parti de nos biobanques d'isolats générées systématiquement pour évaluer la culturabilité du microbiome intestinal humain et pour identifier les ASV bactériens qui restent récalcitrants à l'isolement dans notre cadre expérimental. Dans les 20 collections d'isolats personnalisés, nous avons déterminé si des ASV abondants dans les matières fécales en vrac (abondance relative moyenne> 0, 1%) se trouvaient dans la biobanque. Notamment, une fraction substantielle des bactéries intestinales non cultivées appartenait aux familles Ruminococcaceae et Lachnospiraceae (Fig. 2e et Tableau supplémentaire 6), qui a également été précédemment documentée comme « incultivable »24. Pour chaque ASV, nous avons comparé le nombre d'isolats générés dans notre collection totale d'isolats par rapport à leur abondance moyenne dans les matières fécales en vrac (Fig. 2f), qui semblaient être positivement corrélées. Pourtant, nous avons identifié un ensemble de bactéries abondantes mais difficiles à cultiver, notamment Faecalibacterium ASV-58, Prevatella ASV-470 et ASV-324, Oscillibacter ASV-215 et Clostridium XlVa ASV-287 (Fig. 2g). Fait intéressant, Faecalibacterium ASV-58, à partir duquel nous avons obtenu un isolat et effectué une WGS, correspondait à > 98 % d'identité moyenne de nucléotides (ANI) à l'échelle du génome au génome assemblé par métagénome (MAG) de Candidatus cibiobacter qucibialis. Cette souche de notre collection était précédemment signalée comme l'espèce non cultivée la plus abondante dans l'intestin humain25 et est fortement appauvrie chez les patients atteints de maladies inflammatoires de l'intestin (MII), tout comme d'autres souches de Faecalibacterium26.

Nous avons en outre comparé les isolats de nos biobanques à la base de données existante1,3,22,25 par WGS et identifié 11 espèces supplémentaires qui n'avaient été cultivées dans aucune collection de référence (BIO-ML, CGR et HMP) mais qui ne sont associées qu'aux MAG dans le SGB collection (Fig. 7 supplémentaire et tableau supplémentaire 7). Par exemple, outre Faecalibacterium ASV-58, nous avons isolé une autre espèce abondante Faecalibacterium sp. ASV-76 qui représente> 3% d'abondance relative en moyenne dans les matières fécales en vrac, ce qui élargit encore la collection de microbiomes intestinaux cultivables. Ensemble, ces résultats mettent en évidence les isolats cultivés et la diversité manquante restante en fonction de nos conditions de milieu et de croissance actuelles, et offrent des orientations pour guider les futurs efforts de culturomique axés sur ces microbiomes intestinaux de «matière noire» (tableau supplémentaire 6).

La culture ciblée de bactéries d'intérêt à partir d'un échantillon de microbiome peut être cruciale pour les études mécanistes. Malheureusement, nous n'avons pas la capacité de cultiver sélectivement la plupart des espèces bactériennes d'une manière spécifique. Par conséquent, sélectionner un grand nombre de colonies et s'appuyer sur la probabilité statistique est la seule solution pratique pour obtenir des bactéries d'intérêt. Cette stratégie, cependant, est souvent trop consommatrice de ressources car elle peut nécessiter la cueillette manuelle de milliers de colonies. CAMII propose une méthode de sélection de colonies automatisée et guidée par ML basée sur la liaison de l'identité taxonomique à la morphologie des colonies et pourrait donc en théorie améliorer l'isolement ciblé. Pour tester cela, nous avons systématiquement sondé notre collection d'isolats intestinaux profonds pour analyser la relation entre les données morphologiques et génotypiques. Fait intéressant, les colonies de différents genres présentaient divers modèles morphologiques (Fig. 3a, b). Par exemple, les colonies de Dorea, Bacteroides et Collinsella sont généralement grandes et denses mais présentent des circularités différentes (Collinsella > Bacteroides > Dorea), reflétant des différences dans leurs caractéristiques de croissance. D'autre part, les colonies de Faecalibacterium sont plus petites et plus faibles, conformément à nos résultats antérieurs sur leur mauvaise aptitude à la culture. De plus, les morphologies des colonies sont regroupées de manière significative en fonction de leur phylogénie (P = 0, 008 par le test PERMANOVA sur la Fig. 3c). Par exemple, la plupart des genres de Clostridia sont plus proches les uns des autres par ordination basée sur la morphologie (Fig. 3c). Par conséquent, les morphologies des colonies peuvent intégrer une quantité substantielle d'informations qui pourraient être liées aux identités taxonomiques.

a, Heatmap des scores z moyens des caractéristiques morphologiques dans différents genres bactériens. Différents genres présentant divers modèles morphologiques ont été classés en différents groupes par regroupement hiérarchique et le point coloré à droite représente leur taxonomie au niveau de la classe. b, Exemples d'images de colonies. Les images transilluminées sont sur le côté gauche et les images épi-illuminées sont sur le côté droit. c, ordination PCA des genres en fonction de leurs caractéristiques morphologiques de colonie. Les couleurs indiquent la taxonomie au niveau de la classe. d, Performance de la prédiction du genre bactérien basée sur les caractéristiques morphologiques par un classificateur forestier aléatoire. Les nombres entre parenthèses représentent le nombre d'isolats pour chaque genre. La formation et l'évaluation du modèle ont été amorcées 20 fois et les diagrammes en boîte montrent la variance des performances (n = 20). La ligne bleue représente les performances du modèle nul. Définition des éléments de la boîte à moustaches—ligne médiane, médiane ; limites de la boîte, 25e quartiles supérieur et inférieur ; moustaches, 1,5 × intervalle interquartile. e, Performance de l'isolement ciblé basé sur un modèle. Les barres représentent la moyenne de la précision de la prédiction par des modèles spécifiques à l'individu qui ont été amorcés 20 fois et les barres d'erreur représentent les écarts-types. Les valeurs P ont été calculées par le test t de Student bilatéral sur les précisions à partir de n = 20 bootstrapping du modèle initialisé au hasard.

Nous avons évalué si l'identité taxonomique des colonies pouvait être prédite de manière unique en incorporant uniquement leurs informations morphologiques sur des plaques. Nous avons formé un modèle de classification forestière aléatoire à l'aide de données de morphologie et de taxonomie provenant de sous-ensembles d'isolats sélectionnés au hasard (70 % du total ; méthodes). La performance du modèle a été évaluée sur les 30 % d'isolats restants. Remarquablement, notre modèle a atteint une précision d'environ 70% pour la plupart des genres qui comptaient plus de 100 isolats dans l'ensemble de données d'apprentissage (Fig. 3d). Le taux de rappel au niveau du genre variait plus largement, mettant en évidence des opportunités ouvertes d'utiliser des modèles plus sophistiqués pour apprendre des caractéristiques uniques supplémentaires de la colonie27,28,29. Certains genres tels que Eggerthella avaient une précision et un rappel élevés, ce qui indique que des morphologies de colonies hautement conservées et uniques pourraient être spécifiquement exploitées pour les prédictions taxonomiques. Lors de l'analyse des isolats du même ASV, nous avons constaté que la morphologie de la colonie était hautement conservée pour les isolats d'une même personne, mais était beaucoup plus variable entre les isolats de différentes personnes (Fig. 8 supplémentaire). Étant donné que différentes personnes portent généralement des souches distinctes de la même espèce, nos résultats suggèrent un degré élevé de variation au niveau de la souche dans la morphologie des colonies.

Pour évaluer si les caractéristiques des colonies informées par l'IA peuvent améliorer l'isolement des microbes ciblés, nous avons ensuite formé des modèles forestiers aléatoires sur nos données d'isolats de biobanque de trois personnes différentes séparément (H12, H13 et H14). Les modèles ont été utilisés pour prédire les colonies de Bifidobacterium, Parabacteroides et Eggerthella à partir de nouvelles plaques dérivées des mêmes échantillons fécaux, et les colonies ont ensuite été isolées par CAMII et ARNr 16S séquencés pour confirmer l'identité taxonomique (Méthodes). Notamment, la cueillette guidée par la morphologie a considérablement amélioré l'efficacité d'isolement de ces genres ciblés jusqu'à huit fois en moyenne (Fig. 3e), augmentant considérablement la précision de la cueillette et atténuant la nécessité de cribler de nombreuses colonies pour trouver les microbes souhaités. Ces résultats soulignent la valeur de nos ensembles de données de biobanque qui relient le phénotype au génotype et démontrent les prédictions taxonomiques à partir des seules caractéristiques visuelles des colonies, ce qui peut grandement améliorer l'isolement microbien ciblé.

Les colonies bactériennes peuvent influencer la croissance de leurs voisines par le biais d'interactions entre espèces telles que la compétition pour les nutriments ou l'alimentation croisée des métabolites essentiels. Des études antérieures suggèrent que les cellules voisines peuvent affecter de manière critique la taille des colonies de manière prévisible19. Parce que CAMII peut suivre la croissance cinétique des colonies en continu, nous avons systématiquement sondé les associations de co-croissance entre les isolats intestinaux sur des plaques de gélose. Un échantillon fécal (H1t5; Tableau supplémentaire 4) a été étalé et imagé quotidiennement, et toutes les colonies ont ensuite été isolées au jour 6 et leurs identités taxonomiques ont été déterminées avec un séquençage 16S (Fig. 4a). Pour chaque ASV, la surface cumulée des colonies sur des plaques de gélose était en corrélation avec leur abondance dans l'échantillon fécal d'origine (Fig. 9 supplémentaire), indiquant que nos conditions in vitro favorisaient généralement la croissance au même degré que dans l'intestin. Fait intéressant, les colonies appartenant au genre Faecalibacterium ont présenté une croissance initiale plus lente et n'ont commencé à émerger qu'en présence d'autres colonies en croissance à proximité (Fig. 4b; Méthodes). Cette observation suggère que des interactions commensales ou mutualistes peuvent être en jeu entre Faecalibacterium et d'autres espèces.

a, Images d'une plaque d'exemple pendant 6 jours de croissance et identités de colonies sur la plaque par séquençage 16S. b, Proportion de colonies détectables à différents moments par rapport au jour 6 pour chaque genre. Les couleurs indiquent la taxonomie au niveau de la famille. c, Corrélation de la taille de la colonie et du nombre de colonies voisines pour deux ASV représentatifs. Une liste complète des corrélations est fournie dans le tableau supplémentaire 8. Les valeurs P sont calculées par un test Mann-Whitney U unilatéral sur la superficie des colonies avec pas plus d'une colonie à proximité ou pas moins de quatre colonies à proximité (n = 101 contre 82 pour ASV-6 et 17 contre 9 pour ASV-39). Définition des éléments du box-plot : ligne médiane : médiane ; limites de la boîte : 25e quartiles supérieur et inférieur ; moustaches : 1,5 × intervalle interquartile. d, Croissance par paire favorisant et inhibant les réseaux entre les genres. Les effets directionnels favorisant la croissance sont indiqués par des flèches pointues rouges et les effets directionnels inhibant la croissance sont indiqués par des flèches bleues émoussées. Les nœuds représentent des genres bactériens et sont colorés par famille. La taille des nœuds est proportionnelle au nombre d'isolats utilisés dans cette analyse et la largeur des bords est proportionnelle à l'importance des interactions.

Pour étudier plus systématiquement les interactions entre espèces permises par CAMII, nous avons analysé ensemble la morphologie de la colonie, l'identité taxonomique et les données de voisinage de la colonie. Nous avons regroupé les données morphologiques et les coordonnées physiques de 102 071 colonies capturées visuellement (26 997 isolées) et évalué si la croissance d'une colonie est affectée par les cellules voisines. Étonnamment, nous avons observé un certain nombre de schémas de co-croissance intéressants pouvant refléter des interactions interspécifiques (tableau supplémentaire 8). Par exemple, la taille de la colonie de Phocaeicola vulgatus ASV-6 est corrélée négativement avec le nombre de cellules voisines, ce qui est cohérent avec un scénario selon lequel il existe des interactions négatives générales médiées par la compétition ou l'antagonisme entre P. vulgatus et d'autres bactéries dans l'intestin30 (Fig. 4c). D'autre part, Faecalibacterium prausnitzii ASV-39, l'une des espèces associées à une croissance initiale plus lente de la cinétique des colonies (Fig. 4b), a développé des colonies plus grandes avec plus de voisins reflétant une interaction positive entre les espèces (Fig. 4c).

Nous avons ensuite incorporé des informations taxonomiques sur les colonies voisines et examiné comment la taille de la colonie d'un genre spécifique pouvait être affectée par d'autres genres. Brièvement, pour chaque paire de genres, nous avons comparé la taille des colonies d'un genre avec l'autre genre présent dans le voisinage et sans présence de colonies (Méthodes). Remarquablement, nous avons identifié des isolats de deux genres, Faecalibacterium et Clostridium IV, qui atteignent des tailles plus grandes lorsque les isolats étaient proches de Bifidobacterium, Phocaeicola et Bacteroides (Fig. 4d). Faecalibacterium et Clostridium IV ont été signalés comme étant les principales bactéries productrices de butyrate dans l'intestin et pourraient bénéficier de la croissance en coculture avec les espèces Bifidobacterium et Bacteroides31,32,33, ce qui est cohérent avec nos résultats. D'autre part, nous avons observé que les isolats de Phocaeicola sont plus petits avec les isolats de Faecalibacterium comme voisins (Fig. 4d), ce qui indique que l'interaction de co-croissance pourrait être bénéfique d'un seul côté. De plus, conformément à notre précédente analyse de corrélation qui examinait les nombres d'isolats voisins sans tenir compte de l'identité des voisins, nous avons observé que la croissance de Phocaeicola et de Bacteroides pouvait être inhibée par plusieurs autres genres, suggérant d'autres investigations pour mieux comprendre le mécanisme sous-jacent de ces effets positifs. et les interactions négatives entre le microbiote intestinal. Ensemble, nos résultats mettent en évidence que CAMII peut révéler des schémas de co-croissance de colonies régis par des interactions interspécifiques, ce qui peut aider à identifier les microbes favorisant la croissance et leurs métabolites diffusibles qui stimulent la croissance in vitro d'espèces exigeantes.

La cartographie de la diversité génomique des bactéries intestinales au niveau de la souche chez une personne est importante pour comprendre la dynamique de la colonisation intestinale et les moteurs de la sélection et de l'adaptation bactériennes spécifiques à chaque hôte humain1,2,34. Un avantage clé du système CAMII est la capacité d'isoler et d'effectuer des WGS pour un grand nombre d'isolats afin d'aider à étudier les variations génomiques inter et intrapersonnelles. En tant que tel, nous avons sélectionné des isolats couvrant les ASV les plus uniques et les plus répandus de notre biobanque de microbiomes de 20 personnes et avons effectué un WGS qui a produit 1 197 projets de génomes de haute qualité (Fig. 10 supplémentaire et Tableau supplémentaire 9). Les assemblages de génomes ont été analysés plus en détail pour déterminer la taxonomie précise au niveau de l'espèce des isolats (méthodes).

Nous avons d'abord exploré les variations génomiques interpersonnelles au niveau de la souche dans notre collection d'isolats (Méthodes). Conformément aux rapports précédents1,35, la plupart des isolats au sein d'un même individu présentaient très peu de variations génomiques (c'est-à-dire moins de 102 SNP), tandis que les isolats entre les personnes différaient de 103 à 105 SNP à l'échelle du génome (Fig. 5a). Il est intéressant de noter que certains isolats phylogénétiquement distincts (c'est-à-dire plus de 104 SNP) de la même espèce coexistent chez la même personne (Fig. 5a). Par exemple, deux souches distinctes de P. vulgatus ont été isolées de l'individu H4 et deux souches distinctes de B. uniformis ont été trouvées chez l'individu H2 (Fig. 11 supplémentaire).

a, nombre de SNP à l'échelle du génome entre les isolats du même individu ou d'individus différents pour 14 espèces riches en isolats. Les nombres après le nom de l'espèce représentent le nombre de paires inter-individuelles (rouge) et intra-individuelles (bleu). Définition des éléments du box-plot : ligne médiane : médiane ; limites de la boîte : 25e quartiles supérieur et inférieur ; moustaches : 1,5 × intervalle interquartile. b, Corrélation entre le nombre de SNP à l'échelle du génome et l'abondance relative dans l'échantillon fécal d'origine pour les espèces riches en isolats dans l'individu H1. La taille du point représente le nombre d'isolats utilisés dans cette analyse et la couleur représente la proportion de SNP présents dans un seul génotype. c, Réseau de 2 kb + fréquence HGT basé sur 409 isolats de H1. Les nœuds représentent les espèces bactériennes et sont colorés par famille. La taille des nœuds est proportionnelle au nombre d'isolats dans la collection H1 et l'opacité des bords est proportionnelle à la fréquence HGT entre les deux espèces connectées. La couleur des bords représente différents types de HGT, c'est-à-dire interphyla, intraphyla et interfamilial, ou intrafamilial HGT et la couleur du contour des nœuds représente la coloration de Gram de l'espèce.

Nous avons ensuite cherché à évaluer la diversité au niveau de la souche au sein d'une même personne en analysant 408 génomes d'isolats dérivés de l'individu H1 (Fig. 10 supplémentaire; Méthodes). Étant donné que les espèces abondantes dans l'intestin devraient subir davantage de divisions cellulaires, nous avons émis l'hypothèse qu'elles pourraient accumuler plus de SNP dans leurs génomes, en supposant approximativement la même durée de colonisation intestinale. En effet, le nombre de SNP à l'échelle du génome au sein de chaque taxon est généralement corrélé à son abondance dans le microbiome d'origine (Fig. 5b). B. fragilis présente une proportion plus élevée (56,0 %) de SNP foliaires (c'est-à-dire présents dans un seul génotype) tandis que d'autres espèces présentent des proportions beaucoup plus faibles, notamment P. goldsteinii (20,5 %), B. stercoris (22,4 %) et B. xylanisolvens (25,6 %), ce qui suggère des goulots d'étranglement de population différentiels et des balayages sélectifs au niveau de l'espèce. Au niveau des gènes, nous avons également observé des preuves d'évolution adaptative convergente. Par exemple, entre différentes lignées d'isolats de P. dorei, nous avons identifié deux variantes codantes dans le gène TodS (Fig. 12 supplémentaire), qui code pour un capteur de kinase à deux composants régulant le métabolisme du toluène chez les bactéries36. Le toluène et d'autres hydrocarbures aromatiques se trouvent dans les aliments et sont également utilisés comme matières premières industrielles qui pourraient contaminer les aliments et ainsi entraîner l'évolution dans l'intestin37.

Le HGT est un autre moteur majeur de l'évolution du microbiome intestinal intra-individuel. En conséquence, nous avons utilisé tous les isolats H1 séquencés du génome entier pour reconstruire un réseau HGT d'éléments d'ADN partagés> 2 kb de longueur (Méthodes). Conformément aux rapports récents38,39, nous avons observé que les événements HGT étaient fortement liés à la phylogénie des isolats, c'est-à-dire que la plupart des événements HGT se produisaient au sein du même phylum, mais étaient également assez répandus dans différentes familles et entre des espèces distinctes (Fig. 5c et Tableau supplémentaire 10). Fait intéressant, nous avons observé que les HGT étaient principalement enrichis entre les isolats avec la même coloration de Gram, les espèces à Gram négatif montrant des HGT plus répandus que les espèces à Gram positif (P = 0, 0005 par le test du chi carré de Pearson). Ce résultat est cohérent avec les découvertes récentes39 et suggère que différentes structures de paroi cellulaire peuvent jouer un rôle important dans les HGT. Notamment, des HGT entre des espèces Gram-positives et négatives ont également été observées dans notre ensemble de données, inspirant de futures études pour étudier l'effet des structures de la paroi cellulaire sur les HGT et concevoir ces éléments HGT dans un outil d'édition du microbiome. Ensuite, pour examiner si ces HGT se sont produits récemment, nous avons calculé la fréquence moyenne des HGT entre toutes les paires d'espèces (Méthodes). Nous avons émis l'hypothèse que si les HGT se produisaient récemment entre deux espèces, ils ne seraient associés qu'à une petite proportion d'isolats, ce qui entraînerait une faible fréquence entre les espèces, tandis que si les HGT se produisaient plus tôt et fournissaient des avantages de croissance, ils seraient enrichis et hérités verticalement par plus tard. génération, résultant en une fréquence élevée. Fait intéressant, nous avons constaté que la plupart des éléments HGT étaient fréquemment présents dans les isolats (71, 5% HGT avec une fréquence> 50%), en particulier pour ceux appartenant aux espèces de Bacteroidaceae (Fig. 5c), ce qui suggère qu'ils se sont produits dans un passé lointain et ont été enrichis sous forte sélection au sein de l'environnement intestinal.

Compte tenu de la prévalence et de la fréquence élevées du HGT intra-individuel, nous avons ensuite annoté les séquences codant pour les protéines des éléments HGT les plus répandus afin de sonder leurs fonctions potentielles (Méthodes). Fait intéressant, nous avons identifié plusieurs gènes de résistance aux antibiotiques (ARG) avec différents mécanismes d'action ainsi que des gènes du système de sécrétion (Fig. 13 supplémentaire). Par exemple, les quatre séquences HGT les plus répandues se trouvent étonnamment dans au moins 13 espèces différentes de Bacteroidaceae, Porphyromonadaceae, Odoribacteraceae et Rikenellaceae et contenaient plusieurs ARG, y compris des protecteurs ribosomiques et des pompes d'efflux antibiotiques, ainsi que des systèmes de sécrétion de type III et de type IV. . Alors que les ARG et les systèmes de sécrétion partagés par HGT peuvent conférer des avantages évolutifs clairs, il y avait de nombreux éléments répandus dans différentes espèces avec des gènes de fonction inconnue (Fig. 13 supplémentaire), faisant allusion à des mécanismes inexplorés qui entraînent leur persistance à long terme dans l'intestin. . Pris ensemble, ces résultats mettent en évidence que les isolats au sein et entre les personnes ont une diversité génomique qui peut être systématiquement caractérisée à l'aide de la biobanque de souches profondes et de l'analyse génomique activées par CAMII pour étudier la colonisation, l'adaptation et l'écologie du microbiome intestinal spécifique à la personne.

L'isolement des souches du microbiome intestinal a toujours été effectué de manière ad hoc où des caractéristiques phénotypiques importantes sont insuffisamment capturées et mal documentées parallèlement aux données génomiques. Nous avons décrit ici la plateforme CAMII pour industrialiser la génération de biobanques d'isolats en tirant parti de l'automatisation, de la vision artificielle, de l'apprentissage supervisé et de la génomique. Combinées au 16S à faible coût et au séquençage du génome entier, les données phénotypiques et génomiques générées systématiquement à partir du pipeline constituent une riche ressource pour étudier la morphologie, la diversité et l'évolution des colonies microbiennes. En utilisant le microbiome intestinal comme exemple de vitrine, l'isolement activé par CAMII a produit de vastes biobanques d'isolats de 20 individus en bonne santé qui, au total, couvraient > 80 % de tous les microbiotes en abondance présente. Cette collection d'isolats couvre la majorité de la diversité microbienne dans l'intestin sain et est l'une des biobanques d'isolats personnalisées les plus complètes décrites à ce jour. À l'aide de cette ressource, nous avons démontré que l'analyse quantitative des morphologies des colonies peut prédire la taxonomie, améliorer l'isolement des genres ciblés et révéler les interactions potentielles entre les microbes. L'analyse systématique des différences génomiques entre les isolats au sein et entre les personnes a révélé des schémas intéressants de sélection de la population, d'adaptation et de HGT.

La majorité des données présentées ici reposaient sur un milieu commun riche en mGAM pour l'isolement et la caractérisation des souches dans le contexte du microbiome intestinal humain. L'exploration de formulations de milieux alternatifs, d'autres micronutriments et macronutriments, et de perturbations biochimiques associées à l'hôte ou à l'environnement (par exemple, les acides biliaires et les composés xénobiotiques) pourrait entraîner des changements de profil morphologique et de croissance qui informent les physiologies et les caractéristiques inexplorées du microbiome intestinal. Les interactions interspécifiques dérivées des ensembles de données CAMII pourraient être davantage utilisées pour cartographier systématiquement les moteurs de la dynamique du microbiome. Nous envisageons que ces interactions pourraient faciliter la culture du microbiome de « matière noire » récalcitrant en aidant à identifier des molécules inconnues d'origine microbienne qui favorisent la croissance coopérative observée dans cette étude et d'autres.

Le système CAMII utilise des composants disponibles dans le commerce et un code open source qui peuvent être facilement reproduits par d'autres chercheurs (voir le tableau supplémentaire 1 pour la liste des composants). Nous prévoyons que le portail en ligne consultable facilitera le partage de données phénotypiques et génomiques normalisées, qui est appelé à croître avec le temps. Le matériel CAMII pourrait être encore élargi pour intégrer des mesures de spectrométrie de masse afin d'obtenir des profils caractéristiques de colonies supplémentaires qui peuvent améliorer l'identification des espèces et des métabolites. La microscopie automatisée embarquée pourrait en outre introduire des flux de données orthogonaux pour visualiser les cellules microbiennes à une résolution micrométrique sur différents canaux spectraux. L'amélioration de la vision artificielle et des algorithmes ML pourrait produire des prédictions de déformation encore meilleures et améliorer les performances d'isolement.

Parce que les souches individuelles sont l'unité d'action au sein d'une communauté complexe, des collections de souches plus complètes sont nécessaires. De telles biobanques complètes peuvent être utilisées pour recréer un contexte plus holistique qui prend en compte la composition, les interactions interspécifiques et la capacité métabolique de l'ensemble de la communauté, ce qui améliorera les études de la fonction, de la dynamique et de la stabilité du microbiome. Au-delà de l'intestin humain, CAMII peut être utile pour d'autres microbiomes tels que ceux du sol, des environnements aquatiques ou agricoles, y compris un isolement et une analyse plus poussés des phages, des champignons et des protozoaires. Le système d'automatisation robotique peut également aider à générer des bibliothèques de souches systématiques telles que des collections knock-out d'insertion de transposons en réseau42 ou des bibliothèques d'expression génomique fonctionnelle43, ainsi qu'à améliorer le dépistage des châssis microbiens traitables pour le génie génétique44.

Cette étude a été approuvée et menée selon le protocole AAAR0753 du Columbia University Medical Center Institutional Review Board. Un consentement éclairé écrit a été obtenu des participants à l'étude.

Des échantillons fécaux frais ont été prélevés sur 20 donneurs humains sains et traités dans les 3 heures suivant la défécation. En bref, les matières fécales ont été recueillies à l'aide du Commode Specimen Collection System (Fisher, 02-544-208). Une pointe de pipette stérile inversée de 200 µl (Rainin, RT-L200F) a été utilisée pour prélever un petit échantillon de l'échantillon de selles, qui a ensuite été immédiatement placé dans un cryotube stérile (Fisher, NC9347001). Les échantillons fécaux collectés ont ensuite été transférés dans une chambre anaérobie (Coy Laboratory) et homogénéisés dans 5 ml de PBS préréduit par un vortex poussé. Les échantillons homogénéisés ont ensuite été passés à travers un filtre de 40 µ (Fisher, 22363547) pour éliminer les débris alimentaires, aliquotés dans plusieurs cryotubes avec du glycérol (concentration finale de 20 %) et transférés dans un congélateur à -80 °C pour un stockage à long terme.

Tous les microbiotes intestinaux ont été cultivés dans du Gifu Anaerobic Medium Broth, Modified (mGAM ; HyServe, 05433) dans des conditions anaérobies (5 % H2, 10 % CO2 et 85 % N2) dans une chambre anaérobie. En bref, des plaques de gélose à 1,5 % (Thermo Fisher Scientific, 242811) avec un milieu mGAM ont été fabriquées à l'aide d'une pompe péristaltique (New Era Pump Systems NE-9000) et étiquetées avec des codes à barres uniques. Pour les plaques additionnées de ciprofloxacine (10 µg ml-1), de triméthoprime (50 µg ml-1) ou de vancomycine (50 µg ml-1), des antibiotiques ont été ajoutés lors de la préparation des plaques. Toutes les plaques ont ensuite été transférées dans la chambre anaérobie et préréduites pendant environ 24 h avant le placage. Des échantillons fécaux congelés ont été décongelés dans la chambre anaérobie et dilués à 103 UFC par ml pour chaque condition de culture. Les dilutions optimales ont été déterminées par des expériences de dilution en série spécifiques à l'échantillon. Deux cents microlitres d'échantillons fécaux dilués ont ensuite été distribués sur la plaque et étalés à l'aide de billes de verre stériles. Les plaques ont été scellées dans des sacs Ziploc pour réduire la dessiccation et incubées à 37 ° C pendant 5 jours de croissance de la colonie.

L'imagerie et l'isolement des souches ont été réalisés à l'aide d'un système automatisé d'imagerie et de prélèvement de colonies (CAMII). Après 5 jours de croissance, les plaques de gélose ont été imagées automatiquement sur le système CAMII (Fig. 1c). Brièvement, les plaques ont d'abord été placées sur un carrousel empileur. Une pince à bras robotique a transporté des plaques individuelles devant un lecteur de codes-barres vers une plate-forme d'imagerie éclairée sur le sélecteur de colonies où elles ont été imagées sous deux conditions d'éclairage (épi-illumination et transillumination) par le logiciel de contrôle Hudson RapidPick. Les étiquettes des plaques sont liées aux images capturées et les plaques imagées ont été automatiquement réempilées par le bras robotique. Une fois le processus d'imagerie terminé, les plaques ont été scellées dans des sacs Ziploc pour éviter la dessiccation et un script personnalisé a été utilisé pour segmenter différentes colonies et identifier des colonies morphologiquement uniques pour une cueillette ultérieure sur la base d'images de plaques (Fig. 1a supplémentaire). Les caractéristiques morphologiques comprennent la surface, le périmètre, le rayon moyen, la circularité, la convexité, l'inertie et la moyenne et les variances le long du canal gris (images transilluminées) et des canaux RVB (images épi-illuminées). Des images brutes de toutes les colonies sur la plaque sont également collectées.

Pour la sélection aléatoire effectuée dans cette étude, un sous-ensemble aléatoire d'un nombre donné de colonies a été généré à partir de toutes les colonies détectées par le script et l'isolement automatique a été effectué sur ces colonies. Pour la cueillette guidée par le phénotype, toutes les colonies détectées ont d'abord été soumises à une sélection optimisée en fonction de leur morphologie, et un sous-ensemble d'un nombre donné de colonies avec une diversité morphologique maximisée a été isolé par CAMII. L'algorithme détaillé de la sélection optimisée des colonies peut être trouvé dans la Fig. 1b supplémentaire, et les scripts utilisés pour analyser les images des plaques et les morphologies des colonies sont accessibles sur https://github.com/hym0405/CAMII.

Après avoir analysé les images des plaques et généré une liste de colonies à prélever, un protocole robotique similaire a été exécuté pour isoler ces colonies. Tout d'abord, les plaques ont été réempilées pour le prélèvement et un distributeur de milieu multicanal a été utilisé pour distribuer 50 µl de milieu liquide mGAM dans chaque puits de deux plaques optiques stériles à code-barres de 384 puits (Thermo Fisher Scientific, 12-566-2 ; dupliquer 'A' et 'B'), qui ont ensuite été déplacés vers le sélecteur de colonies. Ensuite, une plaque de gélose a été transférée au sélecteur de colonies et des aiguilles stérilisées à la chaleur ont prélevé des colonies individuelles dans les plaques optiques en double. Les plaques ont été automatiquement désactivées lorsque toutes les colonies ciblées ont été prélevées (plaque d'agar) ou que tous les puits ont été inoculés (plaque optique). Après le prélèvement des colonies, les plaques optiques inoculées ont été transférées dans un scelleur de plaques (Brandel, 9795), scellées et réempilées. Les plaques optiques ont ensuite été incubées à 37 ° C pendant environ 5 jours pour la culture des bactéries. Après la croissance bactérienne, les plaques 'A' ont été soumises à une extraction d'ADNg en aval et 30 µl de glycérol à 40 % ont été ajoutés à chaque puits des plaques 'B', qui ont été transférées à -80 °C pour un stockage à long terme.

Pour réaliser la sélection de colonie de guide de morphologie, les caractéristiques morphologiques de colonie extraites dans le traitement d'image brute ont été centralisées et mises à l'échelle à la variance unitaire, puis intégrées par PCA. Un algorithme de sélection de colonies optimisé a ensuite été appliqué aux caractéristiques intégrées pour rechercher un ensemble de colonies présentant la plus grande diversité morphologique (Fig. 1b supplémentaire).

Pour évaluer comment les différents ASV répondent aux colonies voisines (Fig. 4c), le nombre de colonies proches a été calculé pour les isolats sur des plaques, et la paire 'colonie proche' a été définie comme deux colonies avec une distance entre leurs coordonnées X – Y inférieure à 30 pixels plus la somme de leurs rayons. Pour éviter l'impact potentiel des antibiotiques sur la morphologie des colonies, seules les colonies cultivées sur des plaques mGAM uniquement ont été utilisées pour l'analyse morphologique.

Pour évaluer comment la croissance d'un genre spécifique pourrait être affectée par d'autres genres (Fig. 4d), nous avons d'abord identifié des paires de «colonies voisines» comme décrit ci-dessus, et l'impact de la croissance du genre-A sur le genre-B est quantifié en comparant les taille des colonies du genre-B avec le genre-A présent dans le voisinage, c'est-à-dire, en tant que colonie voisine, aux tailles des colonies du genre-B sans aucune colonie à proximité : la taille de l'effet a été définie comme le facteur de variation de la taille moyenne des colonies avec genre-A présent à la taille moyenne des colonies sans aucune colonie à proximité, et les valeurs P ont été calculées par le test U de Mann – Whitney sur les distributions de taille entre le genre-A présent dans le voisinage et sans aucune colonie à proximité, et taux de fausse découverte (FDR ) la correction a été effectuée à l'aide des méthodes de Bonferroni-Holm. Pour éviter l'impact potentiel des antibiotiques sur la morphologie des colonies, seules les colonies cultivées sur des plaques mGAM uniquement ont été utilisées pour l'analyse morphologique.

Pour tester si la morphologie des colonies sur les plaques pouvait aider à prédire l'identité taxonomique, les colonies du genre riche en données (> 100 isolats sur les 20 individus) ont été soumises à une formation et à des tests de modèles. Compte tenu de l'impact potentiel de la perturbation des antibiotiques et des colonies voisines, un modèle de forêt aléatoire multilabel a été formé sur 70 % des isolats, qui ont été échantillonnés au hasard à l'aide de caractéristiques morphologiques de 14 colonies, de l'état des antibiotiques et du nombre de colonies voisines, et de la performance (précision et rappel) du modèle a été évalué sur les 30 % d'isolats restants. La procédure de formation et d'évaluation du modèle a été amorcée 20 fois avec différents paramètres de randomisation pour minimiser les biais, et les performances de fond du modèle ont été calculées par un modèle nul (prédiction basée sur le nombre d'isolats). Pour effectuer un isolement microbien ciblé, un modèle de forêt aléatoire multilabel a été formé sur des colonies de genre riche en données (> 15 isolats du même individu) des individus H12, H13 et H14 séparément, comme décrit ci-dessus. Les mêmes échantillons fécaux ont ensuite été étalés et le modèle a été appliqué aux nouvelles plaques après la croissance bactérienne pour cribler toutes les colonies sur les plaques et prédire les colonies de taxonomie ciblée au niveau du genre. Toutes les colonies des plaques ont ensuite été isolées sur CAMII et soumises à un séquençage 16S V4 pour identifier leur taxonomie et évaluer la performance de l'isolement ciblé.

Pour surveiller la cinétique de croissance au quotidien, l'échantillon fécal H1t5 a été étalé sur des plaques mGAM uniquement et les plaques ont été imagées tous les jours pendant 6 jours de croissance. La détection et la segmentation des colonies ont été effectuées sur des images, et les caractéristiques morphologiques des colonies à différents jours ont été appariées en fonction de leurs coordonnées X – Y (Fig. 4a). Toutes les colonies sur plaques ont ensuite été isolées sur CAMII au jour 6 et soumises à une identification taxonomique par séquençage d'ARNr 16S. Pour quantifier la croissance initiale différentielle des genres, le nombre de colonies détectables de chaque genre chaque jour (suivi par les coordonnées x – y) a été normalisé par rapport à leur nombre total de colonies au jour 6 pour calculer la proportion de colonies détectables (Fig. 4b) à chaque jour.

L'ADNg des isolats sélectionnés a été extrait dans un format de 384 puits à l'aide d'un protocole basé sur le battement de billes de silice adapté d'une étude antérieure45. Tout d'abord, 40 µl de billes de silice de zircone de 0,1 mm (Biospec, 11079101Z) et 120 µl de solution de lyse (Tris-HCl 50 mM, pH 7,5 et EDTA 0,2 mM) ont été ajoutés à chaque puits de plaques à puits profonds de 384 puits (Thermo Fisher Scientific , 07-202-505). Ensuite, 40 µl de solutions de culture d'isolats ont été ajoutés à chaque puits et les plaques ont été centrifugées pendant 1 min à 4 500 g et fixées avec un tapis de scellement (Axygen, AM-384-DW-SQ). Pour éviter une surchauffe pendant le battage des billes, les plaques ont été vortexées pendant 5 s et incubées à -20 ° C pendant 10 min avant le battage. Ensuite, les plaques ont été fixées sur un batteur à billes (Biospec, 1001) et soumises à un battage de billes pendant 5 minutes, suivi d'une période de refroidissement de 10 minutes. Le cycle de battement des billes a été répété une fois et les plaques ont été centrifugées à 4 500 g pendant 5 min pour centrifuger les débris cellulaires. Ensuite, 10 µl de lysat cellulaire ont été transférés dans une plaque PCR 384 puits (Bio-Rad, HSP3801) et 2 µl de solution de protéinase K (50 mM Tris–HCl, pH 7,5 et 1 µg µl−1 protéinase K (Lucigen, MPRK092) ) a été ajouté à l'aide d'un Formulatrix Mantis. Enfin, le lysat cellulaire a été soumis à une digestion à la protéinase K sur un thermocycleur (65 ° C 30 min, 95 ° C 30 min, 4 ° C infini) et transféré à -20 ° C pour un stockage à long terme. L'extraction d'ADNg pour les échantillons de matières fécales en vrac a été réalisée en utilisant le même protocole avec des volumes de réaction à grande échelle au format 96 puits.

Le séquençage 16S de la région V4 pour l'identification de la taxonomie des isolats a été réalisé au format 384 puits à l'aide d'un ensemble d'amorces de séquençage à double index. En bref, des amorces d'amplicon 16S V4 à code-barres ont été conçues sur la base d'amorces universelles 16S V4 et synthétisées par Integrated DNA Technologies. Ensuite, 1 µl de chaque combinaison unique d'amorce directe à code-barres 16SV4f_5xx et d'amorce inverse 16SV4r_7xx a été transférée sur une plaque PCR à 384 puits à l'aide de Labcyte Echo pour créer des plaques d'amorce uniques à double index. Ensuite, environ 130 nl d'ADNg ont été transférés sur une plaque d'amorce par un réplicateur à broches à 384 puits (Scinomix, SCI-6010.OS) et 2 µl de mélange maître NEBNext Q5 PCR (NEB, M0543L) ont été ajoutés à chaque puits à l'aide de Formulatrix Mantis. . Les échantillons ont ensuite été soumis à une amplification 16S V4 sur un thermocycleur (98 °C 30 s, 40 cycles : 98 °C 10 s, 55 °C 20 s, 65 °C 60 s ; 65 °C 5 min ; 4 °C infini). Les bibliothèques d'amplicons résultantes ont été regroupées manuellement et soumises à une électrophorèse sur gel sur des gels d'agarose E-Gel EX, 2 % (Thermo Fisher Scientific, G402002). Les bandes d'ADN attendues (~ 390 pb) ont été excisées du gel et extraites par Wizard SV Gel et PCR Cleanup System (Promega, A9282) en suivant les instructions du fabricant pour éliminer les amorces PCR et les dimères adaptateurs. Les bibliothèques purifiées sur gel ont été quantifiées par le test Qubit dsDNA HS (Thermo Fisher Scientific, Q32851) et séquencées sur la plate-forme Illumina MiSeq (kits de réactifs : v2 300 cycles, mode apparié) à une concentration de chargement de 8 pM avec 20 % de pointe PhiX (Illumina, FC-110-3001) ainsi que des amorces de séquençage personnalisées enrichies dans la cartouche de réactifs Miseq (6 µl de stock de 100 µM ; puits 12 : 16SV4_read1, puits 13 : 16SV4_index1, puits 14 : 16SV4_read2) en suivant les instructions du fabricant. Les séquences de toutes les amorces utilisées dans la préparation et le séquençage de la bibliothèque sont fournies dans le tableau supplémentaire 11. Le séquençage 16S V4 des échantillons en vrac a été effectué en utilisant un protocole similaire avec des volumes de réaction à grande échelle au format 96 puits. De plus, SYBR Green I (concentration finale : 0,2 x ; Thermo Fisher Scientific, S7563) a été ajouté à la réaction de PCR et une amplification quantitative 16S V4 a été effectuée et arrêtée pendant la phase exponentielle (généralement 13 à 17 cycles) et la réaction a été avancée. à la dernière étape d'extension.

Les lectures de séquençage brutes de l'amplicon 16S V4 ont été analysées par USEARCH v11.0.667 (réf. 46). Plus précisément, les lectures appariées ont été fusionnées à l'aide du mode '-fastq_mergepairs' avec le paramètre par défaut. Les lectures fusionnées ont ensuite été soumises à un filtrage de qualité en utilisant le mode '-fastq_filter' avec l'option '-fastq_maxee 1.0 -fastq_minlen 240' pour ne conserver que les lectures avec moins d'une base d'erreur attendue et supérieure à 240 bp. Les lectures restantes ont été dédupliquées (-fastx_uniques) et regroupées en ASV (-unoise3) à 100 % d'identité, et les lectures fusionnées ont ensuite été recherchées par rapport aux séquences ASV (-otutab) pour générer une table de comptage ASV. La taxonomie des ASV a été attribuée à l'aide du classificateur Ribosomal Database Project v2.13 formé avec l'ensemble d'entraînement d'ARNr 16S 18 (réf. 47). L'abondance relative des ASV dans les échantillons en vrac est définie comme le nombre de lectures d'ASV normalisé par le nombre total de lectures cartographiées.

Après le clustering ASV, la table de comptage ASV a été analysée pour calculer les mesures suivantes pour chaque isolat : le nombre total de lectures, les ASV avec le nombre de lectures le plus élevé et la pureté de cet ASV. Les isolats avec des lectures insuffisantes ou une pureté médiocre (nombre de lectures < 5 ou pureté < 0,5) ont été filtrés et la taxonomie des isolats restants a été définie comme les ASV avec le nombre de lectures le plus élevé. Pour construire la phylogénie des isolats, un alignement multiséquence a été effectué sur les séquences ASV des isolats à l'aide de MUSCLE v5 (réf. 48) et les séquences ASV alignées ont ensuite été analysées par MEGA v11.0.11 (réf. 49) pour calculer l'arbre de jonction voisin avec le paramètre par défaut pour la reconstruction de la phylogénie.

Le même ADNg utilisé pour le séquençage de l'amplicon 16S V4 a été soumis à un séquençage du génome entier pour les isolats. Des bibliothèques appariées ont été construites selon un protocole publié de préparation de bibliothèque Nextera à faible volume50 et séquencées sur la plateforme Illumina Nextseq 500/550 (2 × 75 bp) et la plateforme HiSeq (2 × 150 bp). Les lectures brutes ont ensuite été traitées par Cutadapt v2.1 avec les paramètres suivants : '--minimum-length 25:25 -u 10 -u -5 -U 10 -U -5 -q 15 --max-n 0 --pair -filter=any' pour supprimer les bases de mauvaise qualité et les adaptateurs Nextera. La couverture était de 1,42 ± 2,86 millions de lectures appariées par isolat et un séquençage à lecture longue PacBio a été effectué pour certains isolats par SNPsaurus afin d'améliorer les performances de l'assemblage de novo du génome.

Les lectures Illumina passant le filtrage de qualité et les lectures longues PacBio ont été assemblées par Unicycler v0.4.4 (réf. 51) avec un réglage par défaut pour générer des brouillons de génomes d'isolats, et la qualité et la taxonomie au niveau de l'espèce des brouillons de génomes ont ensuite été évaluées par QUAST v4.6.3 (réf. 52), CheckM v1.0.13 (réf. 53) et GTDB-Tk v0.2.2 (réf. 54). Parmi les 3 271 assemblages d'isolats, 1 197 ont été définis comme des brouillons de génomes de haute qualité (couverture > 20× ; N50 > 5 000 pb ; exhaustivité > 80 % ; contamination < 5 %) et utilisés pour la variation génomique en aval et l'analyse HGT. Pour identifier la variation génomique au niveau de la souche des isolats du microbiote intestinal au sein et entre les individus, des projets d'assemblages avec la plus grande complétude et N50 de chaque espèce ont été sélectionnés comme génomes de référence pour l'alignement des lectures, et les lectures Illumina traitées des isolats ont été alignées sur les génomes de référence du même espèce par Bowtie2 v2.3.4 (réf. 55) en mode apparié avec le réglage '--très sensible'. Les alignements de lectures résultants ont ensuite été traités par SAMtools v1.9 et BCFtools v1.9 (réf. 56) avec le paramètre '--ploidy 1' pour appeler la variation génomique (SNP et Indels). Les variations résultantes ont ensuite été soumises à un filtrage de qualité pour identifier les génotypes « fiables » (couverts par ≥5 lectures ; avec ≥0,9 haploïdie) et seules les variations de SNP avec plus de 90 % de génotypes « fiables » dans tous les isolats ont été utilisées pour l'analyse en aval. Pour construire la phylogénie basée sur le SNP, les profils de base des isolats sur les sites SNP ont été concaténés et l'arbre UPGMA a ensuite été calculé par MEGA v11.0.11 avec le paramètre par défaut.

Pour identifier les espèces isolées dans notre biobanque qui n'avaient pas été cultivées auparavant, l'identité moyenne des nucléotides entre les projets de génomes obtenus dans cette étude et les MAG ou les isolats de génomes provenant de bases de données accessibles au public a été calculée par FastANI v1.0 (réf. 57), et les génomes avec > 95 % des ANI étaient considérés comme appartenant à la même espèce.

Pour identifier HGT survenant entre les espèces au sein des isolats H1, nous avons comparé toutes les paires de génomes d'espèces différentes par BLASTN v2.7.1 (réf. 58) avec le paramètre '-evalue 0,1 -perc_identity 99' pour cribler systématiquement les blocs de régions génomiques avec une identité de séquence élevée. La valeur P des HGT candidats a ensuite été calculée sur la base de l'ANI à l'échelle du génome entre les isolats et ajustée ultérieurement par la procédure Benjamini – Hochberg. Les coups de souffle avec une valeur P ajustée <1 × 10−5 et une longueur supérieure à 2 000 pb ont été considérés comme des événements HGT entre des isolats d'espèces différentes. La fréquence des HGT entre les espèces a été quantifiée à l'aide d'une méthode précédemment publiée39,59, définie comme le nombre de paires de génomes inter-espèces partageant au moins un HGT divisé par le nombre total de paires de génomes inter-espèces. Pour annoter les ARG et les systèmes de sécrétion dans les éléments HGT, les séquences d'éléments HGT ont été annotées par Prokka v1.12 (réf. 60) en mode métagénome et les CDS résultants ont été recherchés dans la base de données CARD v3.1.4 (réf. 61) par BLASTP v2.7.1 pour identifier les hits ARG avec une valeur e <1 × 10−5, une identité >20 et une couverture de requête >50. Les systèmes de sécrétion ont également été prédits sur le CDS des éléments HGT par EffectiveDB62 avec le paramètre par défaut.

De plus amples informations sur la conception de la recherche sont disponibles dans le résumé des rapports sur le portefeuille Nature lié à cet article.

Les données de séquençage générées dans cette étude ont été soumises à la base de données NCBI BioProject (http://www.ncbi.nlm.nih.gov/bioproject/) sous le numéro d'accession PRJNA745993 (réf. 63). D'autres données associées de la collection d'isolats, y compris les caractéristiques morphologiques et les images brutes, peuvent être consultées à l'adresse http://microbienne-culturomics.com. La taxonomie des ASV a été attribuée sur la base de l'ensemble de formation 16S ARNr 18 fourni par Ribosomal Database Project. L'annotation des gènes ARG et des systèmes de sécrétion dans les éléments HGT était basée sur la base de données CARD v3.1.4 et la base de données EffectiveDB, respectivement.

Les scripts utilisés pour analyser les images de plaques dans cette étude sont accessibles à l'adresse https://github.com/hym0405/CAMII ref. 64.

Poyet, M. et al. Une bibliothèque d'isolats bactériens intestinaux humains associée à des données multiomiques longitudinales permet la recherche mécaniste sur le microbiome. Nat. Méd. 25, 1442–1452 (2019).

Article CAS PubMed Google Scholar

Zhao, SJ et al. Évolution adaptative au sein des microbiomes intestinaux des personnes en bonne santé. Microbe hôte cellulaire 25, 656 (2019).

Article CAS PubMed PubMed Central Google Scholar

Zou, YQ et al. 1 520 génomes de référence de bactéries intestinales humaines cultivées permettent des analyses fonctionnelles du microbiome. Nat. Biotechnol. 37 179 (2019)

Article CAS PubMed PubMed Central Google Scholar

Browne, HP et al. La culture de microbiote humain « incultivable » révèle de nouveaux taxons et une sporulation importante. Nature 533, 543 (2016)

Article CAS PubMed PubMed Central Google Scholar

Goodman, AL et al. Vastes collections personnelles de cultures de microbiote intestinal humain caractérisées et manipulées chez des souris gnotobiotiques. Proc. Natl Acad. Sci. États-Unis 108, 6252–6257 (2011).

Article CAS PubMed PubMed Central Google Scholar

Villa, MM et al. Variation interindividuelle du métabolisme des glucides alimentaires par les bactéries intestinales révélée par la culture microfluidique en gouttelettes. mSystems 5, e00864-19 (2020).

Article PubMed PubMed Central Google Scholar

Watterson, WJ et al. Culture à haut débit basée sur des gouttelettes pour un dépistage précis des microbes intestinaux résistants aux antibiotiques. eLife 9, e56998 (2020).

Article CAS PubMed PubMed Central Google Scholar

Ji, BW, Sheth, RU, Dixit, PD, Tchourine, K. & Vitkup, D. Dynamique macroécologique du microbiote intestinal. Nat. Microbiol. 5 768 (2020)

Article CAS PubMed Google Scholar

Qamer, S., Sandoe, JAT & Kerr, KG Utilisation de la morphologie des colonies pour distinguer différentes souches et espèces d'entérocoques en culture mixte à partir d'échantillons cliniques. J.Clin. Microbiol. 41, 2644-2646 (2003).

Article PubMed PubMed Central Google Scholar

Allegrucci, M. & Sauer, K. Caractérisation des variantes de la morphologie des colonies isolées des biofilms de Streptococcus pneumoniae. J. Bactériol. 189, 2030-2038 (2007).

Article CAS PubMed Google Scholar

Cabeen, MT, Leiman, SA et Losick, R. Le dépistage de la morphologie des colonies révèle un rôle pour le système de phosphotransférase liée à l'azote de Pseudomonas aeruginosa dans la formation de biofilm. Mol. Microbiol. 99, 557-570 (2016).

Article CAS PubMed Google Scholar

Martin-Rodriguez, AJ et al. Régulation de la morphologie des colonies et de la formation de biofilms chez les algues Shewanella. Microb. Biotechnol. 14, 1183-1200 (2021).

Article CAS PubMed PubMed Central Google Scholar

Rettedal, EA, Gumpert, H. & Sommer, MOA Le phénotypage multiplex basé sur la culture du microbiote intestinal humain permet une récupération ciblée de bactéries précédemment non cultivées. Nat. Commun. 5, 4714 (2014).

Article CAS PubMed Google Scholar

Strittmatter, N. et al. Analyse de bactéries intactes par spectrométrie de masse à ionisation par évaporation rapide. Chim. Commun. 49, 6188–6190 (2013).

Article CAS Google Scholar

Fang, JS & Dorrestein, PC Techniques émergentes de spectrométrie de masse pour l'analyse directe des colonies microbiennes. Courant. Avis. Microbiol. 19, 120-129 (2014).

Article CAS PubMed Google Scholar

Isozaki, A. et al. Un guide pratique pour le tri cellulaire intelligent activé par l'image. Nat. Protocole 14, 2370-2415 (2019).

Article CAS PubMed Google Scholar

Hosny, A., Parmar, C., Quackenbush, J., Schwartz, LH & Aerts, HJWL Intelligence artificielle en radiologie. Nat. Rev. Cancer 18, 500–510 (2018).

Article CAS PubMed PubMed Central Google Scholar

Cole, JA, Kohler, L., Hedhli, J. et Luthey-Schulten, Z. Coopérativité métabolique à résolution spatiale au sein de colonies bactériennes denses. Système BMC. Biol. 9, 15 (2015).

Article PubMed PubMed Central Google Scholar

Chacon, JM, Mobius, W. & Harcombe, WR La ​​base spatiale et métabolique de la variation de la taille des colonies. ISME J. 12, 669–680 (2018).

Article CAS PubMed PubMed Central Google Scholar

Ratzke, C. & Gore, J. Modifier et réagir au pH environnemental peut entraîner des interactions bactériennes. PLoS Biol. 16, e2004248 (2018).

Article PubMed PubMed Central Google Scholar

Edgar, RC Mise à jour du seuil d'identité de 97 % pour les OTU d'ARN ribosomal 16S. Bioinformatique 34, 2371–2375 (2018).

Article CAS PubMed Google Scholar

Lloyd-Price, J. et al. Souches, fonctions et dynamiques dans le projet élargi du microbiome humain. Nature 550, 61 (2017)

Article CAS PubMed PubMed Central Google Scholar

Lozupone, CA, Stombaugh, JI, Gordon, JI, Jansson, JK & Knight, R. Diversité, stabilité et résilience du microbiote intestinal humain. Nature 489, 220-230 (2012).

Article CAS PubMed PubMed Central Google Scholar

Almeida, A. et al. Un nouveau schéma génomique du microbiote intestinal humain. Nature 568, 499 (2019)

Article CAS PubMed PubMed Central Google Scholar

Pasolli, E. et al. Vaste diversité inexplorée du microbiome humain révélée par plus de 150 000 génomes de métagénomes couvrant l'âge, la géographie et le mode de vie. Cellule 176, 649 (2019)

Article CAS PubMed PubMed Central Google Scholar

Franzosa, EA et al. Structure du microbiome intestinal et activité métabolique dans les maladies inflammatoires de l'intestin. Nat. Microbiol. 4, 293–305 (2019).

Article CAS PubMed Google Scholar

Huang, L. & Wu, T. Nouvelle application de réseau neuronal pour la classification des colonies bactériennes. Théor. Biol. Méd. Modèle. 15, 22 (2018).

Article PubMed PubMed Central Google Scholar

Qu, KY, Guo, F., Liu, XR, Lin, Y. & Zou, Q. Application de l'apprentissage automatique en microbiologie. Devant. Microbiol. 10, 827 (2019).

Article PubMed PubMed Central Google Scholar

Wang, HD et al. Détection précoce et classification des bactéries vivantes à l'aide de l'imagerie cohérente en accéléré et de l'apprentissage en profondeur. Lumière Sci. Appl. 9, 118 (2020).

Article PubMed PubMed Central Google Scholar

Venturelli, OS et al. Déchiffrer les interactions microbiennes dans les communautés synthétiques du microbiome intestinal humain. Mol. Syst. Biol. 14, e8157 (2018).

Article PubMed PubMed Central Google Scholar

Kim, H., Jeong, Y., Kang, SN, You, HJ & Ji, GE La co-culture avec Bifidobacterium catenulatum améliore la croissance, la colonisation intestinale et la production de butyrate de Faecalibacterium prausnitzii : études in vitro et in vivo. Micro-organismes 8, 788 (2020).

Article CAS PubMed PubMed Central Google Scholar

Lindstad, LJ et al. L'intestin humain Faecalibacterium prausnitzii déploie un système conservé très efficace pour se nourrir d'oligosaccharides dérivés du bêta-mannane. mBio 12, e0362820 (2021).

Article PubMed Google Scholar

Louis, P., Young, P., Holtrop, G. & Flint, HJ Diversité des bactéries productrices de butyrate du côlon humain révélée par l'analyse du gène butyryl-CoA: acétate CoA-transférase. Environ. Microbiol. 12, 304–314 (2010).

Article CAS PubMed Google Scholar

Tierney, BT et al. Le paysage du contenu génétique dans l'intestin et le microbiome humain oral. Microbe hôte cellulaire 26, 283 (2019)

Article CAS PubMed PubMed Central Google Scholar

Chen, L. et al. La stabilité génétique à long terme et la spécificité individuelle du microbiome intestinal humain. Cellule 184, 2302-2315 (2021).

Article CAS PubMed Google Scholar

Lau, PCK et al. Une région basique bactérienne leucine zipper histidine kinase régulant la dégradation du toluène. Proc. Natl Acad. Sci. États-Unis 94, 1453–1458 (1997).

Article CAS PubMed PubMed Central Google Scholar

Defois, C. et al. Les produits chimiques alimentaires perturbent l'activité du microbiote intestinal humain et ont un impact sur l'homéostasie intestinale, comme le révèlent les systèmes in vitro. Sci. Rep. 8, 11006 (2018).

Article PubMed PubMed Central Google Scholar

Jeong, H., Arif, B., Caetano-Anolles, G., Kim, KM et Nasir, A. Transfert horizontal de gènes dans des micro-organismes associés à l'homme déduit par la reconstruction et la réconciliation phylogénétiques. Sci. Rep. 9, 5953 (2019).

Article PubMed PubMed Central Google Scholar

Groussin, M. et al. Taux élevés de transfert horizontal de gènes dans le microbiome humain industrialisé. Cellule 184, 2053 (2021)

Article CAS PubMed Google Scholar

Juhas, M., Crook, DW & Hood, DW Systèmes de sécrétion de type IV : outils de transfert de gène horizontal bactérien et virulence. Microbiol cellulaire. 10, 2377-2386 (2008).

Article CAS PubMed PubMed Central Google Scholar

Woods, LC et al. Le transfert horizontal de gènes potentialise l'adaptation en réduisant les contraintes sélectives sur la propagation de la variation génétique. Proc. Natl Acad. Sci. États-Unis 117, 26868–26875 (2020).

Article CAS PubMed PubMed Central Google Scholar

Goryshin, IY, Jendrisak, J., Hoffman, LM, Meis, R. & Reznikoff, WS Mutagenèse par transposon d'insertion par électroporation de complexes de transposition Tn5 libérés. Nat. Biotechnol. 18, 97–100 (2000).

Article CAS PubMed Google Scholar

Mutalik, VK et al. Séquençage de la bibliothèque d'expression à double code-barres pour la caractérisation à haut débit des traits fonctionnels chez les bactéries. Nat. Commun. 10, 308 (2019).

Article PubMed PubMed Central Google Scholar

Ronda, C., Chen, SP, Cabral, V., Yaung, SJ et Wang, HH Ingénierie métagénomique du microbiome intestinal des mammifères in situ. Nat. Méthodes 16, 167–170 (2019).

Article CAS PubMed PubMed Central Google Scholar

Ji, BW et al. Quantification de la variabilité spatio-temporelle et du bruit dans l'abondance absolue du microbiote à l'aide d'un échantillonnage répété. Nat. Méthodes 16, 731–736 (2019).

Article CAS PubMed PubMed Central Google Scholar

Edgar, RC Recherche et regroupement d'ordres de grandeur plus rapides que BLAST. Bioinformatique 26, 2460–2461 (2010).

Article CAS PubMed Google Scholar

Wang, Q., Garrity, GM, Tiedje, JM & Cole, JR Classificateur bayésien naïf pour l'attribution rapide de séquences d'ARNr dans la nouvelle taxonomie bactérienne. Appl. Environ. Microbiol. 73, 5261–5267 (2007).

Article CAS PubMed PubMed Central Google Scholar

Edgar, RC MUSCLE : alignement de séquences multiples avec une grande précision et un haut débit. Nucleic Acids Res. 32, 1792–1797 (2004).

Article CAS PubMed PubMed Central Google Scholar

Kumar, S., Stecher, G., Li, M., Knyaz, C. & Tamura, K. MEGA X : analyse de la génétique évolutive moléculaire sur des plates-formes informatiques. Mol. Biol. Évol. 35, 1547-1549 (2018).

Article CAS PubMed PubMed Central Google Scholar

Baym, M. et al. Préparation de bibliothèque multiplexée peu coûteuse pour les génomes de la taille d'une mégabase. PLoS ONE 10, e0128036 (2015).

Article PubMed PubMed Central Google Scholar

Wick, RR, Judd, LM, Gorrie, CL & Holt, KE Unicycler : résolution des assemblages de génomes bactériens à partir de lectures de séquençage courtes et longues. Calcul PLoS. Biol. 13, e1005595 (2017).

Article PubMed PubMed Central Google Scholar

Gurevich, A., Saveliev, V., Vyahhi, N. & Tesler, G. QUAST : outil d'évaluation de la qualité des assemblages de génomes. Bioinformatique 29, 1072-1075 (2013).

Article CAS PubMed PubMed Central Google Scholar

Parks, DH, Imelfort, M., Skennerton, CT, Hugenholtz, P. & Tyson, GW CheckM : évaluation de la qualité des génomes microbiens récupérés à partir d'isolats, de cellules individuelles et de métagénomes. Génome Res. 25, 1043-1055 (2015).

Article CAS PubMed PubMed Central Google Scholar

Chaumeil, PA, Mussig, AJ, Hugenholtz, P. & Parks, DH GTDB-Tk : une boîte à outils pour classer les génomes avec la base de données Genome Taxonomy. Bioinformatique 36, 1925-1927 (2019).

PubMed PubMed Central Google Scholar

Langmead, B. & Salzberg, SL Alignement rapide en lecture lacunaire avec Bowtie 2. Nat. Méthodes 9, 357–359 (2012).

Article CAS PubMed PubMed Central Google Scholar

Li, H. et al. Le format d'alignement/carte de séquence et SAMtools. Bioinformatique 25, 2078-2079 (2009).

Article PubMed PubMed Central Google Scholar

Jain, C., Rodriguez, RL, Phillippy, AM, Konstantinidis, KT & Aluru, S. L'analyse ANI à haut débit des génomes procaryotes 90K révèle des limites d'espèces claires. Nat. Commun. 9, 5114 (2018).

Article PubMed PubMed Central Google Scholar

Camacho, C. et al. BLAST+ : architecture et applications. BMC Bioinf. 10, 421 (2009).

Article Google Scholar

Smillie, CS et al. L'écologie est le moteur d'un réseau mondial d'échange de gènes reliant le microbiome humain. Nature 480, 241–244 (2011).

Article CAS PubMed Google Scholar

Seemann, T. Prokka : annotation rapide du génome procaryote. Bioinformatique 30, 2068-2069 (2014).

Article CAS PubMed Google Scholar

Alcock, BP et al. CARD 2020 : surveillance de la résistance aux antibiotiques avec la base de données complète sur la résistance aux antibiotiques. Nucleic Acids Res. 48, D517–D525 (2020).

CAS PubMed Google Scholar

Eichinger, V. et al. EffectiveDB – mises à jour et nouvelles fonctionnalités pour une meilleure annotation des protéines bactériennes sécrétées et des systèmes de sécrétion de type III, IV, VI. Nucleic Acids Res. 44, D669–D674 (2016).

Article CAS PubMed Google Scholar

Huang, Y. et al. La culturomique microbienne à haut débit utilisant l'automatisation et l'apprentissage automatique. WGS de collecte des isolats. Archive de lecture de séquence. https://www.ncbi.nlm.nih.gov/bioproject/PRJNA745993 (2023).

Huang, Y. et al. La culturomique microbienne à haut débit utilisant l'automatisation et l'apprentissage automatique. GitHub. https://github.com/hym0405/CAMII (2023).

Télécharger les références

Nous remercions les membres du laboratoire Wang pour leurs conseils et commentaires sur le manuscrit. HHW reconnaît le soutien financier pertinent de la NSF (MCB-2025515), NIH (1R01AI132403, 1R01DK118044 et 1R21AI146817), ONR (N00014-18-1-2237 et N00014-17-1-2353), Burroughs Wellcome Fund (1016691), Irma T. Hirschl Trust et bourse de recherche Schaefer. RUS est soutenu par une bourse de la Fondation Fannie et John Hertz et une bourse de recherche supérieure NSF (DGE-1644869). TM est pris en charge par le programme de formation des scientifiques médicaux des NIH (T32GM007367). MR et FV-C. sont soutenus par NSF Graduate Research Fellowships (DGE-1644869). CR est soutenu par une bourse Junior Fellows de la Simons Society of Fellows.

Ces auteurs ont contribué à parts égales : Yiming Huang, Ravi U. Sheth.

Département de biologie des systèmes, Columbia University, New York, NY, États-Unis

Yiming Huang, Ravi U. Sheth, Shijie Zhao, Lucas A. Cohen, Kendall Dabaghi, Thomas Moody, Deirdre Ricaurte, Miles Richardson, Florence Velez-Cortes, Tomasz Blazejewski, Andrew Kaufman, Carlotta Ronda et Harris H. Wang

Département d'informatique biomédicale, Columbia University, New York, NY, États-Unis

Yiwei Soleil

Département de pathologie et de biologie cellulaire, Columbia University, New York, NY, États-Unis

Harris H. Wang

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

YH, RUS et HHW ont développé le concept initial ; YH, KD et TB ont développé un logiciel de sélection de colonies basé sur la morphologie ; YH, RUS et LAC ont réalisé des expériences et analysé des données avec la contribution de HHW ; TM, DR, YS, MR, FV-C., AK et CR ont aidé à l'isolement des colonies ; YS et SZ assistés avec les isolats WGS ; YH, RUS, SZ et HHW ont rédigé le manuscrit. Tous les autres auteurs ont discuté des résultats et approuvé le manuscrit.

Correspondance à Harris H. Wang.

HHW est conseiller scientifique de SNIPR Biome, Kingdom Supercultures, Fitbiomics, Arranta Bio, VecX Biomedicines, Genus PLC et cofondateur scientifique d'Aclid, qui ne sont pas tous impliqués dans l'étude. RUS et KD sont les cofondateurs de Kingdom Supercultures. Tous les autres auteurs ne déclarent aucun intérêt concurrent.

Nature Biotechnology remercie Peter Turnbaugh et les autres examinateurs anonymes pour leur contribution à l'examen par les pairs de ce travail.

Note de l'éditeur Springer Nature reste neutre en ce qui concerne les revendications juridictionnelles dans les cartes publiées et les affiliations institutionnelles.

Fig. supplémentaires. 1–13.

Tableaux supplémentaires 1 à 11.

Libre accès Cet article est sous licence Creative Commons Attribution 4.0 International, qui permet l'utilisation, le partage, l'adaptation, la distribution et la reproduction sur n'importe quel support ou format, à condition que vous accordiez le crédit approprié à l'auteur ou aux auteurs originaux et à la source, fournissez un lien vers la licence Creative Commons et indiquez si des modifications ont été apportées. Les images ou tout autre matériel tiers dans cet article sont inclus dans la licence Creative Commons de l'article, sauf indication contraire dans une ligne de crédit au matériel. Si le matériel n'est pas inclus dans la licence Creative Commons de l'article et que votre utilisation prévue n'est pas autorisée par la réglementation légale ou dépasse l'utilisation autorisée, vous devrez obtenir l'autorisation directement du détenteur des droits d'auteur. Pour voir une copie de cette licence, visitez http://creativecommons.org/licenses/by/4.0/.

Réimpressions et autorisations

Huang, Y., Sheth, RU, Zhao, S. et al. La culturomique microbienne à haut débit utilisant l'automatisation et l'apprentissage automatique. Nat Biotechnol (2023). https://doi.org/10.1038/s41587-023-01674-2

Télécharger la citation

Reçu : 12 août 2021

Accepté : 11 janvier 2023

Publié: 20 février 2023

DOI : https://doi.org/10.1038/s41587-023-01674-2

Toute personne avec qui vous partagez le lien suivant pourra lire ce contenu :

Désolé, aucun lien partageable n'est actuellement disponible pour cet article.

Fourni par l'initiative de partage de contenu Springer Nature SharedIt

Microbiologie de la nature (2023)

Biotechnologie de la nature (2023)