Peut-on prédire la couleur d'émission d'une protéine fluorescente à partir de sa structure 3D prédite par AlphaFold2 ? Un pipeline ML innovant pour accélérer le design de nouveaux biosenseurs.
Le développement d'une nouvelle FP optimisée prend 3-5 ans de mutagenèse dirigée et criblage expérimental intensif.
Les mutations sont choisies semi-rationnellement. Impossible de prédire l'effet d'une mutation sur le spectre d'émission.
Depuis 2021, on peut prédire la structure 3D de n'importe quelle séquence avec une précision atomique. Peut-on exploiter cette info ?
Baseline robuste
Gradient boosting optimisé
Structure-aware deep learning
Objectif final : MAE <15 nm • R² >0.85
Planning réaliste sur 12 mois (Master 2 recherche), incluant les phases de bibliographie, développement, expérimentation et rédaction académique.
Criblage in silico de milliers de variants avant validation expérimentale. Réduction du temps de développement de plusieurs années à quelques mois.
Moins de cycles mutagenèse/criblage expérimental. Focus des ressources sur les variants les plus prometteurs identifiés par ML.
SHAP révèle quels features structuraux déterminent les propriétés optiques. Insights pour le design rationnel de nouvelles FPs.
Compétences directement transférables : optimisation de jGCaMP, analyse de structures, ML sur données biologiques.
Pipeline complet, scripts reproductibles, modèles pré-entraînés et documentation détaillée
Voir sur GitHub