Informations

Existe-t-il des ressources en ligne contenant une liste des modifications post-traductionnelles et de leur poids moléculaire ?

Existe-t-il des ressources en ligne contenant une liste des modifications post-traductionnelles et de leur poids moléculaire ?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

J'étudie une protéine et je suis intéressé à en savoir plus sur toutes les modifications post-traductionnelles qu'elle a (comme je l'analyse via Western blot). J'ai trouvé une liste des modifications post-traductionnelles qu'il a, cependant, je veux savoir quels sont les poids moléculaires des modifications post-traductionnelles (en daltons/kilodaltons). J'ai trouvé ce site mais je ne sais pas quelle est la différence entre « changement de masse monoisotopique » et « changement de masse moyen » et dans quelles unités se trouvent les valeurs.

Je me demandais s'il existait des ressources en ligne fiables contenant une liste de toutes les modifications post-traductionnelles existantes et de leurs poids moléculaires associés ? Toutes les idées sont appréciées.


Vous en avez trouvé un. Étant donné que les différences entre les colonnes "Monoisotopique" et "Moyenne" dans le lien Sigma-Aldrich que vous avez trouvées sont extrêmement faibles, fonctionnellement, nous pouvons dire qu'elles sont approximativement égales. Les masses sont en unités de masse atomique, ou Daltons.

Cependant, ces chiffres proviennent des changements de masse réels observés dans les peptides modifiés analysés par LC/MS/MS, généralement à partir de protéines digérées. La spécification de masse est une plate-forme très précise, comme vous pouvez le voir par le nombre de décimales dans les nombres du tableau. Lors de l'estimation de la taille des protéines par Western blot, la marge d'erreur est d'au moins 1 kilodalton pour les protéines plus petites (10-50 kDa) et de 5-10 kDa ou plus pour les plus grandes. Étant donné qu'un seul événement de phosphorylation ne modifierait la masse d'une protéine cible que de 0,08 kDa, il est essentiellement impossible de déterminer cela par Western blot. Cependant, les preuves montrent que les protéines modifiées par un seul événement de phosphorylation ont également (parfois beaucoup) d'autres modifications post-traductionnelles (PTM), y compris d'autres sites phospho, la méthylation, l'acétylation, la glycosylation, etc., qui peuvent visiblement affecter une modification mobilité des protéines dans un gel SDS-PAGE.

Un autre facteur à prendre en compte est que lors de la dénaturation des gels SDS-PAGE (à partir desquels la plupart des Western blots sont générés), les taux de migration ne sont pas seulement influencés par la masse moléculaire totale, mais aussi par la charge, car les protéines migrent dans un champ électrique. Lorsque ces protéines sont linéarisées par le SDS, un détergent chargé, leur charge globale est à peu près proportionnelle à leur taille. Cependant, les PTM chargés comme la phosphorylation affecteront cette charge globale et peuvent modifier le taux de migration en fonction de cette charge. en outre à leur masse supplémentaire.

Combinez tout cela ensemble et vous obtenez des protéines modifiées par PTM qui migrent à des vitesses quelque peu différentes de celles auxquelles on pourrait s'attendre en fonction de la masse physique de la ou des modifications seules. Lorsque vous commencez à combiner plusieurs PTM, en particulier différents types de PTM (phosphorylation et acétylation, par exemple), il peut devenir très difficile, voire impossible, de prédire quelles seront les masses moléculaires apparentes attendues.


Résumé

Les modifications post-traductionnelles des protéines (PTM) sont une caractéristique bactérienne clé qui détient la capacité de moduler la fonction et les réponses des protéines aux signaux environnementaux. Jusqu'à récemment, leur rôle dans la régulation des systèmes procaryotes a été largement négligé. Cependant, les derniers développements de la protéomique basée sur la spectrométrie de masse ont permis une identification et une quantification sans précédent des protéines et des peptides qui subissent des PTM chez les bactéries, y compris chez les espèces qui affectent directement ou indirectement la santé humaine. Ici, nous abordons ce problème en effectuant la mise en commun et la comparaison mondiales les plus importantes et les plus complètes de peptides et de protéines PTM d'espèces bactériennes réalisées à ce jour. Les données ont été recueillies à partir de 91 études portant sur des peptides ou des protéines bactériens PTM identifiés par des méthodes basées sur la spectrométrie de masse. La présente analyse a révélé qu'il y avait un chevauchement considérable entre les PTM d'une espèce à l'autre, en particulier entre l'acétylation et d'autres PTM, en particulier la succinylation. Les espèces phylogénétiquement plus proches peuvent présenter davantage de phosphoprotéomes qui se chevauchent, mais les déclencheurs environnementaux contribuent également à cette proximité. Les PTM parmi les bactéries se sont avérées extrêmement polyvalentes et diverses, ce qui signifie qu'une même protéine peut subir une grande variété de modifications différentes à travers plusieurs espèces, mais elle peut également subir des modifications différentes au sein de la même espèce.


Existe-t-il des ressources en ligne contenant une liste des modifications post-traductionnelles et de leur poids moléculaire ? - La biologie

Modifications post-traductionnelles des protéines après lésion de la moelle épinière

Shuang Zhu 1 , Bing-Sheng Yang 1 , Si-Jing Li 1 , Ge Tong 2 , Jian-Ye Tan 1 , Guo-Feng Wu 1 , Lin Li 1 , Guo-Li Chen MD, PhD 3 , Qian Chen Doctorat 4 , Li-Jun Lin MD, PhD 1
1 Département d'articulation et d'orthopédie, Hôpital de Zhujiang, Université de médecine du Sud, Guangzhou, province du Guangdong, Chine
2 Département d'ultrasons médicaux, Laboratoire clé de recherche en hépatologie de la province du Guangdong, Troisième hôpital affilié de l'Université Sun Yat-sen, Guangzhou, Province du Guangdong, Chine
3 Département d'orthopédie, hôpital affilié de l'université de Putian, Putian, province du Fujian, Chine
4 Laboratoire de biologie cellulaire et moléculaire, Département d'orthopédie, Alpert Medical School of Brown University/Rhode Island Hospital, Providence, RI, États-Unis

Date de soumission05-août-2020
Date de la décision11-Sept-2020
Date d'acceptation22-Nov-2020
Date de publication Web19-fév-2021

adresse de correspondance:
Guo Li Chen
Département d'orthopédie, hôpital affilié de l'université de Putian, Putian, province du Fujian
Chine
Li-Jun Lin
Département d'articulation et d'orthopédie, Hôpital de Zhujiang, Université de médecine du Sud, Guangzhou, province du Guangdong
Chine
Qian Chen
Laboratoire de biologie cellulaire et moléculaire, Département d'orthopédie, Alpert Medical School of Brown University/Rhode Island Hospital, Providence, RI
Etats-Unis

Source de soutien : Ce travail a été soutenu par la Fondation nationale des sciences naturelles de Chine, n° 81801210 (à SZ), Conflit d'intérêt: Rien

EST CE QUE JE: 10.4103/1673-5374.308068

Les déficits des capacités neuronales intrinsèques de la moelle épinière, un manque de soutien de la croissance et la suppression de l'excroissance axonale par des molécules inhibitrices signifient que les lésions de la moelle épinière ont presque toujours des conséquences dévastatrices. En tant que tel, l'un des principaux objectifs du traitement des lésions de la moelle épinière est de développer des stratégies pour s'opposer aux facteurs extrinsèques ou intrinsèques d'inhibition de la croissance axonale ou améliorer les facteurs qui soutiennent la croissance axonale. Parmi ces facteurs, une série de troubles individuels au niveau des protéines ont été identifiés lors de la génération d'axones suite à une lésion de la moelle épinière. De plus, un nombre croissant d'études ont indiqué que les modifications post-traductionnelles de ces protéines ont des implications importantes pour la croissance axonale. Certains chercheurs ont découvert une variété de modifications post-traductionnelles après une lésion de la moelle épinière, telles que la tyrosination, l'acétylation et la phosphorylation. Dans cette revue, nous avons passé en revue les modifications post-traductionnelles pour la croissance axonale, la récupération fonctionnelle et la douleur neuropathique après une lésion de la moelle épinière, dont une meilleure compréhension peut élucider le changement dynamique des molécules liées à la lésion de la moelle épinière et faciliter le développement d'un nouveau stratégie thérapeutique pour les lésions de la moelle épinière.

Mots clés: altération de la fonction de la matrice extracellulaire cicatrice gliale régénération du nerf douleur neuropathique modification post-traductionnelle lésion de la moelle épinière cible thérapeutique


Comment citer cet article :
Zhu S, Yang BS, Li SJ, Tong G, Tan JY, Wu GF, Li L, Chen GL, Chen Q, Lin LJ. Modifications post-traductionnelles des protéines après lésion de la moelle épinière. Régénération neuronale Res 202116:1935-43

Comment citer cette URL :
Zhu S, Yang BS, Li SJ, Tong G, Tan JY, Wu GF, Li L, Chen GL, Chen Q, Lin LJ. Modifications post-traductionnelles des protéines après lésion de la moelle épinière. Neural Regen Res [série en ligne] 2021 [cité le 20 juin 2021] 16:1935-43. Disponible sur : http://www.nrronline.org/text.asp?2021/16/10/1935/308068

Shuang Zhu, Bing-Sheng Yang. Ces auteurs ont participé à ce travail à part égale.

Généralement, la SCI peut être divisée en trois phases (Tator et al., 2009). La phase aiguë, qui est causée par des dommages mécaniques aux tissus de la moelle épinière dus à un impact direct ou à des ondes de choc, déclenche un certain nombre de processus physiopathologiques parallèles. La perturbation mécanique des tissus neuronaux et vasculaires peut entraîner une nécrose et la mort cellulaire, et le déséquilibre ionique de K + , Na + , Ca 2+ peut entraîner une altération de la fonction neurale et un choc rachidien (Baumann, 2020). De plus, les axones sectionnés subissent une dégénérescence wallérienne de la partie distale de l'axone, ainsi que leurs gaines de myéline associées. Le stade secondaire (phase de blessure subaiguë) de la LME peut survenir de quelques minutes à quelques semaines après la blessure, au cours de laquelle le système nerveux est plus gravement endommagé (Lin, 2020). La physiopathologie de cette étape implique de multiples processus, tels que l'apoptose et la formation de radicaux libres. L'augmentation de la concentration de cytokines et l'infiltration continue de lymphocytes qui se produit après la mort cellulaire augmentent à leur tour rapidement la mort cellulaire. La SCI peut évoluer vers une phase chronique de quelques jours à quelques années après la blessure, au cours de laquelle la matière grise du corps se dissoudra progressivement, le tissu conjonctif se déposera progressivement et des cicatrices gliales se formeront (Liu et al., 2019) . De plus, une hyperexcitabilité permanente dans de nombreuses cellules donne lieu à des douleurs neuropathiques chroniques chez la plupart des patients (Bahari et al., 2019 Calvo et al., 2019).

Au cours de chacune de ces phases, de nombreux processus ont lieu aux niveaux de la transcription, de l'édition d'ARN, de la traduction et de la modification post-traductionnelle (PTM) (Mierke, 2020). Parmi celles-ci, la PTM en particulier a suscité un intérêt au cours des dernières décennies car elle peut être manipulée de manière réversible par rapport au processus irréversible de transcription, d'édition d'ARN et de traduction. La modification post-traductionnelle est le processus de modulation chimique des chaînes polypeptidiques après transcription et traduction. Dans les cellules, la PTM joue le principal rôle régulateur dans le changement de conformation des protéines. Avec la participation de PTM, les protéines du corps changent de conformation, ce qui affecte à son tour leurs interactions avec différentes protéines et affecte la transduction du signal en aval (Czuba et al., 2018). De plus, de nombreux changements fonctionnels des protéines introduits par les PTM sont instantanés et réversibles. Un contrôle similaire du changement fonctionnel par la synthèse de novo ou la dégradation des protéines prendrait plus de temps et serait plus gourmand en bioénergie que les PTM (Uversky, 2013). En ce sens, le ciblage des PTM est plus précis et économique que le ciblage de la transcription et de la traduction des gènes. Par rapport au processus pathologique en évolution rapide de la SCI, les changements d'expression génique après la SCI sont lents. Alors que les PTM sur les protéines ou les acides aminés peuvent modifier instantanément la fonction des protéines, ce qui fait de la PTM la cible idéale pour ralentir ou arrêter les phases radicalement changeantes de la SCI. Il a été rapporté que la PTM est impliquée dans de nombreux processus physiopathologiques de la SCI, tels que la régénération axonale (Voulalas et al., 2017 Qi et al., 2019), la formation de cicatrices gliales (Gliem et al., 2015 Wang et al., 2016 ), la production de molécules inhibitrices (Wong et al., 2018), la plasticité inadaptée (Imagama et al., 2011) et l'apparition de douleurs neuropathiques (Lai et al., 2016). La PTM peut être analysée et classée en types modifiés d'abord, les modifications d'acides aminés, telles que la protéolyse, qui peuvent également être désamidées pour permettre le clivage des protéines, en second lieu, la modification de molécules complexes par des processus tels que la glycosylation et l'acylation, ce qui permet la structure moléculaire des protéines à étendre troisièmement, les modifications chimiques, telles que l'oxydation et la méthylation et quatrièmement, la modification des polypeptides, telle que l'ubiquitination et la sulfonylation (Audagnotto et al., 2017 Spoel, 2018). La PTM affecte les processus physiologiques des cellules à la fois lorsque le corps exerce des activités physiologiques normales et des activités physiologiques anormales, et peut modifier la fonction des protéines en dégradant les protéines, en affectant l'interaction entre les protéines et en modifiant la structure des protéines (Beltrao et al., 2013 Lüscher et al., 2018 Gao et al., 2020). Plusieurs PTM ont été documentées dans le contexte de la SCI, notamment l'acétylation (Hubbert et al., 2002 Reed et al., 2006), la nitrosylation (Scheving et al., 2012 Khan et al., 2019), la phosphorylation (Xu et al. , 2006 Voulalas et al., 2017), les ribosylates (Kuzhandaivel et al., 2010), l'ubiquitination (Lai et al., 2016 Jeong et al., 2018) et l'oxydation (Ingles et al., 2016). Cependant, on ne sait toujours pas comment chacune de ces modifications contribue au processus physiopathologique de la SCI, ou quel rôle joue une modification dans chaque processus physiopathologique ou déficience fonctionnelle spécifique. La régénération de la moelle épinière est principalement entravée par la diminution des capacités neuronales intrinsèques et l'environnement inhibiteur extrinsèque. Ici, nous avons examiné les PTM signalés sur les facteurs intrinsèques et extrinsèques qui affectent la récupération des SCI. Nos résultats indiquent que la PTM est une cible thérapeutique importante de la LME, car elle est beaucoup plus régulable et réversible que les stratégies thérapeutiques traditionnelles. De plus, son rôle dans le contrôle de la douleur neuropathique est prometteur pour de futurs travaux cliniques et devrait être étudié dans de futurs travaux.

Nous avons mené une recherche PubMed pour les patients avec SCI/modèles animaux de SCI/cellules nerveuses, neurogenèse/neuroregénération/régénération axonale, et leurs résultats. Les études publiées de 1992 à 2020 sur les PTM après SCI ont été identifiées sur la base de données PubMed. Des informations plus détaillées sur des PTM spécifiques après la recherche SCI ont été recherchées en utilisant le terme “SCI” en combinaison avec le terme souhaité (par exemple, “phosphorylation”). Pour explorer l'acétylation plus en profondeur, le terme « acétylation » a également été combiné avec le terme « « 8220SCI« ». Les publications sur la neurogenèse et la neurorégénération et la régénération axonale ont été obtenues en combinant ces deux termes avec le terme « & 8220SCI & 8221. La pertinence des publications identifiées a été vérifiée en vérifiant la présence de termes de recherche dans le titre, le résumé et les mots clés. Les expériences non SCI ont été exclues. Nous nous sommes concentrés sur des résultats généraux plutôt que récents dans la mesure du possible.

Modifications post-traductionnelles des microtubules

Atashi et al. (1992) ont démontré que l'étendue de la phosphorylation de la tubuline en réponse aux signaux d'adhésion locaux rencontrés par le cône de croissance peut influencer la polymérisation des microtubules pour réguler la régénération nerveuse. Les auteurs ont découvert que les molécules d'adhésion cellulaire et les anticorps dirigés contre les molécules d'adhésion cellulaire inhibent la phosphorylation de la tubuline dans les membranes des cônes de croissance. La protéine 1B associée aux microtubules (MAP1B), qui est exprimée dans les cellules neuronales et gliales, est une protéine cytosquelettique et associée à la croissance majeure. Des études connexes ont rapporté que lorsque MAP1B fonctionne, il peut être affecté par la phosphorylation de MAP1B. En étudiant la croissance des axones cellulaires PC12 (une lignée cellulaire dérivée du phéochromocytome de la médullosurrénale du rat), les chercheurs ont découvert avec succès ce phénomène selon lequel la phosphorylation de MAP1B contribue aux changements fonctionnels de MAP1B lors de l'utilisation de l'induction de NGF (Migita et al., 2019). Une grande quantité de MAP1B peut être trouvée dans les axones en croissance et, après phosphorylation, MAP1B favorise la croissance des cônes de croissance (Ramkumar et al., 2018 Igarashi, 2019)

Cependant, la phosphorylation de MAP1B ne favorise pas nécessairement la croissance des neurites (Igarashi et al., 2020). Certains chercheurs ont rapporté qu'après que des rats aient été blessés par l'acide alginique, les fibres afférentes peuvent être privées de traitement à l'acide alginique, ce qui favorise efficacement l'expression de MAP1B et augmente sa phosphorylation (Soares et al., 1998). De plus, après une commotion cérébrale, il a été constaté que les rats réexpriment MAP1B et qu'il est également phosphorylé. Il semble donc que la présence de ces protéines permette aux neurones de se régénérer (Emery et al., 2000).

L'acétylation de la tubuline s'est avérée jouer un rôle dans de nombreuses fonctions physiologiques, non seulement elle favorise la croissance axonale, mais joue également un rôle dans la ramification des axones (Rossaert et al., 2020). La tubuline désacétylase, l'histone désacétylase 6 (HDAC6) et la sirtuine 2 (SIRT2) affectent l'état d'acétylation de la tubuline. Certaines études ont montré que l'acétylation de la α-tubuline à Lys40 facilite le transport axonal en favorisant la liaison des protéines motrices kinésine et dynéine aux microtubules (Mo et al., 2018 Rossaert et al., 2020). HDAC6 s'est également avéré désacétyler la tubuline (Hubbert et al., 2002). De plus, l'acétylation de la tubuline peut être augmentée par l'inhibition de HDAC6, qui favorise le transport axonal et s'est avérée bénéfique dans les modèles animaux de maladies neurodégénératives, telles que la maladie de Huntington (Guo et al., 2017). En utilisant un modèle murin de SCI, Dan et al. (2018) ont montré qu'en effectuant l'ablation de MEC-17, l'acétylation de la tubuline peut être inhibée, ce qui à son tour conduit à la prolifération des axones neuronaux. Cela provoque alors un déroulement des microtubules, qui envahissent alors les filopodes. Dans une autre étude de modèle murin SCI, Zheng et al. (2020) ont constaté que le niveau de HDAC6 dans le corps était significativement augmenté après SCI, tandis que l'inhibition de HDAC6 par la tubastatine A induisait une récupération fonctionnelle dans le modèle murin contusion SCI. Cela est probablement dû au fait que l'inhibition de HDAC6 peut provoquer l'acétylation et la stabilisation des microtubules et donc restaurer la fonction de transport, ce qui peut entraîner une augmentation de la longueur axonale et restaurer le flux autophagique. Selon des rapports connexes, Elp3 peut favoriser l'acétylation et inhiber la régulation de HDAC6, et le silence des cellules Elp3 peut retarder la migration et endommager les branches neuronales (Creppe et al., 2009).

Des recherches antérieures ont clairement montré que la croissance des axones est affectée après l'apparition de la SCI, et qu'il existe une relation étroite entre ce processus et le transport rétrograde dépendant des microtubules (Mo et al., 2018 Guo et al., 2020 Rossaert et al., 2020). En analysant la structure des microtubules, les auteurs ont découvert que la tubuline β et l'extrémité C de l'extrémité α étaient exposées. Ce site est aussi le cœur des MAP. La détyrosination, la glutamylation et la glycosylation des microtubules peuvent également aider à réguler l'interaction et l'activité des MAP et des moteurs moléculaires (Janke et al., 2011).Lorsque les axones sont blessés, la tubuline tyrosine ligase (TTL) sur le site endommagé agit pour augmenter le niveau de α-tubuline tyrosine, ce qui peut favoriser le transport rétrograde des signaux de blessure (Song et al., 2015). Certains chercheurs ont démontré que, chez les animaux de type sauvage, la détyrosination des microtubules peut être inhibée en utilisant la lactone liane lactone sesquiterpène. Si tout le corps ou une partie du corps est traité avec de l'hydroquinone lactone, la régénération des axones et la récupération fonctionnelle peuvent être favorisées. Par conséquent, on peut émettre l'hypothèse que l'inhibition de la détyrosination des microtubules peut améliorer l'effet du traitement lors du traitement de patients souffrant de lésions nerveuses (Gobrecht et al., 2019).

Des études ont montré que si les axones peuvent être maintenus dans un état stable, le niveau de polyglutamylation des microtubules est élevé, tandis que le corps a une faible activité polyglutaminase (Audebert et al., 1993). Ikegami et al. (2006) ont découvert que la protéine tubuline tyrosine ligase (TTLL) favorise la polyglutamylation, qui peut être transcrite au plus haut niveau du système nerveux. De plus, une glutamylation excessive des microtubules est directement liée à la neurodégénérescence, et la régulation négative de la principale polyglutamate amylase TTLL1 du cerveau empêche partiellement la dégénérescence des cellules de Purkinje dans le cervelet des souris PCD (Rogowski et al., 2010). Certaines recherches ont indiqué que, en tant que sorte de polyglutaminase à tubuline, il existe un lien étroit entre les neurites TTLL7 et MAP2 positifs dans les cellules de type méridien (PC12) (Ikegami et al., 2006 Sferra et al., 2020 ). De plus, Maas et al. (2009) ont découvert que la polyglutamylation affecte l'activité des neurones chez le rat en régulant le transport des vésicules synaptiques.

Modifications post-traductionnelles de la voie de stimulation

La kinase régulée par le signal extracellulaire (ERK) est activée en réponse à divers facteurs neurotrophiques (Hausott et al., 2019 Jin et al., 2020). ERK favorise la motilité et la régénération des cônes de croissance après une lésion axonale dans les axones du ganglion de la racine dorsale adulte (Manire, 2019 Liu et al., 2020). En utilisant un modèle de rat de SCI, induit par une section de la moelle épinière, Xu et al. (2006) ont démontré que la nitration pouvait moduler la 3-nitrotyrosine après SCI. Lorsque la SCI est en phase aiguë, l'augmentation de l'attaque par l'oxyde nitrique augmente non seulement le niveau de phosphorylation de ERK1/2, mais augmente également le niveau de protéine kinase activée par le mitogène p38. Et ces protéines jouent un rôle important dans la dégénérescence neuronale après une SCI aiguë. De plus, l'activation du cotransporteur K + /Cl – (KCC2) s'est avérée bénéfique dans le contrôle de la douleur neuropathique et la récupération des lésions de la moelle épinière (Cardarelli et al., 2017 Chen et al., 2018). Le recyclage membranaire constitutif de KCC2 est régulé par l'état de phosphorylation du résidu sérine C-terminal 940 (S940). La phosphorylation de S940 dans KCC2 par la protéine kinase C (PKC) limite le clivage de KCC2 dans les lysosomes après une endocytose dépendante de la clathrine et diminue le taux d'internalisation de KCC2 à partir de la membrane plasmique (Lee et al., 2007). Et l'expression de KCC2 est régulée à la baisse après l'activation des cascades de signalisation PLC⓿ et Shc de la voie BDNF-TrkB, ce qui est évident au niveau du site péri-lésionnel où le BDNF s'accumule après la SCI (Carter et al., 2018). De plus, le BDNF active la m-Calpain neuronale, une protéase qui entraîne l'inactivation irréversible de KCC2 via la phosphorylation médiée par MAPK (Puskarjov et al., 2012). De plus, l'activation des récepteurs NMDA augmente les concentrations intracellulaires de Ca 2 & 43, et KCC2 est internalisé dans le cytosol pour la déphosphorylation de S940 par la protéine phosphatase 1 (PP1), diminuant ainsi les niveaux fonctionnels de KCC2 dans la membrane plasmique (Lee et al., 2011) .

Voie inhibitrice des modifications post-traductionnelles

Certains chercheurs ont suggéré qu'après la SCI, le niveau d'expression de la voie de signalisation Rho augmente (Hong et al., 2019 Xiao et al., 2019). L'activation de Rho et de son effecteur en aval ROCK kinase déclenche l'effondrement du cône de croissance et représente un obstacle important à la régénération axonale (Koch et al., 2018). Il a été rapporté qu'en raison des effets inhibiteurs de Rho et ROCK, le chondroïtine sulfate protéoglycane (CSPG) ne peut pas inhiber la croissance des neurites (Monnier et al., 2003). Et le sulfate de chondroïtine « altère la migration des cellules souches neurales par l'activation de « 8194ROCK » (Galindo et al., 2018). De plus, le guidage et l'extension des axones nerveux seraient affectés par la guanine nucléotide triphosphatase (GTPases) de la famille Rho (Galino et al., 2019). La traduction et la modification des Rho GTPases peuvent affecter l'activité des Rho GTPases (Denk-Lobnig et al., 2019). La prénylation peut se produire à l'extrémité C-terminale des protéines, et la présence de prénylation aide à guider la croissance des neurites (Jennings et al., 2018 Reddy et al., 2020). De plus, la signalisation de la protéine médiateur de la réponse Collapsin 2 (CRMP2) coordonne la formation du cytosquelette et régule la division cellulaire, la migration, la polarité et la connexion synaptique. L'inhibition de la phosphorylation de CRMP2 favorise la régénération axonale et/ou la germination des axones moteurs et sensoriels, stabilise les microtubules dans les astrocytes pour inhiber la formation de cicatrices fibreuses après une SCI et réduit l'infiltration des cellules inflammatoires (Nagai et al., 2016).

Au cours de la phase chronique de la SCI, il y a de nombreux changements physiologiques dans le corps, tels que la prolifération des cellules gliales, le dépôt de tissu conjonctif et la dissolution de la matière grise, qui provoquent la formation de cicatrices gliales sur la moelle épinière (Bradbury et al., 2019). Les molécules de la matrice extracellulaire et les astrocytes réactifs sont les principales substances qui forment les cicatrices gliales (He et al., 2020). Après la SCI, un grand nombre d'astrocytes se lient à la zone cicatricielle. La présence de ces astrocytes provoque une augmentation de la résistance mécanique du tissu, ce qui rend la migration cellulaire et la croissance des axones à travers le tissu plus difficiles. De plus, des molécules inhibitrices de croissance axonale qui se lient à la membrane basale collante de la cicatrice s'accumulent au site de la lésion à des concentrations locales élevées (Tran et al., 2018).

Dans une étude, Besson et al. (2004) ont démontré que l'inhibiteur de kinase cycline-dépendante p27kip1 affecte les activités physiologiques des astrocytes et joue un rôle dans la migration et la prolifération cellulaire. Une étude précédente a montré que l'inhibition de la O-GlcNAcylation de p27Kip1 sur Ser2 par une mutation génique (S2A) atténue la phosphorylation de Ser10 dans les astrocytes, ce qui favorise la motilité des astrocytes et réduit la formation de cicatrices chez les rats souffrant de contusion médullaire (Mao et al., 2015). Dans un modèle de rat de SCI, Zhao et al. (2011) ont découvert que, dans la phase G1 du cycle cellulaire, l'ubiquitine ligase KPC peut dégrader p27kip1. En tant que sous-unité catalytique de KPC, il existe une relation étroite entre KPC1 et la prolifération des astrocytes de rat (Zhao et al., 2011).

La glycosylation est un processus de modification de la traduction qui affecte non seulement la localisation subcellulaire, mais également la structure des protéines. La sulfonylation requise pour la transcription dépendante de C/EBPδ s'est avérée inhibée après l'administration d'inducteurs lipogéniques et de facteur de croissance épidermique (Lai et al., 2008). De plus, il a été démontré que le C/EBP contribue à la formation de cicatrices gliales, altérant ainsi la récupération fonctionnelle après une SCI contusive chez le rat (Wang et al., 2016).

En dehors de la cicatrisation, les molécules inhibitrices sont des éléments majeurs de l'environnement inhibiteur après SCI. En effet, la cicatrice gliale fonctionne comme un conteneur naturel pour les molécules inhibitrices, ce qui augmente la concentration de molécules inhibitrices et exacerbe l'effet inhibiteur. Les molécules associées à la myéline sont le groupe d'inhibiteurs le plus étudié, dont l'un est Nogo-A, qui se lie aux récepteurs de la membrane neuronale, inhibe la croissance et provoque en même temps l'effondrement des cônes de croissance (Zhao et al., 2019 ). L'ablation de Nogo-A favorise la phosphorylation de LIMK1, qui active davantage la cofiline en diminuant sa phosphorylation. La dynamique de l'actine serait également régulée par la cofiline, qui peut couper l'activité des filaments, régulant ainsi la puissance des protéines motrices (Montani et al., 2009). Cela suggère qu'il existe un lien étroit entre le neurone Nogo-A et la motilité des cônes de croissance. En termes de modification de Nogo-A lui-même, Yokoyama et al. (2006) ont découvert que Nogo-A était phosphorylé par les kinases de la famille Src à Tyr-694, ce qui indique que les fonctions de Nogo-A ont un niveau de complexité supplémentaire.

L'acétylation des microtubules α-tubuline peut être favorisée en inhibant l'histone désacétylase-6 (HDAC6), tout en restaurant simultanément la croissance des axones inhibés par les CSPG et la MAG (Rivieccio et al., 2009) à l'inverse, l'acétyltransférase-1 de la tubuline ( αTAT1 acétylation) a la fonction opposée (Cueva et al., 2012). Des chercheurs tels que Wong et al. (2018) ont utilisé un modèle murin de SCI pour montrer que αTAT1 est régulé à la baisse via l'influence de MAG et CSPG, tandis que les niveaux de HDAC6 ou l'activité HDAC6 restent inchangés avec l'exposition aux CSPG et MAG. De plus, la surexpression de αTAT1 régulée à la baisse peut restaurer la croissance des neurites, ce qui peut indiquer que le ciblage de αTAT1 à un niveau post-traductionnel pourrait avoir un potentiel thérapeutique après une SCI.

Les CSPG appartiennent à la classe des protéoglycanes (Listik et al., 2019), qui fonctionnent non seulement comme des inhibiteurs, mais aussi comme un éclaireur et un guide de croissance axonale après SCI (Schmidt, 2019). Des études antérieures ont montré que la chaîne CS, la chaîne KS et la chaîne N-glycanes du CSPG inhibent la croissance des neurites. Cependant, la contribution de chacun de ces composants n'a pas encore été examinée à l'aide d'une stratégie de modification post-traductionnelle. -1 cellules (Hering et al., 2020). Cela indique que les PTM du CSPG lors de l'excroissance des neurites peuvent être une cible thérapeutique pour la SCI.

Métalloprotéinases matricielles

Les métalloprotéinases matricielles (MMP) ne sont pas seulement impliquées dans l'interaction entre les cellules, mais aussi dans l'interaction entre les cellules et la matrice extracellulaire. Les MMP interfèrent avec le processus protéolytique, qui est essentiel au cours du développement normal, de la cicatrisation des plaies et du remodelage de la matrice de réparation à vie (Sanderson et al., 2019). Dans la SCI, il a été démontré que les MMP contribuent à une réponse neuro-inflammatoire progressive, au stress oxydatif, à l'apoptose et à la dégradation des cicatrices gliales (Zhang et al., 2011). L'apparition de complications après SCI dépend de plusieurs facteurs, y compris quand et où les MMP sont exprimées et le profil de leurs substrats disponibles de MMP. Par exemple, le blocage des MMP au stade précoce de la SCI peut rendre la barrière plus stable, réduire l'apoptose et protéger les neurones. Cependant, dans la phase chronique de la SCI, la formation de cicatrices gliales affecte la croissance des protéines extracellulaires (Mirzaie et al., 2018).

La traduction et la modification des MMP peuvent permettre à leurs substrats de mieux se lier à la matrice extracellulaire. La glycosylation des MMP s'est avérée améliorer de manière significative leur liaison avec la matrice extracellulaire (Agarwal et al., 1999). En tant que produit de MMP glycosylée le plus courant, MMP9 contient non seulement des sites de glycosylation N-liés Asn120 dans le domaine catalytique, mais également des sites de glycosylation N-liés dans le pro-domaine (Vandooren et al., 2013). Il a été rapporté que la glycosylation à Asn38 et à la galectine 8 augmente le traitement médié par MMP3, et que la glycosylation à Asn38 et à la galectine 3 réduit l'activation protéolytique de MMP9. Par conséquent, l'activité de MMP9 semble être influencée par la N-glycosylation (Boon et al., 2019). Duellman et al. (2015) ont démontré qu'en inhibant la glycosylation de MMP9 à Asn120, l'effet de l'interaction entre la calréticuline et la MMP9 peut être renforcé et son efficacité de sécrétion peut être réduite.

La MMP peut être régulée par la phosphorylation, et les sites de phosphorylation tels que Ser- et Thr- peuvent être identifiés en étudiant le domaine de la MMP (Ardito et al., 2017). Certains chercheurs ont découvert que la protéine kinase C joue un rôle régulateur dans la phosphorylation de la MMP-2 (Sariahmetoglu et al., 2007). Yu et al. (2000) ont confirmé que, en tant que membre de la famille GAG, l'héparane sulfate peut médier la relation entre la surface cellulaire et les MMP vertébrées sécrétées, et que cette relation de médiation est spécifique, étant donné qu'un excès d'héparine soluble extrait et solubilise MMP-2, MMP -13, MMP-7 et MMP-9. Des études antérieures ont montré que l'héparine, un héparane sulfate hautement sulfaté, en plus de l'héparane sulfate, affecte l'expression et les taux plasmatiques de MMP9, et augmente également l'affinité de TIMP3 pour MMP2, MMP7 et MMP9 (Mannello et al., 2008) . Par conséquent, les PTM peuvent être considérés comme modifiant plusieurs sites de MMP, affectant ainsi leur activité à des degrés divers, et ce processus pourrait affecter la régénération après une SCI.

Choi et al. (2007) ont signalé qu'il existe de nombreuses protéines d'adhésion dans la matrice extracellulaire, dont l'ostéopontine, qui est une cytokine soluble formée par la microglie et les astrocytes. L'ostéopontine peut être modifiée de plusieurs manières, comme par sulfatation et glycosylation, et peut se lier à différentes intégrines via le récepteur CD44 pour permettre aux organismes d'accomplir différentes fonctions physiologiques (Sodek et al., 2000). Gliem et al. (2015) ont découvert que l'ostéopontine est impliquée dans une variété de fonctions physiologiques in vitro, grâce auquel il pourrait prévenir les dommages au système nerveux et l'œdème cérébral. De même, Plantman (2012) a rapporté que la matrice d'ostéopontine peut favoriser la croissance des axones in vitro.

Les cicatrices fibrotiques, qui apparaissent après la SCI, sont formées de fibronectine et de laminine, avec un dépôt accru dans le noyau de la lésion et un dépôt réduit dans la zone pénombre des astrocytes (Orr et al., 2018). La membrane basale est l'une des structures les plus importantes de la cicatrice, tandis que le noyau des membranes basales est constitué d'un réseau dense de collagène IV qui forme une grande structure supramoléculaire. Cette structure centrale crée un échafaudage stable auquel les protéines associées et les cellules adhérentes peuvent se lier (Sanderson et al., 2019). Après la traduction, la cellule traduit et modifie le collagène IV nouvellement synthétisé par des processus tels que la glycosylation et l'hydroxylation (Hennet, 2019). Selon des recherches antérieures, la synthèse du collagène est inhibée par le collagène IV, empêchant ainsi le corps de former une membrane basale. De cette manière, la régénération des axones du système nerveux blessés peut être favorisée (Stichel et al., 1999).

Deux protéines oligomères multidomaines anti-adhésion, la ténascine-C et la ténascine-R, sont produites dans le SNC. Ces protéines participent à diverses activités physiologiques, telles que la réaction entre les facteurs de croissance et les cellules, l'adhésion des cellules et la migration des neurones (Giblin et al., 2015). La ténascine-C peut subir une glycosylation via ses multiples sites de glycosylation, ce qui s'est avéré augmenter la capacité de prolifération des cellules souches neuronales de souris (Yagi et al., 2010). De plus, la ténascine-C peut également avoir une capacité de liaison plus forte par modification. Giblin et al. (2015) ont suggéré que cela est dû au clivage protéolytique. Le développement du corps régule la glycosylation du TN-R et affecte sa motilité et sa migration (Woodworth et al., 2004). Il a été rapporté que le TN-R peut être lié au PTM en soumettant le TN-R à un certain rapport pondéral de sulfatation (Zamze et al., 1999).

On estime que 80 % des patients atteints de LME présentent une douleur évidente qui ressemble à un choc électrique ou à une brûlure (Mehta et al., 2019). La douleur post-LME a un impact plus grave sur la vie quotidienne des patients que la dyskinésie, et peut sérieusement réduire la qualité de vie (Finnerup et al., 2001). Des mécanismes complexes sous-tendent la douleur neuropathique, et certains chercheurs ont affirmé que la SCI provoque une perte de circuits inhibiteurs dans la corne dorsale de la partie endommagée, de sorte qu'une signalisation nociceptive hyperactive se développe et conduit en outre à une sensibilité accrue à la douleur (hyperalgésie) et à une hypersensibilité mécanique ( allodynie) (Meisner et al., 2010). Certains chercheurs ont également avancé l'hypothèse d'une plasticité inadaptée du système nerveux central, qui affirme que la plasticité inadaptée est la principale cause de douleur neuropathique dans la SCI. D'autres chercheurs pensent que la phosphorylation d'ERK médiée par les récepteurs D1/5 est diminuée après la SCI et que les récepteurs de la dopamine D1 sont perdus dans la matière grise entourant l'aqueduc (Voulalas et al., 2017).

Garcia-Larrea et al. (2013) ont rapporté que les personnes souffrant de douleur neuropathique présentent souvent une activation excessive du cortex insulaire. La transmission synaptique excitatrice du cortex insulaire est affectée par le récepteur de l'acide α-amino-3-hydroxy-5-méthyl-4-isoxazolepropionique (AMPAR). La fonction AMPAR du cortex insulaire est souvent hyperactive chez les personnes souffrant de douleur neuropathique (Koga et al., 2012). Qiu et al. (2014) ont rapporté que l'abondance de GluA1 synaptique, qui est la sous-unité d'AMPAR, est augmentée après SCI, et la phosphorylation de GluA1 à Slu845 est nécessaire pour améliorer les AMPAR synaptiques. Par conséquent, il est clair que la phosphorylation de GluA1 a un impact important sur la douleur neuropathique dans le cortex insulaire. Il existe également une relation étroite entre le développement de la douleur neuropathique et le niveau de récepteurs N-méthyl-D-aspartate (NMDA) (NMDAR) dans le cortex insulaire. La sous-unité GluN2B des NMDAR est impliquée dans des processus physiopathologiques tels que la perception de la douleur et les lésions ischémiques, et est une protéine tyrosine-phosphorylée majeure des protéines de densité postsynaptique du cerveau. Il a été rapporté que le niveau de phosphorylation de la sous-unité GluN2B dans la corne dorsale superficielle de la moelle épinière augmente significativement 7 jours après la SCI, et que la Fyn kinase peut médier cette phosphorylation (Abe et al., 2005). Certains chercheurs ont utilisé la technologie d'inactivation génétique pour éliminer Y1472 chez la souris et le remplacer par Tyr1472, réduisant ainsi le GluN2B au site de phosphorylation de Y1472 dans le corps. Dans ce modèle, la douleur des souris knock-out était significativement inférieure à celle des souris sans knock-out (Nakazawa et al., 2006 Katano et al., 2011). Pour conclure, la phosphorylation des sous-unités AMPAR et NMDARs semble jouer un rôle important dans la douleur neuropathique.

Il a été démontré que la diaphonie entre la glie et les neurones est associée à plusieurs processus de développement du SNC, tels que la neurogenèse, la myélinisation, la formation de synapses, la migration neuronale, la prolifération et la différenciation, et la signalisation neuronale (Gomes et al., 2001). Par exemple, les cellules gliales qui sont activées après une SCI sécrètent des cytokines pro-inflammatoires, des neurotransmetteurs, des ROS/RNS et de l'ATP, qui induisent ensuite la phosphorylation de CREB et ERK. Ce PTM module l'hyperactivité neuronale sensorielle et la douleur neuropathique centrale après SCI (Crown et al., 2006).

Pendant des siècles, des efforts continus ont été déployés pour déterminer la stratégie de traitement optimale de la LM, même si une déficience fonctionnelle est inévitable. Le pronostic varie en fonction des différents niveaux de lésion, et une régénération axonale réussie dans deux ou plusieurs niveaux de la colonne vertébrale pourrait faire une grande différence pour les patients présentant une lésion C6/7 dans la moelle cervicale, car cela pourrait aider à retrouver un certain contrôle du diaphragme et certains degré de contrôle de la main et des doigts. Dans le rachis cervical, la hauteur de chaque segment rachidien est de 1 cm, il est donc difficile pour la régénération nerveuse de dépasser 2 cm. Les obstacles les plus évidents à la régénération sont la perte de la capacité intrinsèque de régénération des axones et l'environnement extrinsèque hostile.

Pour surmonter ces difficultés, les chercheurs ont étudié l'efficacité des interventions pharmacologiques dans la SCI. Dans la pratique clinique, le personnel médical utilise souvent de la méthylprednisolone, qui peut maintenir la barrière hémato-moelle épinière et supprimer l'inflammation (Chio et al., 2020). Des recherches connexes ont également démontré que la méthylprednisolone peut parfois provoquer des effets indésirables graves tels qu'une pneumonie et des saignements gastro-intestinaux, pouvant entraîner la mort dans les cas graves (Ko, 2019). Alors que de nombreuses études cliniques sur la naloxone, l'hormone de libération de la thyrotropine et le monosialotetrahexo sylganglioside ont été menées (Badhiwala et al., 2018), aucune amélioration significative n'a été trouvée. D'autres stratégies expérimentales ont également été bien étudiées, telles que le blocage de la formation de cicatrices gliales (Rhodes et al., 2004), le pontage des kystes et des cicatrices, l'élimination sélective des astrocytes réactifs (Vismara et al., 2019), la modification des inhibiteurs de croissance. molécules (Fournier et al., 2001) et remplacement cellulaire (cellules de Schwann, cellules souches embryonnaires, cellules souches pluripotentes, cellules souches mésenchymateuses et cellules olfactives (Zhao et al., 2016 Zavvarian et al., 2020), thérapies géniques (Uchida et al., 2014), et les interventions thérapeutiques combinées (Griffin et al., 2020). Le manque de résultats prometteurs pourrait être attribué à la complexité des mécanismes physiopathologiques sous-jacents à la SCI. Par conséquent, selon la pharmacologie physiologique cible de différents méthodes, combinant différents médicaments pourraient aider à protéger les nerfs des patients atteints de SCI. Chen et al. (2007) ont révélé que la déphosphorylation des sous-unités des AMPAR et des NMDAR atténue de manière significative la douleur neuropathique chez la souris, ce qui dans indique qu'un seul ciblage de la phosphorylation peut produire un effet combinatoire.

Depuis plus de 20 ans, la chondroïtinase ABC réduit l'inhibition du CSPG dans les modèles expérimentaux de SCI, et cette méthode est basée sur notre connaissance de l'effet inhibiteur du CSPG sur la croissance axonale après SCI (Zuo et al., 1998). Cependant, les CSPG sont également importants pour l'orientation et l'orientation des axones (Schwartz et al., 2018). De plus, la majorité des recherches animales sur cet effet thérapeutique ont été réalisées sur une fenêtre de temps relativement courte, de quelques jours à quelques semaines, et les investigations à long terme font encore défaut. Jusqu'à présent, le potentiel clinique de la chondroïtinase ABC n'est pas encore clair. En effet, l'administration de chondroïtinase ABC dans les LME aiguës conduit à une digestion CSPG radicale et irréversible, et les effets à long terme chez l'homme n'ont pas été élucidés. Cependant, cela pourrait être intéressant si nous pouvons supprimer l'effet du CSPG sur la croissance axonale uniquement et contrôler cet effet de manière réversible. Fait intéressant, selon les travaux discutés dans cette revue, la tubuline acétyltransférase-1 (αTAT1 acétylation) médie l'effet inhibiteur du CSPG sur la croissance des microtubules axonaux. Cette modification acétylante est réversible et a des effets secondaires minimes, ce qui fait de ce PTM un meilleur choix que l'ablation du CSPG. En d'autres termes, la suppression réversible de l'effet spécifique d'une molécule peut être préférable à la suppression de la molécule.

Comme mentionné ci-dessus, les PTM et leur rôle dans la SCI sont très dynamiques. De plus, la fonction d'un PTM spécifique sur une seule protéine est différente à différents moments et dans différents environnements. Par exemple, un PTM donné peut être bénéfique lors d'une blessure primaire après une SCI, mais peut être préjudiciable lorsqu'il s'agit de la deuxième étape. Ainsi, les PTM thérapeutiques doivent être régulables. Normalement, le processus de transcription, d'édition d'ARN et de traduction est irréversible. La structure tertiaire d'une protéine ne peut être modifiée que par des fluctuations conformationnelles après le choix et l'épissage des exons. Il existe plusieurs PTM hautement régulables, dont beaucoup impliquent des processus réversibles, alors que l'état de phosphorylation (non phosphorylé ou phosphorylé) d'une molécule est réversible. Cela met en évidence les PTM comme cibles thérapeutiques idéales selon les exigences thérapeutiques spatio-temporelles de la SCI. Un autre avantage du ciblage des PTM est que les effets sont relativement instantanés, car les changements associés aux PTM dans les résidus d'acides aminés transforment instantanément l'activité des protéines, les emplacements cellulaires et les interactions dynamiques avec d'autres protéines. Cet effet opportun est favorable étant donné la détérioration rapide et les processus pathologiques changeants de la LME.

Outre les applications thérapeutiques, les PTM pourraient également être utilisées comme biomarqueur pour la SCI. Caprelli et al. (2019) ont rapporté que le tau hyperphosphorylé et clivé pourrait être des biomarqueurs sensibles des lésions du système nerveux central qui pourraient fournir une évaluation cohérente et fiable de la présence et de la gravité des lésions et du pronostic de récupération.

Malgré les avantages de la thérapie ciblant la PTM dans les LME, ses limites doivent également être notées. Premièrement, les cibles des nombreux PTM sont variées, ce qui rend difficile le ciblage pharmacologique de ces PTM. Deuxièmement, les fonctions PTM diffèrent selon les moments après SCI, et il est difficile de confirmer le moment optimal auquel cibler les PTM. Enfin, l'échec de la régénération neuronale après une SCI peut être attribué à plusieurs facteurs, et un PTM spécifique qui module uniquement la capacité de régénération intrinsèque ou la formation de cicatrice moléculaire ou gliale inhibitrice peut ne pas être suffisant pour assurer une récupération significative.

Pour la plupart des patients atteints de LME, une guérison complète est peu probable et difficile à obtenir. Les stratégies thérapeutiques devraient se concentrer sur la récupération fonctionnelle étape par étape et sur l'amélioration de la qualité de vie, et les investigations sur la thérapie PTM devraient donner la priorité au contrôle de la douleur neuropathique par rapport à la restauration motrice ou sensorielle. Des travaux encourageants ont révélé un rôle des PTM dans le soulagement de la douleur neuropathique. De plus, les facteurs qui entravent la régénération axonale sont variés, et une combinaison de PTM ciblant plusieurs facteurs devrait donc être étudiée. De plus, d'autres stratégies thérapeutiques, telles que la transplantation cellulaire et la thérapie génique, peuvent augmenter de manière significative l'effet de la modulation induite par la PTM.

Contributions d'auteur: Collecte de fonds, conception et rédaction du manuscrit : SZ, LJL, QC collecte des données : BSY, SJL, GT analyse des données : JYT, GFW, LL, GLC. Tous les auteurs ont approuvé la version finale de l'article.

Les conflits d'intérêts: Les auteurs déclarent ne pas avoir d'intérêts concurrents.

Aide financière: Ce travail a été soutenu par la Fondation nationale des sciences naturelles de Chine, n° 81801210 (à SZ).

Contrat de licence de droit d'auteur : L'accord de licence de droit d'auteur a été signé par tous les auteurs avant la publication.

Vérification du plagiat : Vérifié deux fois par iThenticate.

Examen par les pairs : Examen externe par des pairs.

Les pairs évaluateurs ouverts : Lukas Grassner, Murnau Trauma Center, Allemagne Rodolfo Gabriel Gatto, Université de l'Illinois à Chicago, États-Unis Mitsuhiro Enomoto, Université médicale et dentaire de Tokyo, Japon.

Fichier supplémentaire : Ouvrir les rapports d'examen par les pairs 1, 2 et 3[Fichier supplémentaire 1].

Le financement: Ce travail a été soutenu par la Fondation nationale des sciences naturelles de Chine, n° 81801210 (à SZ).

Réviseurs P : Grassner L, Gatto RG, Enomoto M Rédacteurs C : Zhao M, Qiu Y Rédacteur T : Jia Y


Résumé

Les filaments intermédiaires (FI) sont des structures cytosquelettiques et nucléosquelettiques qui fournissent aux cellules une résilience mécanique et résistante au stress, contribuent aux fonctions biologiques subcellulaires et spécifiques aux tissus et facilitent la communication intracellulaire. Les FI, y compris les lamines nucléaires et celles du cytoplasme (kératines, vimentine, desmine, neurofilaments et protéine acide fibrillaire gliale, entre autres), sont régulées fonctionnellement par des modifications post-traductionnelles (PTM). Les avancées protéomiques mettent en évidence l'énorme complexité et le potentiel régulateur des PTM de protéines IF, qui incluent la phosphorylation, la glycosylation, la sumoylation, l'acétylation et la prénylation, avec de nouvelles modifications de plus en plus appréciées. Les études futures devront caractériser leurs mécanismes marche-arrêt, leur diaphonie et leur utilité en tant que biomarqueurs et cibles pour les maladies impliquant le cytosquelette IF.


Protéines riches en Hyp/Pro

Comme les EXT et les AGP, les H/PRP appartiennent à la superfamille HRGP et certaines d'entre elles sont des protéines chimériques. Comme mentionné ci-dessus, on sait peu de choses sur les O-glycosylation des H/PRPs et leurs interactions avec les polysaccharides. En ce qui concerne O-glycosylation, l'information n'est disponible que pour les H/PRP ayant X(Pro/Hyp)m ≥ 2X motifs. Ce type de domaine peut être associé à un domaine AGP N-terminal court, un étirement histidine (His) et un domaine PAC C-terminal (Proline-rich protein et AGP, contenant Cys) comme dans le A. thaliana AtAGP31 (Liu et Mehdy, 2007 Hijazi et al., 2012). A ce jour, douze de ces protéines ont été identifiées dans A. thaliana, Daucus carota, Gossypium hirsutum, Nicotiana alata, N. tabacum, Phaseolus vulgaris, Capsicum annuel et Pétunia hybrida (Hijazi et al., 2014).

Structure de la O-glycanes de H/PRP de type AtAGP31

O-les motifs d'acides aminés glycosylés du domaine H/PRP d'AtAGP31 ont été caractérisés par spectrométrie de masse : Lys(Ala/Ser)HypVal, Lys(Pro/Hyp)(Hyp/Pro)(Thr/Val), Thr(Pro/Hyp )(Hyp/Pro)Val, et Tyr(Pro/Hyp)(Hyp/Pro)Thr (Hijazi et al., 2012). Le monosaccharide lié à Hyp est un hexose qui est très probablement un Gal basé sur l'analyse du monosaccharide de la protéine purifiée (53,2% Gal, 39,5% Ara, 2,2% Xyl, 1,9% Fuc, 1,8% Glc, 1,3% Man, 0,3% GlcUA). Il est à noter que cette analyse globale comprend O-glycanes liés au domaine AGP d'AtAGP31 et N-glycanes liés à son domaine PAC. Les O-glycane lié au domaine H/PRP d'AtAGP31 n'est pas reconnu par le réactif β-D-glucosyl Yariv, mais il interagit avec la Peanut Agglutinin (PNA), une lectine ayant une forte affinité pour les résidus Gal (Hijazi et al ., 2012). Il a été appelé motif riche en Gal/Ara (Hijazi et al., 2012). Nicotiana alata NaPRP4 partage le même type de domaine H/PRP et un domaine PAC avec AtAGP31 (Sommer-Knudsen et al., 1996). Le monosaccharide prédominant de ce O-la glycoprotéine est Gal (83%) alors que Ara, GlcNac, Man, Xyl sont en quantités mineures (7, 4, 4, 1 % respectivement). L'analyse de liaison a montré la présence d'Ara terminalF (6 %), Gal terminalp (48%), 1,3-galp (4%), 1,6-galp (14%), 1,3,6 gallonsp (25%), 1,2-Hommep (1%) et Xylp (1%). Au total, H/PRP avec X(Pro/Hyp)m ≥ 2X motifs sont O-glycosylés avec des glycanes riches en Gal-Ara qui semble être légèrement différent des AG de type I, II et III précédemment décrits. Une caractérisation plus poussée, en particulier par RMN, sera nécessaire pour décrire complètement ces structures.

Interactions des H/PRP avec les polysaccharides

Les H/PRP sont supposés être réticulés dans les parois cellulaires, mais les preuves directes font encore défaut (Bradley et al., 1992 Brisson et al., 1994 Frueauf et al., 2000). On ne sait rien sur les rôles possibles de O-glycosylations. AtAGP31 a récemment été proposé pour être impliqué dans des réseaux d'interactions non covalentes (Hijazi et al., 2014). De manière cohérente et contrairement aux HRGP qui sont insolubilisés de manière covalente dans les parois cellulaires, AtAGP31 est facilement extrait des parois cellulaires des hypocotyles étiolés (Hijazi et al., 2012). Il convient de noter que le NaPRP4 n'est pas non plus insolubilisé dans les parois cellulaires (Sommer-Knudsen et al., 1996). AtAGP31 a été montré pour interagir in vitro avec RGI type I AG ramifie par son domaine PAC et avec l'acide polygalacturonique méthyl-estérifié, probablement par son étirement His. Des interactions protéine/protéine ont également été supposées pour AtAGP31, avec (i) une auto-reconnaissance entre son domaine PAC et son domaine H/PRP O-glycanes, et (ii) interaction avec les lectines de la paroi cellulaire. Il a été proposé que l'organisation multi-domaines AtAGP31 résulte en des échafaudages supramoléculaires complexes avec différents composants de la paroi cellulaire, contribuant ainsi au renforcement des parois cellulaires des organes à croissance rapide comme les hypocotyles étiolés. De tels réseaux non covalents n'ont pas été décrits auparavant pour les HRGP. Un comportement similaire peut exister pour les protéines partageant des caractéristiques avec AtAGP31 (Hijazi et al., 2014). Cependant, comme mentionné ci-dessus, à l'exception du NaPRP4 dont la glycosylation a été caractérisée (Sommer-Knudsen et al., 1996), ces protéines n'ont pas été décrites au niveau moléculaire et leurs interactions avec les polysaccharides de la paroi cellulaire n'ont pas été étudiées. TTS-1 et TTS-2 (transmission tissu-spécifique) de N. tabacum, et DcAGP1 de D. carota ont montré qu'ils présentaient une forme ellipsoïdale et s'auto-assemblaient en structures d'ordre supérieur en utilisant des techniques de microscopie (Baldwin et al., 2000, 2001 Wu et al., 2001). Fait intéressant, la déglycosylation du TTS perturbe sa capacité à s'agréger, suggérant une régulation de l'auto-association par son niveau de O-glycosylation (Wu et al., 1995). L'auto-assemblage en tête-à-queue grâce aux interactions entre les O-glycanes du domaine H/PRP et du domaine PAC peuvent être proposés pour des protéines comme TTS et DcAGP1, de manière similaire à AtAGP31.


Contenu

Addition par une enzyme in vivo Éditer

Groupes hydrophobes pour la localisation membranaire Modifier

    (un type d'acylation), attachement de myristate, un C14 acide saturé (un type d'acylation), fixation du palmitate, un C16 acide saturé ou prénylation, l'ajout d'un groupe isoprénoïde (par exemple le farnesol et le géranylgéraniol)

Cofacteurs pour une activité enzymatique améliorée Modifier

    (un type d'acylation), fixation d'un lipoate (C8) la fraction de groupe fonctionnel (FMN ou FAD) peut être liée de manière covalente par des liaisons thioéther avec des cystéines , l'ajout d'une fraction 4'-phosphopantéthéinyle de la coenzyme A, comme dans la biosynthèse d'acide gras, de polykétide, de peptide non ribosomique et de leucine formation de base de Schiff

Modifications des facteurs de traduction Modifier

    formation (sur une histidine trouvée dans eEF2) attachement (sur glutamate trouvé dans eEF1α) [8] formation (sur lysine conservée de eIF5A (eucaryote) et aIF5A (archée)) addition sur une lysine conservée du facteur d'élongation P (EFP) dans la plupart des bactéries. [9] EFP est un homologue de eIF5A (eucaryote) et aIF5A (archéen) (voir ci-dessus).

Groupes chimiques plus petits Modifier

    , par exemple. O-acylation (esters), N-acylation (amides), S-acylation (thioesters)
      , l'ajout d'un groupe acétyle, soit à l'extrémité N-terminale [10] de la protéine, soit au niveau des résidus lysine. [11]Voir aussi acétylation des histones. [12][13] L'inverse est appelé désacétylation.
      l'addition d'un groupe méthyle, généralement au niveau des résidus lysine ou arginine. L'inverse est appelé déméthylation.
      une addition
        , un ajout de médiation d'ARNt , une liaison covalente des résidus d'acide glutamique à l'extrémité N-terminale de la tubuline et d'autres protéines. [15] (Voir tubuline polyglutamylase), liaison covalente d'un à plus de 40 résidus glycine à la queue C-terminale de la tubuline
        , en plus de N-acétylglucosamine en résidus sérine ou thréonine dans une liaison β-glycosidique
      • polysialylation, addition d'acide polysialique, PSA, à NCAM
        , l'ajout d'un groupe phosphate, généralement à la sérine, la thréonine et la tyrosine (O-lié), ou histidine (N-lié) , l'ajout d'un fragment adénylyle, généralement à la tyrosine (O-liés), ou histidine et lysine (N-lié)
      • uridylylation, l'ajout d'un groupe uridylyle (c'est-à-dire l'uridine monophosphate, UMP), généralement à la tyrosine

      Ajouts non enzymatiques in vivo Éditer

        , l'ajout d'une molécule de sucre à une protéine sans l'action régulatrice d'une enzyme. l'ajout d'acide isocyanique à l'extrémité N-terminale d'une protéine ou à la chaîne latérale de Lys. [18] l'ajout de monoxyde de carbone à d'autres composés organiques/inorganiques.
      • formation spontanée de liaisons isopeptidiques, comme on le trouve dans de nombreuses protéines de surface de bactéries Gram-positives. [19]

      Ajouts non enzymatiques in vitro Éditer

        : fixation covalente d'un fragment biotine à l'aide d'un réactif de biotinylation, typiquement dans le but de marquer une protéine.
      • carbamylation : l'ajout d'acide isocyanique à l'extrémité N-terminale d'une protéine ou à la chaîne latérale des résidus Lys ou Cys, résultant généralement de l'exposition à des solutions d'urée. [20]
      • oxydation : ajout d'un ou plusieurs atomes d'oxygène à une chaîne latérale sensible, principalement des résidus Met, Trp, His ou Cys. Formation de ponts disulfure entre les résidus Cys. : fixation covalente du polyéthylène glycol (PEG) à l'aide d'un réactif de pégylation, typiquement à l'extrémité N-terminale ou aux chaînes latérales des résidus Lys. La pégylation est utilisée pour améliorer l'efficacité des produits pharmaceutiques protéiques.
      • ISGylation, la liaison covalente à la protéine ISG15 (Interferon-Stimulated Gene 15) [21] , la liaison covalente à la protéine SUMO (Small Ubiquitin-related MOdifier) ​​[22] , la liaison covalente à la protéine ubiquitine. , la liaison covalente à Nedd , la liaison covalente à la protéine de type ubiquitine procaryote
        , ou déimination, la conversion de l'arginine en citrulline[23] , la conversion de la glutamine en acide glutamique ou de l'asparagine en acide aspartique , la conversion en un alcène par bêta-élimination de la phosphothréonine et de la phosphosérine, ou la déshydratation de la thréonine et de la sérine[24]
        , la liaison covalente de deux acides aminés de cystéine , le clivage d'une protéine lors de la formation d'une liaison peptidique, via la cyclisation d'asparagine ou de résidus d'acides aminés d'acide aspartique
        • de sérine par la protéine-sérine épimérase
        • d'alanine dans la dermorphine, un peptide opioïde de grenouille
        • de méthionine dans la deltorphine, également un peptide opioïde de grenouille

        PTM courants par fréquence Modifier

        En 2011, les statistiques de chaque modification post-traductionnelle détectée expérimentalement et putativement ont été compilées à l'aide d'informations à l'échelle du protéome provenant de la base de données Swiss-Prot. [25] Les 10 modifications expérimentales les plus courantes étaient les suivantes : [26]

        La fréquence Modification
        58383 Phosphorylation
        6751 Acétylation
        5526 Glycosylation N-liée
        2844 Amidation
        1619 Hydroxylation
        1523 Méthylation
        1133 Glycosylation liée à l'O
        878 Ubiquitylation
        826 Acide pyrrolidone carboxylique
        504 sulfatation

        PTM courants par résidu Modifier

        Certaines modifications post-traductionnelles courantes de résidus d'acides aminés spécifiques sont présentées ci-dessous. Des modifications se produisent sur la chaîne latérale, sauf indication contraire.

        Acide aminé Abrév. Modification
        Alanine Ala N-acétylation (N-terminal)
        Arginine Arg déimination en citrulline, méthylation
        Asparagine Asn désamidation en Asp ou iso(Asp), glycosylation N-liée
        L'acide aspartique Aspic isomérisation en acide isoaspartique
        Cystéine Cys formation de ponts disulfures, oxydation en acide sulfénique, sulfinique ou sulfonique, palmitoylation, N-acétylation (N-terminal), S-nitrosylation
        Glutamine Gln cyclisation en acide pyroglutamique (extrémité N), désamidation en acide glutamique ou formation de liaison isopeptidique à une lysine par une transglutaminase
        Acide glutamique glu cyclisation en acide pyroglutamique (N-terminal), gamma-carboxylation
        Glycine Gly N-myristoylation (N-terminale), N-acétylation (N-terminale)
        Histidine Le sien Phosphorylation
        Isoleucine Ile
        Leucine Leu
        Lysine Lys acétylation, Ubiquitination, SUMOylation, méthylation, hydroxylation
        Méthionine Rencontré N-acétylation (N-terminal), ubiquitination N-liée, oxydation en sulfoxyde ou sulfone
        Phénylalanine Phe
        Proline Pro hydroxylation
        Sérine Ser Phosphorylation, O-glycosylation, N-acétylation (N-terminal)
        thréonine Thr Phosphorylation, O-glycosylation, N-acétylation (N-terminal)
        Tryptophane Trp mono- ou di-oxydation, formation de kynurénine, tryptophane tryptophylquinone
        Tyrosine Tyr sulfatation, phosphorylation
        Valine Val N-acétylation (N-terminal)

        Les séquences protéiques contiennent des motifs de séquence qui sont reconnus par des enzymes modificatrices, et qui peuvent être documentés ou prédits dans les bases de données PTM. Avec le grand nombre de modifications différentes découvertes, il est nécessaire de documenter ce type d'informations dans des bases de données. Les informations PTM peuvent être collectées par des moyens expérimentaux ou prédites à partir de données de haute qualité et organisées manuellement. De nombreuses bases de données ont été créées, souvent axées sur certains groupes taxonomiques (par exemple, les protéines humaines) ou d'autres caractéristiques.

        Liste des ressources Modifier

          [28] – Une base de données d'informations et d'outils complets pour l'étude de la modification post-traductionnelle des protéines de mammifères [29] – Une base de données de protéines et de modifications post-traductionnelles expérimentalement [29] – Une base de données pour différentes modifications et comprendre différentes protéines, leur classe et fonction/processus liés aux protéines causant des maladies [30] - Une base de données de modèles de consensus pour de nombreux types de PTM, y compris des sites (PIR) [31] - Une base de données pour acquérir une collection d'annotations et de structures pour les PTM. [27] - Une base de données qui montre différents PTM et des informations concernant leurs composants/structures chimiques et une fréquence pour le site modifié d'acides aminés contient des informations PTM bien qu'elles puissent être moins complètes que dans des bases de données plus spécialisées.

        Outils Modifier

        Liste des logiciels de visualisation des protéines et de leurs PTM

          [34] – introduire un ensemble de PTM communs dans les modèles de protéines [35] – Outil interactif pour voir le rôle des polymorphismes de nucléotides simples dans les PTM [36] – Base de données interactive pour visualiser les molécules
        • Clivage et formation de ponts disulfures lors de la production d'insuline
        • PTM des histones comme régulation de la transcription : contrôle de l'ARN polymérase par la structure de la chromatine
        • PTM de l'ARN polymérase II comme régulation de la transcription
        • Le clivage des chaînes polypeptidiques est crucial pour la spécificité de la lectine [37]

        Une caractéristique majeure de la dépendance est sa persistance. Le phénotype addictif peut durer toute la vie, avec des envies de drogue et des rechutes survenant même après des décennies d'abstinence. [38] Les modifications post-traductionnelles consistant en des altérations épigénétiques des queues de protéines histones dans des régions spécifiques du cerveau semblent être cruciales pour la base moléculaire des dépendances. [38] [39] [40] Une fois que des modifications épigénétiques post-traductionnelles particulières se produisent, elles semblent être des "cicatrices moléculaires" durables qui peuvent expliquer la persistance des dépendances. [38] [41]

        Les fumeurs de cigarettes (environ 21 % de la population américaine en 2013) [42] ) sont généralement dépendants de la nicotine. [43] Après 7 jours de traitement à la nicotine chez la souris, les modifications post-traductionnelles consistant en l'acétylation de l'histone H3 et de l'histone H4 ont augmenté au niveau du promoteur FosB dans le noyau accumbens du cerveau, provoquant une augmentation de 61 % de l'expression de FosB. [44] Cela augmente également l'expression de la variante d'épissage Delta FosB. Dans le noyau accumbens du cerveau, Delta FosB fonctionne comme un « commutateur moléculaire soutenu » et une « protéine de contrôle principale » dans le développement d'une dépendance. [45] [46] De même, après 15 jours de traitement à la nicotine chez le rat, la modification post-traductionnelle consistant en une acétylation 3 fois accrue de l'histone H4 se produit au niveau du promoteur du gène du récepteur de la dopamine D1 (DRD1) dans le cortex préfrontal ( PFC) des rats. Cela a provoqué une libération accrue de dopamine dans la région du cerveau liée à la récompense PFC, et une telle libération accrue de dopamine est reconnue comme un facteur important de dépendance. [47] [48]

        Environ 7% de la population américaine est accro à l'alcool. Chez les rats exposés à l'alcool jusqu'à 5 jours, il y a eu une augmentation de la modification post-traductionnelle de l'acétylation de l'histone 3 lysine 9, H3K9ac, dans le promoteur de la pronociceptine dans le complexe de l'amygdale cérébrale. Cette acétylation est un marqueur d'activation de la pronociceptine. Le système de récepteurs opioïdes nociceptine/nociceptine est impliqué dans les effets de renforcement ou de conditionnement de l'alcool. [49]

        La dépendance à la cocaïne touche environ 0,5% de la population américaine. L'administration répétée de cocaïne chez la souris induit des modifications post-traductionnelles, notamment une hyperacétylation de l'histone 3 (H3) ou de l'histone 4 (H4) au niveau de 1 696 gènes dans une région de récompense cérébrale [le noyau accumbens] et la désacétylation au niveau de 206 gènes. [50] [51] Au moins 45 gènes, montrés dans des études précédentes comme étant régulés positivement dans le noyau accumbens de souris après une exposition chronique à la cocaïne, se sont avérés être associés à une hyperacétylation post-traductionnelle de l'histone H3 ou de l'histone H4. Bon nombre de ces gènes individuels sont directement liés aux aspects de la dépendance associés à l'exposition à la cocaïne. [51] [52]

        En 2013, 22,7 millions de personnes âgées de 12 ans ou plus aux États-Unis avaient besoin d'un traitement pour un problème de consommation de drogues illicites ou d'alcool (8,6 % des personnes âgées de 12 ans ou plus). [42]


        Adresse actuelle : Adresse actuelle : Department of Chemistry, Indiana University, Bloomington, Indiana, USA.,

        Meaghan Morris et Giselle M Knudsen : Ces auteurs ont contribué à parts égales à ce travail.

        Affiliations

        Gladstone Institute of Neurological Disease, San Francisco, Californie, États-Unis

        Meaghan Morris, Sumihiro Maeda et Lennart Mucke

        Département de chimie biologique, biochimie, programme d'études supérieures en biologie cellulaire et moléculaire, École de médecine de l'Université Johns Hopkins, Baltimore, Maryland, États-Unis

        Département de chimie pharmaceutique, Installation de spectrométrie de masse, Université de Californie, San Francisco, Californie, États-Unis

        Giselle M Knudsen, Jonathan C Trinidad, Alexandra Ioanoviciu & Alma L Burlingame

        Département de neurologie, Université de Californie, San Francisco, Californie, États-Unis

        Sumihiro Maeda et Lennart Mucke

        Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

        Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

        Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

        Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

        Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

        Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

        Vous pouvez également rechercher cet auteur dans PubMed Google Scholar

        Contributions

        M.M. conçu et mené les expériences sur la souris, les analyses statistiques et rédigé le manuscrit. G.M.K. analysé et organisé les données cartographiques PTM, mené les expériences de spectrométrie de masse quantitative et rédigé le manuscrit. S.M. a effectué le fractionnement PSD et les transferts occidentaux, et a écrit le manuscrit. J.C.T. a aidé au développement de la méthode de spectrométrie de masse et a écrit le manuscrit. I.A. ont mené des expériences de cartographie PTM par spectrométrie de masse. A.L.B. et L.M. a supervisé le projet et a écrit le manuscrit.

        Auteur correspondant


        MATÉRIAUX ET MÉTHODES

        iPTMnet utilise un cadre bioinformatique intégratif (Figure 1) pour connecter des informations provenant de bases de données bioinformatiques disparates, de résultats d'exploration de texte et d'ontologies dans des réseaux PTM à des fins d'exploration et de découverte. Les principaux composants du système sont : (i) un système d'exploration de texte (voir 2.1) (ii) Des informations PTM provenant de bases de données organisées par des experts (voir 2.2) (iii) Une ontologie protéique pour la représentation des protéoformes au sein et entre les espèces (voir 2.3) et (iv) Base de connaissances iPTMnet et portail Web (voir 2.6). Dans l'ensemble, iPTMnet fournit des informations sur huit types importants de PTM - phosphorylation, ubiquitination, acétylation, méthylation, glycosylation, S-nitrosylation, sumoylation et myristoylation - chez l'homme et plusieurs organismes modèles.

        Composants du système iPTMnet. (1) Un système d'exploration de texte pour l'extraction de connaissances PTM à partir de la littérature scientifique (2) des informations PTM provenant de bases de données de haute qualité gérées manuellement (3) des ontologies pour la représentation des connaissances et (4) une base de connaissances iPTMnet avec des informations intégrées et un portail Web reliant les composants du système à prendre en charge les requêtes scientifiques interactives et la visualisation des données des PTM.

        Composants du système iPTMnet. (1) Un système d'exploration de texte pour l'extraction de connaissances PTM à partir de la littérature scientifique (2) des informations PTM provenant de bases de données de haute qualité gérées manuellement (3) des ontologies pour la représentation des connaissances et (4) une base de connaissances iPTMnet avec des informations intégrées et un portail Web reliant les composants du système à prendre en charge les requêtes scientifiques interactives et la visualisation des données des PTM.

        Exploration de texte à grande échelle d'informations PTM à partir de la littérature

        Nous avons mis en place un flux de travail automatisé pour le traitement à grande échelle de tous les résumés PubMed et des articles complets de l'ensemble PubMed Central Open Access (PMCOA) avec RLIMS-P et eFIP, qui ont déjà été évalués pour leurs performances et leur facilité d'utilisation dans les défis communautaires (21 – 24). Les résultats de text mining sont stockés dans une base de données locale et mis à jour mensuellement. Les informations stockées incluent à la fois des entités (par exemple, substrat, site et interaction) et des relations (par exemple, kinase-substrat-site et PPI) ainsi que les preuves correspondantes dans le texte (par exemple, des phrases, des identifiants de section et des identifiants PubMed (PMID)). Le texte annoté est balisé avec des termes clés pour l'attribution des preuves. Dans le cas du texte intégral, nous utilisons uniquement les informations extraites de la section des résultats pour augmenter la probabilité que les informations soient étayées par des preuves expérimentales dans l'article. Pour intégrer les résultats de text mining dans iPTMnet, nous utilisons PubTator (25) qui récupère les identifiants de gènes NCBI liés aux mentions de protéines/gènes.

        Informations PTM provenant de bases de données organisées

        iPTMnet intègre des informations PTM provenant de plusieurs ressources organisées par des experts couvrant à la fois des données à faible et à haut débit provenant d'une gamme d'organismes : (i) PhosphoSitePlus (PSP) : des informations PTM organisées par des experts, y compris la phosphorylation, l'ubiquitination, l'acétylation et la protéines de souris ( 6) (ii) Phospho.ELM : base de données organisée par des experts pour les sites de phosphorylation dans les protéines animales ( 11) (iii) PhosPhAt : sites de phosphorylation de protéines identifiés par spectrométrie de masse dans Arabidopsis thaliana (iv) PhosphoGrid : sites de phosphorylation de protéines in vivo vérifiés expérimentalement dans Saccharomyces cerevisiae ( 26) (v) PomBase : une base de données complète pour la levure de fission Schizosaccharomyces pombe, fournissant des annotations structurelles et fonctionnelles, la conservation de la littérature et l'accès à des ensembles de données à grande échelle (17) ) P3DB : données de phosphorylation de protéines de plusieurs plantes dérivées d'expériences à grande échelle et de la littérature (14) (viii) neXtProt : une base de connaissances sur les protéines humaines (16) avec des données de protéomique et de variation génétique, en particulier sur les kinases ix) HPRD : PTM et relations enzyme-substrat pour les protéines humaines ( 28) (x) Signor : une base de données des relations causales entre les entités biologiques, y compris les relations PTM-substrat enzymatique ( 29) et (xi) dbSNO : une base de données qui intègre la S-nitrosylation de la cystéine vérifiée expérimentalement sites de plusieurs espèces (30). Certaines de ces bases de données ne sélectionnent plus activement de nouveaux articles. En les incluant dans iPTMnet, nous pouvons préserver et diffuser leur précieuse contribution. Nous maintenons l'intégrité de ces données grâce à des contrôles de validité du site/séquence et à la surveillance des articles rétractés afin que nous puissions corriger ou supprimer des informations si nécessaire.

        Organisation des protéines et des protéoformes PTM à l'aide de PRO

        PRO constitue une partie cruciale de l'ensemble de données iPTMnet car il place les informations du site PTM dans le contexte des protéoformes, c'est-à-dire qu'il montre la combinaison des PTM qui ont été observées dans une protéine donnée. Cette caractéristique de représenter des combinaisons validées expérimentalement de PTM est unique. PRO utilise une représentation hiérarchique (famille → gène → séquence → modification) qui décrit les relations d'une protéine avec sa classe parente et ses isoformes et protéoformes enfants. La hiérarchie PRO relie également la protéoforme spécifique d'une protéine à travers les taxons lorsqu'une modification similaire de la protéine conservée est observée expérimentalement dans plusieurs organismes. De plus, PRO fournit de nombreuses relations enzyme-substrat PTM et PPI dépendantes de PTM organisées par des experts.

        Toutes les données PRO sont stockées dans une base de données distincte, dont seule une partie est consommée par iPTMnet. Les informations descriptives pour chaque entrée PRO telles que le nom, la définition et l'étiquette sont extraites directement de la base de données PRO. Les relations hiérarchiques PTM, PPI et PRO sont extraites et reformatées avant d'être importées dans iPTMnet, comme suit : ainsi que leurs types PTM correspondants (représentés par un identifiant PSI-MOD (31) ou UniCarbKB (9)) de la définition du terme. Les informations sur les enzymes PTM sont extraites de la ligne de commentaire PRO (ii) Les informations PPI dépendantes de la protéoforme sont extraites du fichier d'annotation PRO. Les annotations avec evidence_code 'IPI' (Inféré de l'interaction physique) ou sous la branche de 'liaison aux protéines' sont extraites avec le partenaire d'interaction documenté et iii) deux types de relations hiérarchiques sont extraits : is_a (relation parent-enfant) et intersection_of (généralement utilisé pour relier une protéoforme à l'organisme dans lequel elle se trouve).


        Existe-t-il des ressources en ligne contenant une liste des modifications post-traductionnelles et de leur poids moléculaire ? - La biologie

        Qu'est-ce que le PIRSF ?
        Le système de classification des protéines PIRSF est un réseau avec plusieurs niveaux de diversité de séquences, des superfamilles aux sous-familles, qui reflète la relation évolutive des protéines et des domaines de pleine longueur. La principale unité de classification PIRSF est la famille homéomorphe, dont les membres sont à la fois homologues (évolués à partir d'un ancêtre commun) et homéomorphes (partageant une similitude de séquence complète et une architecture de domaine commune). Les clusters de protéines générés automatiquement sont sélectionnés manuellement pour l'appartenance, l'architecture de domaine, l'annotation des caractéristiques des séquences et les fonctions biologiques et activités biochimiques spécifiques, lorsque cela est possible.

        Qu'en est-il du PIRSF pour moi ?
        PIRSF propose des familles de protéines organisées avec des règles pour la propagation et la normalisation des sites fonctionnels et des noms de protéines, améliorant ainsi la sensibilité de l'identification des protéines et de l'inférence fonctionnelle. La recherche de votre séquence de protéines dans la base de données PIRSF fournit une évaluation plus rapide et plus précise de sa fonction qu'une recherche BLAST dans une base de données de protéines non organisée. Il évite les écueils tels que de nombreuses annotations erronées, les meilleurs résultats basés sur un domaine secondaire à la fonction principale de la protéine, les faux résultats, etc.

        Base de données iProClass

        Qu'est-ce que iProClass ?
        iProClass fournit des descriptions sommaires de la famille, de la fonction et de la structure des protéines pour les séquences UniProt, avec des liens vers plus de 90 bases de données biologiques (voir les sources de données). iProClass comprend des rapports pour toutes les protéines UniProtKB et les protéines qui sont exclusivement dans la base de données UniParc.

        Recherche de texte iProClass
        Récupérez une liste de correspondance des rapports de synthèse par chaîne de texte ou identifiant unique (en sélectionnant un champ dans le menu déroulant). Cliquez sur le bouton "Rechercher" pour récupérer les résultats. Vous pouvez ouvrir des champs de saisie supplémentaires dans votre requête en cliquant sur "Ajouter un champ de saisie". Voir l'aide de la recherche de texte pour plus d'informations.

        Aide iProLINK

        • Bibliography Mapping : identification d'articles provenant de sources bibliographiques (telles que PubMed) qui décrivent une entrée de protéine donnée
        • Extraction d'annotations : catégorisation des types d'annotations et extraction de phrases et/ou de phrases décrivant l'annotation donnée et
        • Curation de la base de données : conversion des informations bibliographiques extraites en annotation dans la base de données avec une syntaxe structurée, un vocabulaire contrôlé et une attribution de preuves.

        Cartographie de la bibliographie
        Lier les entrées de protéines à la littérature scientifique pertinente qui décrit ou caractérise les protéines est crucial pour augmenter la quantité de données vérifiées expérimentalement et pour améliorer la qualité de l'annotation des protéines.
        Saisissez une chaîne de texte ou un identifiant unique pour récupérer la bibliographie liée à votre requête.
        Les résultats sont affichés dans un tableau similaire à la page de résultats iProClass, mais avec des colonnes spécifiques liées à la récupération de la bibliographie. Des liens vers la notice bibliographique ainsi que les entrées individuelles PubMed sont disponibles.
        Page de résultats du mappage de la bibliographie iProLINK pour UniProtKB P13866

        Attribution des preuves
        Dans la base de données PIR-PSD, les annotations de caractéristiques telles que les sites de liaison, les sites catalytiques et les sites modifiés sont étiquetées avec des balises d'état "expérimental" ou "prédit" pour distinguer les données vérifiées expérimentalement des données prédites par calcul. Pour attribuer de manière appropriée les données bibliographiques aux caractéristiques avec des preuves expérimentales, une étude rétrospective de la littérature a été menée, qui implique à la fois une cartographie des citations (trouver des citations de la section Référence qui décrivent la caractéristique expérimentale donnée) et le marquage des preuves (marquant les phrases fournissant des preuves expérimentales dans un résumé et/ou un article en texte intégral). Ceci est maintenant étendu aux protéines UniProtKB. Recherchez des protéines avec une attribution de caractéristique particulière telle que des modifications post-traductionnelles, ou entrez un identifiant UniProtKB pour récupérer attribution de fonctionnalité pour votre requête. Plus tard, vous pouvez obtenir une bibliographie organisée liée à l'entrée en cliquant sur « Bibliographie » ou toutes les preuves étiquetées disponibles en cliquant sur « Évidences étiquetées »

        Caractéristique Exemple
        Site actifser
        Site de liaisonhème
        Site de clivageargument
        Lien croisécys
        Liaisons disulfuretous
        Site modifiébloquer*
        Domaineséquence de signaux
        Produitdermorphine
        RégionLiaison ATP


        Page de résultats de la cartographie des fonctionnalités iProLINK pour le site de liaison hème

        Les RLIMS-P est un programme d'exploration de texte basé sur des règles spécialement conçu pour extraire des informations sur la phosphorylation des protéines sur les protéines kinases, les substrats et les sites de phosphorylation des résumés (Hu et al., 2005). La soumission des PMID en entrée renvoie un tableau récapitulatif pour tous les PMID avec des liens vers des rapports complets . Le tableau récapitulatif répertorie le PMID de chaque résumé lié à la phosphorylation ainsi que son résultat d'annotation de premier rang, suivi d'une liste des PMID restants pour les résumés ne contenant aucune information de phosphorylation. Les rapports complets peuvent être extraits du tableau récapitulatif à l'aide de liens hypertextes (à partir de « preuves textuelles ») ou en sélectionnant un ou plusieurs PMID dans la liste.

        Tableau récapitulatif des PMID 2108025, 16436437, 15193450

        Le rapport RLIMS-P complet contient cinq sections (voir tableau ci-dessous) : 1- Informations sur les citations PubMed (date de publication, auteurs, revue) 2- Cartographie PMID vers UniProtKB, comprenant l'accession, l'ID, le nom de la protéine, l'organisme et la famille de protéines de l'entrée mappée, avec des liens vers les rapports de protéines UniProtKB et iProClass (Wu et al., 2004) contenant de riches informations biologiques et fonctionnelles 3- Mappage des noms vers UniProtKB, y compris des options pour utiliser les noms apparaissant dans le résumé ou les noms spécifiés par l'utilisateur pour la recherche en ligne dans le BioThesaurus 4- Annotation avec une liste classée des résultats d'extraction RLIMS-P pour chaque ensemble des trois objets de phosphorylation et 5- Preuve textuelle montrant le résumé original et le titre, avec des objets extraits étiquetés dans différentes couleurs pour distinguer les protéines kinases, les protéines phosphorylées et les résidus/positions phosphorylés. Une option est fournie pour activer/désactiver le marquage de couleur pour chaque type d'objet dans le résumé pour une inspection visuelle.

        Rapport complet pour PMID 2108025

        Reconnaissance d'entités/développement d'ontologies
        La reconnaissance d'entités nommées de protéines (trouver les noms de protéines à partir de textes de la littérature) est une condition préalable à la cartographie bibliographique (identifier les articles décrivant des protéines spécifiées). Il est également fondamental pour plusieurs autres tâches d'exploration de la littérature biologique, y compris l'extraction d'annotations de protéines (telles que les interactions protéine-protéine) de la littérature.

        -Biothésaurus
        BioThesaurus est un système Web conçu pour mapper une collection complète de noms de protéines et de gènes aux entrées de protéines UniProtKB. Couvrant actuellement plus de deux millions de protéines, BioThesaurus se compose de plus de 2,6 millions de noms extraits de plusieurs ressources en ligne basées sur des références croisées de bases de données dans iProClass. Il permet la récupération de noms synonymes d'entrées de protéines données et l'identification de noms ambigus partagés par plusieurs protéines.
        Vous pouvez effectuer une recherche en tapant un nom de gène/protéine, ou alternativement, en utilisant un identifiant.

        Rapport BioThesaurus pour UniProtKB P18688

        • Termes biomédicaux (bt) : ces termes sont utilisés dans un large éventail de sciences biologiques et médicales. Ils décrivent principalement les structures de toutes les formes de vie à différents niveaux (de la morphologie grossière à la structure moléculaire), ainsi que leurs fonctions et mécanismes respectifs dans les états normaux (physiologiques) et malades (pathologiques).
        • Termes chimiques (ct) : Ce sont des mots qui décrivent des matériaux chimiques organiques ou inorganiques, des groupes ou des liaisons chimiques, ou des propriétés chimiques.
        • Macromolécules (mc): Ces mots font référence à des biopolymères tels que des protéines, des peptides, de l'ADN, de l'ARN, des polysaccharides ou des glycoprotéines.
        • Anglais commun (ce) : Les mots anglais communs sont utilisés pour décrire divers aspects ou propriétés des protéines, tels que court, signal, en interaction, et réparation. Ceux-ci incluent également des formes épelées de lettres grecques, ainsi que des mots vides comme de, à, et à.
        • Jetons autres que des mots : ce sont des combinaisons de lettres, de chiffres ou de symboles. Ce sont souvent des acronymes, des synonymes ou des abréviations. La forme des jetons non-mot peut être uniquement un nombre, une seule lettre, plusieurs lettres ou des combinaisons de nombres, de lettres et d'autres symboles. Les jetons non-mots peuvent représenter des entités biochimiques telles que des acides nucléiques, des nucléotides et des acides aminés, qui peuvent être utilisés dans un nom de protéine.

        -Directives d'étiquetage des noms de protéines et corpus étiquetés par des noms
        D'autres ressources de données iProLINK pour la reconnaissance d'entités nommées sont deux ensembles de corpus de littérature qui ont été étiquetés manuellement avec des noms de protéines sur la base de deux versions de directives d'étiquetage. La directive 1.0 définit comment marquer les objets protéine, et non les entités nommées protéine, tandis que la directive 2.0 définit les règles de marquage pour les entités nommées protéine quel que soit le contexte de l'objet.

        -Ontologie protéique basée sur la classification de la famille PIRSF
        Les ontologies biologiques sont cruciales pour la gestion des connaissances biologiques, y compris l'extraction de données de la littérature pour extraire des informations pertinentes et intégrer des informations à partir de plusieurs bases de données. Une ontologie de protéines, constituée de noms et de synonymes de classes de protéines ainsi que de leurs relations, peut être utilisée pour aider à la reconnaissance d'entités nommées de protéines. En outre, une ontologie basée sur les relations familiales de protéines, telles que le système de classification PIRSF, peut être mappée et compléter l'ontologie génétique (GO). Nous avons développé une ontologie protéique basée sur les noms de famille hiérarchiques PIRSF. L'ontologie est au format de fichier plat GO avec une structure DAG (graphe acyclique dirigé) et peut être parcourue à l'aide d'outils d'application tels que DAG-Edit.

        Aide à la recherche de texte

        Sélectionnez une base de données
        Selon la voie par laquelle la page de recherche de texte a été consultée, vous devrez peut-être choisir entre la base de données iProClass, qui comprend UniProtKB et les protéines UniParc uniques, et la base de données PIRSF, qui comprend l'ensemble des familles PIRSF (c'est-à-dire tout niveau de conservation) . Cependant, la recherche de texte dans la page d'accueil et la zone de recherche rapide utilise la base de données iProClass.
        Le fichier de sortie affichera un tableau avec des entrées de protéines individuelles ou des familles de protéines, pour iProClass ou PIRSF, respectivement.

        Sélection d'un champ
        Les champs de recherche sont sélectionnés dans le menu déroulant. Les éléments varieront en fonction de la base de données sélectionnée, car chaque base de données contient différents types d'informations.

        Entrée de requête
        Entrez un identifiant unique ou une autre chaîne de recherche dans la case prévue.
        Certains éléments (tels que « Longueur » ou tout élément avec « ID ») seront des recherches de correspondance exacte. Les autres éléments seront des recherches de sous-chaînes (comme si elles étaient précédées et suivies de caractères génériques).
        Lorsque l'option de champ est présente, saisir "non nul" dans la zone de texte entraînera la recherche à renvoyer uniquement les entrées qui ont des données dans le champ sélectionné, tandis que saisir "null" ne renverra que celles qui manquent de données dans le champ sélectionné .
        Pour la recherche de peptides, saisissez une chaîne de résidus d'acides aminés en code à une seule lettre (au moins trois lettres), puis appuyez sur la flèche pour récupérer les résultats.

        Bouton Ajouter une zone de saisie
        Si vous le souhaitez, plusieurs champs peuvent être recherchés simultanément. L'appui sur le bouton « + » ajoute une autre ligne de requête, jusqu'à un maximum de 8 lignes. Les zones de saisie ajoutées sont connectées par des choix d'opérateur logiques (voir ci-dessous), la valeur par défaut étant l'opérateur Ajouter.

        Utilisation des opérateurs logiques AND, OR, NOT
        La recherche prend en charge les opérateurs logiques « ET », « OU » et « NON ». Par exemple, pour récupérer des résultats qui incluent les domaines Pfam A ou B, tapez A dans votre premier champ de requête et ajoutez une ligne de requête en cliquant sur le bouton "Ajouter une zone de saisie". Saisissez votre 2ème requête (B) et sélectionnez l'opérateur OU. De même, pour récupérer des protéines multi-domaines qui ont à la fois les domaines Pfam A et B, utilisez l'opérateur « ET ». Les protéines qui ont le domaine A et non le domaine B peuvent être récupérées à l'aide de l'opérateur « NOT ».

        Nombre de résultats
        Pour fournir le résultat le plus rapide, le nombre par défaut d'entrées affichées sur une page est de 50.

        Catégorisations de recherche et identifiants uniques
        Le tableau suivant indique les champs de recherche pour les fonctions de recherche Text et Batch Retrieval. Les champs de recherche peuvent être sélectionnés dans le menu déroulant. Vous pouvez effectuer des recherches dans les bases de données à l'aide d'identifiants uniques ou de mots-clés. Des exemples d'entrée sont présentés ci-dessous.

        CATÉGORIE PRINCIPALE SOUS-CATÉGORIE CHAMPS INCLUS EXEMPLES) i Classe Pro PIRSF
        SéquenceIdentifiants UniProtUniProtKB ID/ACIMDH2_HUMAIN/P12268
        UniRef100UniRef100_P12268
        UniParcUPI00004C7276
        ID de séquence PIRID/AC PIR-PSDA31997/I52303
        Autres ID de séquence
        Identifiant FlyBaseFBgn0002940
        GenBank ACJ04208
        GenPept ACAAH12840.1
        Numéro IG NCBI15277480
        ID IPIIPI00291510
        Identifiant MGI95561
        RefSeq ACNM_000875
        ID SGDS000001047
        ID TIGRSAG1156
        Nom du gène/protéineNom du gèneIMPDH2
        Nom de la protéineIMP déshydrogénase
        ClassificationIdentifiants de classe
        ID BLOCSIPB000644
        ID COGCOG1009
        Identifiant/Nom PfamPF00478
        IMP déshydrogénase
        Identifiant PIRSF/NomPIRSF000130
        inosine-5'-monophosphate déshydrogénase
        ID IMPRIMÉSPR01434
        ID PROSITEPS00487
        Nom de la superfamille SCOPInosine monophosphate déshydrogénase
        Identifiant UniRef50UniRef50_P20839
        Identifiant UniRef90UniRef90_P12268
        PIRSFLongueur moyenne500 (acides aminés)
        Statut de conservationComplet
        Adhésion au PIRSFPIRSF000186:F
        Niveau PIRSFHFam
        Rép. Séq.P12268
        FonctionComplexe/InteractionsIdentifiant de liaison93185
        Ontologie des gènesID ALLER0003938
        Sentier Parcours/ID KEGGMétabolisme des purines
        hsa00230
        EnzymeNuméro/Nom CEEC 1.1.1.205/ Oxydoréductases
        CaractéristiqueID RESIDAA0005
        Tous les champs de fonctionnalitéL-cystéine
        OrganismeTaxonomieTaxon
        Groupe/ID de groupe
        Euk/Mammifère / 40674
        Identifiant du taxon9606
        Espèce/LignéeLignéeeucaryote
        Nom de l'organismeHomo sapiens
        Nom communHumain
        LittératureIdentifiant PubMedIdentifiant PubMed10097070
        Nom de l'auteurNom de l'auteurHubermann
        Nom de la revueNom de la revueBiochem Biophys Res Commun.
        Titre du papierTitre du papierClonage et séquence de l'IMP humain de type II
        Divers Structure 3DIdentifiant PDB1B3O
        BiensLongueur514 (acides aminés)
        Masse moléculaire55804 (Daltons)
        Mot-cléMot-cléNAD
        Variation génétique/maladieIdentifiant OMIM146691
        Génome Entrez l'identifiant du gène3615

        Aide sur les résultats de recherche de texte

        Cette section décrit la page Résultats de la recherche de texte pour iProClass et PIRSF. La mise en page globale de la page est similaire pour les deux, cependant, elle diffère dans les colonnes par défaut qui sont affichées, ainsi que les outils disponibles pour analyser les données. Les caractéristiques communes sont décrites en premier 1-3, où les chiffres indiquent l'endroit où vous trouverez ces fonctionnalités dans la page (voir les pages de résultats iProClass et PIRSF ci-dessous).

        2- Options d'affichage
        En fonction de vos besoins spécifiques, vous pouvez choisir les colonnes à afficher. Pour cela, cliquez sur le bouton "Option d'affichage", sélectionnez le(s) champ(s) concerné(s) dans la liste "Champs non affichés" et transférez-les dans la liste "Champs en affichage" via le " > ". A l'inverse, les colonnes peuvent être supprimées de l'affichage. Enfin, cliquez sur "appliquer" pour que les modifications prennent effet.

        3- Enregistrer les résultats sous
        La sortie peut être enregistrée sur l'ordinateur local de l'utilisateur. Les résultats seront enregistrés pour les entrées sélectionnées ou, si aucune protéine n'est sélectionnée, pour toutes les entrées. Cliquer sur « Tableau » enregistrera les colonnes affichées sous forme de fichier texte délimité par des tabulations, qui peut être importé dans une feuille de calcul pour une visualisation ou une analyse plus facile. Cliquer sur "FASTA" enregistrera les identifiants et les séquences au format FASTA.

        5- Affichage des résultats
        Les résultats de la recherche sont affichés dans un tableau personnalisable. Les colonnes exactes affichées dépendront des champs recherchés et des préférences de l'utilisateur.

        Protéine AC/ID
        La protéine AC/ID fait référence aux identifiants UniProtKB ou UniParc. En dessous de ces chiffres, vous pouvez choisir la vue iProClass ou UniProtKB/UniParc du rapport sur les protéines. La source de la séquence UniProtKB est indiquée comme UniProtKB/Swiss-Prot ou UniProtKB/TrEMBL si la séquence protéique provient respectivement de la section Swiss-Prot ou TrEMBL. Alternativement, l'ID UniParc sera affiché si la séquence n'est pas présente dans la base de données UniProtKB avec le rapport UniParc.

        Nom de la protéine
        Nom commun donné à une protéine, qui identifie sa fonction ou spécifie ses caractéristiques.

        Longueur
        Nombre de résidus d'acides aminés dans le peptide ou la protéine.

        Nom de l'organisme
        Le genre et l'espèce de l'organisme source d'où provient la séquence. Des liens vers les informations de taxonomie du NCBI sont fournis.

        Identifiant PIRSF
        Si une protéine appartient à une famille PIRSF, alors cette colonne affichera l'identifiant de famille correspondant. Cliquez sur l'ID pour récupérer le rapport PIRSF (voir sortie annotée).

        Séq.
        Cette colonne indique le nombre de hits BLAST précalculés obtenus à l'aide des paramètres par défaut. Seules 300 séquences maximum seront affichées. En cliquant sur le numéro, vous accédez à la page de séquence associée. Cela permet d'avoir un aperçu de la similarité des séquences de manière très rapide. Le nombre lui-même fournit déjà des informations sur le caractère unique de la protéine. Par exemple, un nombre très faible peut vous indiquer que la requête est spécifique à une certaine espèce, genre, taxon, etc. Le signe " + " à côté du titre de la séquence liée permet de comparer le nombre de séquences liées à 3 valeurs E différentes coupures comme indiqué ci-dessous.

        Champs correspondants
        Le ou les champs auxquels correspond la requête.

        6- GO Slim
        Les GO slims sont des versions plus petites des ontologies génétiques contenant un sous-ensemble des termes de l'ensemble GO. Ils donnent un large aperçu du contenu de l'ontologie sans le détail des termes spécifiques à grain fin. Les GO slims sont particulièrement utiles pour donner un résumé des résultats de l'annotation GO d'un génome ou d'un protéome lorsqu'une classification large de la fonction du produit génique est requise.

        Vous pouvez afficher les termes GO slim pour la fonction biologique, le composant et le processus en sélectionnant le bouton « Afficher GO Slim » dans la barre d'outils d'analyse. UNE. Vous pouvez ensuite afficher les statistiques des ontologies individuelles (Fonction, Composant et Fonction) en vérifiant les entrées d'intérêt et en sélectionnant l'ontologie à afficher (par exemple, la fonction dans cet exemple, UNE). Suivez les liens GO ID pour en savoir plus sur le terme GO. De plus, vous pouvez afficher les termes dans l'ontologie en sélectionnant l'icône de vue hiérarchique graphique GO (B). L'affichage graphique montrera la hiérarchie GO par rapport aux termes indiqués dans le tableau C). Les termes qui correspondent à une protéine donnée sont affichés en couleur, le nombre entre parenthèses indique le nombre de protéines dans l'ensemble sélectionné qui sont annotées avec le terme donné. En cliquant sur le numéro, vous récupérerez les entrées de protéines correspondantes. Une option pour afficher le graphique au format svg est fournie. Ce format permet de redimensionner l'image.

        Si plus d'un PIRSF est sélectionné, un message contextuel indiquera que les séquences représentatives de chaque famille seront utilisées pour l'alignement.

        5- Affichage des résultats
        Les résultats de la recherche sont affichés dans un tableau personnalisable. Les colonnes exactes affichées dépendront des champs recherchés et des préférences de l'utilisateur.

        Identifiant PIRSF
        Cette colonne affichera l'identifiant de la famille correspondante. Cliquez sur l'ID pour récupérer le rapport PIRSF. L'icône sous l'ID PIRSF indique le niveau de la famille, à savoir la famille homéomorphe ( H Fam), la sous-famille ( Sub Fam) et la superfamille ( Super Fam). Cliquez sur cette icône pour afficher la vue DAG de la hiérarchie PIRSF avec le domaine PFam au niveau supérieur.

        Nom du PIRSF
        Le nom PIRSF est significatif pour les familles entièrement organisées car ces noms ont été analysés par un conservateur. Le nom PIRSF vise à décrire une caractéristique ou une fonction commune des membres de la famille. Dans la mesure du possible, les noms PIRSF sont basés sur la littérature et essaient de suivre toutes les normes publiées. Dans la plupart des cas, les noms ont une étiquette de preuve ou un statut de nom attaché entre parenthèses, ce qui fournit le niveau de confiance sur le nom attribué. Les étiquettes d'état de nom PIRSF possibles sont : validées (il existe des données expérimentales soutenant le nom PIRSF), provisoires (il n'y a aucune preuve expérimentale concluante) ou prédites (prédites par des méthodes informatiques).

        Num. de la Séq.
        Nombre de séquences dans la famille.

        Longueur moy.
        C'est la longueur moyenne des protéines des membres du PIRSF.

        Architecture de domaine
        Il représente les informations organisées concernant les domaines Pfam présents dans la famille des protéines. Les domaines Pfam sont répertoriés dans l'ordre de l'extrémité N à l'extrémité C, séparés par des points-virgules. Dans quelques cas, les domaines sont séparés par un tiret indiquant la présence de domaines insérés. Les nombres entre parenthèses indiquent la répétition d'un domaine. Il existe une syntaxe particulière pour cette fonctionnalité. Par exemple, PF11111(1-3) autorise 1 à 3 copies de PF11111, tandis que PF11111(2-) autorise un nombre quelconque de domaines au-dessus de 1 (2 ou plus). Cependant, PF11111(0,2) autorise aucune ou deux copies de ce domaine.

        Statut de conservation
        Non organisé : clusters de protéines générés par ordinateur, non organisés.
        Préliminaire : Composition et architecture de domaine des familles de protéines déterminées par curation manuelle.
        Complet : nom de famille protéique avec références (lorsqu'elles sont disponibles) et parfois de brèves descriptions, fournies après une sélection manuelle approfondie.

        Champs correspondants
        Le ou les champs auxquels correspond la requête.

        Aide à la récupération par lots

        Récupérez plusieurs entrées en sélectionnant un identifiant spécifique ou une combinaison d'identifiants.

        Sélectionnez la base de données
        Avant de saisir les identifiants de protéines, vous devez sélectionner la base de données la plus pratique. Si vous souhaitez récupérer des informations sur les familles de protéines, sélectionnez la base de données PIRSF, mais si vous souhaitez analyser des protéines individuelles, sélectionnez la base de données iProClass.

        Règles de saisie des identifiants
        Les ID d'entrées multiples doivent être séparés par des lignes ou des espaces.
        Les identifiants peuvent être spécifiés en tant que catégorie unique ou en tant que catégories mixtes. Cependant, si vos entrées ont le même type d'ID, il est recommandé de définir le champ ID pour accélérer le processus de récupération.


        Vous pouvez analyser et enregistrer davantage les résultats récupérés et/ou leurs séquences respectives de la même manière que vous le feriez après une recherche de texte. Cliquez sur "Afficher la liste des correspondances" pour vérifier la correspondance entre vos identifiants d'entrée et ceux de la base de données sélectionnée.

        Sortie de récupération par lots dans la base de données iProClass

        Récupération des séquences avec les numéros GI 1169968, 1707983 et 304131

        1- Boîte de récupération
        Cette boîte affiche votre ID de requête et vous permet également d'effectuer une nouvelle récupération.

        2- Options d'affichage
        En fonction de vos besoins spécifiques, vous pouvez choisir les colonnes à afficher. Pour cela, cliquez sur le bouton "Option d'affichage", sélectionnez le(s) champ(s) concerné(s) dans la liste "Champs non affichés" et transférez-les dans la liste "Champs en affichage" via le " > ". A l'inverse, les colonnes peuvent être supprimées de l'affichage. Enfin, cliquez sur "appliquer" pour que les modifications prennent effet.

        3- Enregistrer les résultats sous
        La sortie peut être enregistrée sur l'ordinateur local de l'utilisateur. Les résultats seront enregistrés pour les entrées sélectionnées ou, si aucune protéine n'est sélectionnée, pour toutes les entrées. Cliquer sur « Tableau » enregistrera les colonnes affichées sous forme de fichier texte délimité par des tabulations, qui peut être importé dans une feuille de calcul pour une visualisation ou une analyse plus facile. Cliquer sur "FASTA" enregistrera les identifiants et les séquences au format FASTA.

        5- Affichage des résultats
        Les résultats de la recherche sont affichés dans un tableau.

        Protéine AC/ID
        La protéine AC/ID fait référence au numéro d'accession et à l'identifiant UniProtKB, respectivement. En dessous de ceux-ci, vous pouvez choisir la vue iProClass ou UniProtKB/UniParc de chaque rapport sur les protéines.La source de la séquence UniProtKB est indiquée comme UniProtKB/SP ou UniProtKB/Tr si la séquence protéique provient respectivement de Swiss-Prot ou TrEMBL.

        Nom de la protéine
        Nom commun donné à une protéine, qui identifie sa fonction ou spécifie ses caractéristiques.

        Longueur
        Nombre de résidus d'acides aminés dans le peptide ou la protéine.

        Nom de l'organisme
        Le genre et l'espèce de l'organisme source d'où provient la séquence. Des liens vers les informations de taxonomie du NCBI sont fournis.

        Identifiant PIRSF
        Si une protéine appartient à une famille PIRSF, alors cette colonne affichera l'identifiant de famille correspondant. Cliquez sur l'ID pour récupérer le rapport PIRSF.

        Portée de correspondance
        Cette colonne affiche en rouge la requête peptidique dans la séquence.

        6- GO Slim
        Les GO slims sont des versions plus petites des ontologies génétiques contenant un sous-ensemble des termes de l'ensemble GO. Ils donnent un large aperçu du contenu de l'ontologie sans le détail des termes spécifiques à grain fin. Les GO slims sont particulièrement utiles pour donner un résumé des résultats de l'annotation GO d'un génome ou d'un protéome lorsqu'une classification large de la fonction du produit génique est requise.

        Vous pouvez afficher les termes GO slim pour la fonction biologique, le composant et le processus en sélectionnant le bouton « Afficher GO Slim » dans la barre d'outils d'analyse. Vous pouvez ensuite afficher les statistiques des ontologies individuelles (Fonction, Composant et Fonction) en vérifiant les entrées d'intérêt et en sélectionnant l'ontologie à afficher (par exemple, la fonction dans cet exemple). Suivez les liens GO ID pour en savoir plus sur le terme GO.

        7- Afficher la liste des matchs
        Affiche une table mappant vos ID de requête avec les ID UniProtKB/UniParc.

        Sortie de récupération par lots dans la base de données PIRSF

        Récupération des PIRSF en utilisant comme requêtes les AC UniProtKB P51375, P09831 et Q05755

        1- Boîte de récupération
        Cette case affiche votre ID de requête et vous permet également d'effectuer une nouvelle récupération

        2- Options d'affichage
        En fonction de vos besoins spécifiques, vous pouvez choisir les colonnes à afficher. Pour cela, cliquez sur le bouton "Option d'affichage", sélectionnez le(s) champ(s) concerné(s) dans la liste "Champs non affichés" et transférez-les dans la liste "Champs en affichage" via le " > ". A l'inverse, les colonnes peuvent être supprimées de l'affichage. Enfin, cliquez sur "appliquer" pour que les modifications prennent effet.

        3- Enregistrer les résultats sous
        La sortie peut être enregistrée sur l'ordinateur local de l'utilisateur. Les résultats seront enregistrés pour les entrées sélectionnées ou, si aucune protéine n'est sélectionnée, pour toutes les entrées. Cliquer sur « Tableau » enregistrera les colonnes affichées sous forme de fichier texte délimité par des tabulations, qui peut être importé dans une feuille de calcul pour une visualisation ou une analyse plus facile. Cliquer sur "FASTA" enregistrera les identifiants et les séquences au format FASTA.

        5- Affichage des résultats
        Les résultats de la recherche sont affichés dans un tableau.

        Identifiant PIRSF
        Cette colonne affichera l'identifiant de la famille correspondante. Cliquez sur l'ID pour récupérer le rapport PIRSF. L'icône sous l'ID PIRSF indique le niveau de la famille, à savoir la famille homéomorphe ( H Fam), la sous-famille ( Sub Fam) et la superfamille ( Super Fam). Cliquez sur cette icône pour afficher la vue DAG de la hiérarchie PIRSF avec le domaine PFam au niveau supérieur.

        Nom du PIRSF
        Le nom donné à la famille qui identifie sa fonction ou précise ses caractéristiques. Selon le statut de la curation, ce nom est attribué automatiquement (pas de curation manuelle) ou manuellement (curation complète). Si la famille est organisée, elle peut afficher une étiquette à côté du nom indiquant son statut, à savoir validé (il existe des données expérimentales soutenant le nom PIRSF), provisoire (il n'y a aucune preuve concluante) ou prédit (prédit par des méthodes informatiques).

        Longueur
        C'est la longueur moyenne des protéines des membres du PIRSF.

        Architecture de domaine
        Il représente les informations organisées concernant les domaines Pfam présents dans la famille des protéines. Les domaines Pfam sont répertoriés dans l'ordre de l'extrémité N à l'extrémité C, séparés par des points-virgules. Dans quelques cas, les domaines sont séparés par un tiret indiquant la présence de domaines insérés. Les nombres entre parenthèses indiquent la répétition d'un domaine. Il existe une syntaxe particulière pour cette fonctionnalité. Par exemple, PF11111(1-3) autorise 1 à 3 copies de PF11111, tandis que PF11111(2-) autorise un nombre quelconque de domaines au-dessus de 1 (2 ou plus). Cependant, PF11111(0,2) autorise aucune ou deux copies de ce domaine.

        Statut de conservation
        Non organisé : clusters de protéines générés par ordinateur, non organisés.
        Préliminaire : Composition et architecture de domaine des familles de protéines déterminées par curation manuelle.
        Complet : nom de famille protéique avec références (lorsqu'elles sont disponibles) et parfois de brèves descriptions, fournies après une sélection manuelle approfondie.

        Champs correspondants
        Le ou les champs auxquels correspond la requête.

        6- Afficher la liste des matchs
        Affiche une table mappant vos ID de requête au PIRSF correspondant.

        Aide à la recherche BLAST

        .
        2. Format de recherche BLAST
        La zone de saisie BLAST 'Recherche' accepte :

        Options de SOUFFLAGE
        BLAST est effectué à l'aide de la matrice BLOSUM62 avec des valeurs par défaut pour l'ouverture de l'espace et le coût d'extension. Cependant, les paramètres suivants peuvent être définis :

        -Statistiques basées sur la composition
        BLAST permet aux valeurs E calculées de prendre en compte la composition en acides aminés des séquences de bases de données individuelles impliquées dans les alignements rapportés. Cela améliore la précision de la valeur E, réduisant ainsi le nombre de résultats faussement positifs. Les statistiques améliorées sont obtenues avec une procédure de mise à l'échelle qui utilise en fait un système de notation légèrement différent pour chaque séquence de base de données. En conséquence, les scores d'alignement BLAST bruts en général ne correspondront pas précisément à ceux impliqués par une matrice de substitution standard. De plus, des alignements identiques peuvent recevoir des scores différents, en fonction des compositions des séquences qu'ils impliquent.

          Faible complexité
          Masque les segments de la séquence de requête qui ont une faible complexité de composition, telle que déterminée par le programme SEG de Wootton & Federhen (Computers and Chemistry, 1993). Le filtrage peut éliminer les rapports statistiquement significatifs mais biologiquement inintéressants de la sortie BLAST (par ex. Le filtrage n'est appliqué qu'à la séquence de requête, pas aux séquences de base de données.
          Masque pour la table de consultation uniquement
          Cette option masque uniquement à des fins de construction de la table de recherche utilisée par BLAST. Les recherches BLAST se composent de deux phases, la recherche de résultats basés sur une table de recherche, puis leur extension. L'option "Masquer la table de recherche uniquement" masque uniquement la table de recherche afin qu'aucun résultat ne soit trouvé sur la base d'une séquence de faible complexité. Les extensions BLAST sont effectuées sans masquage et peuvent donc être étendues via une séquence de faible complexité. Cette option est encore expérimentale et pourrait changer dans un proche avenir.
          Masque Minuscule
          Avec cette option sélectionnée, vous pouvez couper et coller une séquence FASTA en caractères majuscules et indiquer les zones que vous souhaitez filtrer en minuscules. Cela vous permet de personnaliser ce qui est filtré de la séquence lors de la comparaison avec les bases de données BLAST.

        -Attendre
        Le seuil attendu établit un seuil de signification statistique pour signaler les correspondances de séquence de base de données. La valeur par défaut est 10, ce qui signifie que 10 correspondances devraient être trouvées simplement par hasard. Les seuils d'attente inférieurs sont plus stricts, ce qui réduit le nombre de correspondances aléatoires signalées. L'augmentation du seuil attendu montre des correspondances moins strictes et est recommandée lors de l'exécution de recherches avec des séquences courtes car une requête courte est plus susceptible de se produire par hasard dans la base de données qu'une plus longue, donc même une correspondance parfaite (pas de lacunes) peut avoir une faible signification statistique et peut ne pas être signalé. L'augmentation du seuil attendu vous permet de regarder plus loin dans la liste des résultats et de voir les correspondances qui seraient normalement rejetées en raison d'une faible signification statistique.

        -Taille de mot
        La taille du mot indique la longueur de la séquence initiale qui doit être mise en correspondance entre la base de données et la séquence de requête.

        -Matrice
        Un élément clé dans l'évaluation de la qualité d'un alignement de séquences par paires est la "matrice de substitution", qui attribue un score pour l'alignement de toute paire possible de résidus. La matrice utilisée dans une recherche BLAST peut être modifiée en fonction du type de séquences avec lesquelles vous recherchez. L'utilisateur peut choisir parmi une liste de matrices qui couvrent diverses contraintes évolutives (plus d'informations peuvent être trouvées dans une description des matrices de notation BLAST). Pour chaque matrice, un coût d'écart par défaut dépendant de la matrice est affiché. Les coûts des écarts sont décrits ci-dessous.

        -Coût de l'écart dépendant de la matrice
        Le menu déroulant affiche les coûts de l'écart (pénalité pour ouvrir l'écart et pénalité pour étendre l'écart). Il existe un nombre limité d'options pour ces paramètres. L'augmentation des coûts d'écart se traduira par des alignements qui réduiront le nombre d'écarts introduits. La pénalité d'ouverture d'écart est le score retiré pour l'initiation d'un écart dans une séquence. Pour rendre le match plus significatif, l'utilisateur peut essayer d'augmenter la pénalité d'écart. La pénalité d'extension d'espace est ajoutée à la pénalité d'ouverture d'espace pour chaque résidu dans l'espace, pénalisant efficacement les espaces plus longs. Si l'utilisateur n'aime pas les longs écarts, il peut augmenter la pénalité d'écart d'extension. Habituellement, on s'attendrait à quelques longs écarts plutôt qu'à de nombreux écarts courts, de sorte que la pénalité d'extension d'écart devrait être inférieure à la pénalité d'écart. Une exception est lorsque l'une ou les deux séquences sont des lectures simples avec des erreurs de séquençage possibles, auquel cas vous vous attendriez à de nombreux écarts de base simples. L'utilisateur peut obtenir ce résultat en réglant la pénalité d'ouverture d'écart à zéro (ou très faible) et en utilisant la pénalité d'extension d'écart pour contrôler le score d'écart.

        -Ajuster les coûts d'écart
        Les alignements entre les séquences sont souvent optimisés en permettant des espaces au sein d'une ou des deux séquences. Comme les mésappariements entre les résidus alignés, les lacunes ont un "coût" qui leur est associé. Il existe des pénalités distinctes pour ouvrir et étendre les écarts. L'augmentation des coûts des écarts entraînera des alignements qui réduiront le nombre et la taille des écarts introduits. Le Gap Open cost (ou Gap Existence cost) est le score retiré pour l'initiation d'un écart dans une séquence. Pour rendre le match plus significatif, l'utilisateur peut essayer d'augmenter cette pénalité d'écart. Le coût Gap Extend est ajouté au coût Gap Open pour chaque résidu dans le gap, pénalisant efficacement les gaps plus longs. L'utilisateur peut donc contrer les écarts longs en augmentant cette pénalité. Habituellement, on s'attendrait à quelques intervalles longs plutôt qu'à de nombreux intervalles courts, de sorte que le coût d'extension de l'écart devrait être inférieur au coût d'ouverture de l'écart. Les Gap Costs peuvent être ajustés par rapport à la valeur par défaut à l'aide du menu déroulant.

        -Nombre d'accès à afficher
        Limite le nombre de hits BLAST de séquences correspondantes qui seront signalés.

        -Alignement
        Aligne votre séquence de requête et les correspondances de base de données par paires. Les correspondances sont connectées avec un "|" symbole. Les discordances sont opposées avec un espace. Les écarts sont introduits par un symbole "-".

          Wootton JC et Federhen S (1993) Statistiques de complexité locale dans les séquences d'acides aminés et les bases de données de séquences. Ordinateurs et chimie 17:149-163.

        Aide sur les résultats BLAST

        Un exemple de sortie pour une recherche BLAST par rapport à la base de données UniProtKB est présenté ci-dessous

        1- Séquence de requête sur
        Cliquez sur ce bouton pour afficher la séquence de requête. Inversement, cliquez à nouveau dessus pour le masquer.

        2- Enregistrer les résultats sous
        Les résultats de la recherche peuvent être enregistrés sur l'ordinateur local de l'utilisateur. Les résultats seront enregistrés pour les entrées sélectionnées ou, si aucune protéine n'est sélectionnée, pour toutes les entrées. Cliquer sur « Tableau » enregistrera les colonnes affichées sous forme de fichier texte délimité par des tabulations, qui peut être importé dans une feuille de calcul pour une visualisation ou une analyse plus facile. Cliquer sur "FASTA" enregistrera les identifiants et les séquences au format FASTA.

        Trier les colonnes
        Les colonnes peuvent être triées par les valeurs correspondantes en cliquant sur la flèche à côté du titre de la colonne. Par défaut, le tableau est trié par Score.

        Les résultats de la recherche sont affichés dans un tableau avec les colonnes par défaut suivantes :

        Protéine AC/ID
        La protéine AC/ID fait référence au numéro d'accession et à l'ID d'UniProtKB, respectivement. En dessous de ces identifiants, vous pouvez choisir la vue iProClass ou UniProtKB du rapport sur les protéines. La source de la séquence UniProtKB est indiquée comme UniProtKB/Swiss-Prot ou UniProtKB/TrEMBL si la séquence protéique provient respectivement de la section Swiss-Prot ou TrEMBL d'UniProtKB.

        Nom de la protéine
        Nom commun donné à une protéine, qui identifie sa fonction ou spécifie ses caractéristiques.

        Longueur
        Nombre de résidus d'acides aminés dans le peptide ou la protéine.

        Nom de l'organisme
        Le genre et l'espèce de l'organisme source d'où provient la séquence. Des liens vers les informations de taxonomie du NCBI sont fournis.

        Identifiant PIRSF
        Si une protéine appartient à une famille PIRSF, alors cette colonne affichera l'identifiant de famille correspondant. Cliquez sur l'ID pour récupérer le rapport PIRSF (voir sortie annotée).

        Colonnes de similarité de séquence BLAST
        Il y a trois colonnes liées aux résultats BLAST. La colonne Alignement, à l'extrême droite, affiche les résultats BLAST sous forme graphique. La barre supérieure représente la séquence de requête. Les barres ci-dessous montrent la ou les régions sur d'autres séquences correspondant à la séquence de requête. La couleur de la barre indique l'amplitude du score BLAST. Cliquez sur l'une de ces barres pour voir son alignement BLAST associé à la séquence de requête.

        Colonnes de recherche
        SSearch est une implémentation par paires de l'algorithme d'alignement Smith-Waterman. Lorsque deux séquences sont alignées, seule la région partagée est affichée. Dans la région partagée, les résidus d'acides aminés d'une ou des deux séquences peuvent être alignés avec des acides aminés ou des lacunes de l'autre séquence. La longueur totale de la région partagée, y compris les espaces, est représentée sous la colonne Chevauchement. Le pourcentage de résidus identiques dans l'alignement est donné sous %iden. En cliquant sur ce numéro, vous affichez l'alignement complet de SSearch.

        5- Afficher la sortie brute
        Le rapport se compose de trois sections principales : (1) l'en-tête, qui contient des informations sur la séquence de requête, la base de données recherchée. (2) les descriptions d'une ligne de chaque séquence de base de données trouvée pour correspondre à la séquence de requête, elles fournissent un aperçu rapide pour parcourir (3) les alignements pour chaque séquence de base de données correspondante (il peut y avoir plus d'un alignement pour une séquence de base de données à laquelle elle correspond) .
        Dans les descriptions d'une ligne du rapport BLAST, chaque ligne est composée de cinq champs : (a) le numéro d'accession UniProtKB (b) l'identifiant UniProtKB, (c) le nom de la protéine. Cette ligne est souvent tronquée dans les descriptions d'une ligne pour garder l'affichage compact (d) le score d'alignement en bits. Les scores les plus élevés se trouvent en haut de la liste et (e) la valeur E, qui fournit une estimation de la signification statistique. Adapté du manuel NCBI.

        Un exemple de sortie pour une recherche BLAST par rapport à la base de données UniRef100 est présenté ci-dessous

        1- Séquence de requête sur
        Cliquez sur ce bouton pour afficher la séquence de requête. Inversement, cliquez à nouveau dessus pour le masquer.

        2- Enregistrer les résultats sous
        Les résultats de la recherche peuvent être enregistrés sur l'ordinateur local de l'utilisateur. Les résultats seront enregistrés pour les entrées sélectionnées ou, si aucune protéine n'est sélectionnée, pour toutes les entrées. Cliquer sur « Tableau » enregistrera les colonnes affichées sous forme de fichier texte délimité par des tabulations, qui peut être importé dans une feuille de calcul pour une visualisation ou une analyse plus facile. Cliquer sur "FASTA" enregistrera les identifiants et les séquences au format FASTA.

        Trier les colonnes
        Les colonnes peuvent être triées par les valeurs correspondantes en cliquant sur la flèche à côté du titre de la colonne. Par défaut, le tableau est trié par Score.

        Les résultats BLAST sont calculés pour le membre représentatif de chaque cluster, vous pouvez voir les autres membres (mais pas les résultats BLAST) en cliquant sur le logo "Afficher tous les membres". Les résultats sont affichés dans un tableau avec les colonnes par défaut suivantes :

        Identifiant UniRef100
        Il fait référence à l'identifiant du cluster. En dessous se trouve un lien vers le rapport UniRef100 avec des informations sur les membres du cluster UniRef100, ainsi que des liens vers les clusters UniRef50 et UniRef90.

        Protéine AC
        La protéine AC fait référence à l'accession UniProtKB ou à l'ID UniParc. En dessous de ces identifiants, vous pouvez choisir respectivement la vue iProClass ou UniParc du rapport sur les protéines.

        Nom de la protéine
        Nom commun donné à une protéine, qui identifie sa fonction ou spécifie ses caractéristiques.

        Longueur
        Nombre de résidus d'acides aminés dans le peptide ou la protéine.

        Nom de l'organisme
        Le genre et l'espèce de l'organisme source d'où provient la séquence. Des liens vers les informations de taxonomie du NCBI sont fournis.

        Colonnes de similarité de séquence BLAST
        Il y a trois colonnes liées aux résultats BLAST. La colonne Alignement, à l'extrême droite, affiche les résultats BLAST sous forme graphique. La barre supérieure représente la séquence de requête. Les barres ci-dessous montrent la ou les régions sur d'autres séquences correspondant à la séquence de requête. La couleur de la barre indique l'amplitude du score BLAST. Cliquez sur l'une de ces barres pour voir son alignement BLAST associé à la séquence de requête.

        Colonnes de recherche
        SSearch est une implémentation par paires de l'algorithme d'alignement Smith-Waterman. Lorsque deux séquences sont alignées, seule la région partagée est affichée. Dans la région partagée, les résidus d'acides aminés d'une ou des deux séquences peuvent être alignés avec des acides aminés ou des lacunes de l'autre séquence. La longueur totale de la région partagée, y compris les espaces, est représentée sous la colonne Chevauchement. Le pourcentage de résidus identiques dans l'alignement est donné sous %iden. En cliquant sur ce numéro, vous affichez l'alignement complet de SSearch.

        5- Afficher tous les membres
        En cliquant sur ce logo, vous pourrez voir toutes les séquences appartenant à des clusters individuels.

        Aide à la recherche FASTA

        Qu'est-ce que FASTA ?
        FASTA peut être utilisé pour rechercher des bases de données de séquences, évaluer des scores de similarité et identifier des structures périodiques basées sur la similarité de séquences locales. Le programme FASTA peut comparer une séquence de protéines à une base de données de séquences d'ADN en traduisant la base de données d'ADN au fur et à mesure de la recherche. Ce moteur de recherche affiche les résultats FASTA (jusqu'à 200 correspondances), en utilisant le programme FASTA (Pearson et Lipman, 1988) avec les paramètres par défaut.

        Format de recherche FASTA
        La zone de saisie « Recherche » de FASTA accepte :

        Options FASTA
        -Attendre
        Le seuil attendu (valeur E) établit un seuil de signification statistique pour signaler les correspondances de séquence de base de données. La valeur par défaut est 0,0001, ce qui signifie que 0,0001 correspondances devraient être trouvées simplement par hasard. Les seuils d'attente inférieurs sont plus stricts, ce qui réduit le nombre de correspondances aléatoires signalées. L'augmentation du seuil attendu montre des correspondances moins strictes et est recommandée lors de l'exécution de recherches avec des séquences courtes, car une requête courte est plus susceptible de se produire par hasard dans la base de données qu'une plus longue, donc même une correspondance parfaite (pas de lacunes) peut avoir une faible signification statistique et peut ne pas être signalé. L'augmentation du seuil attendu vous permet de regarder plus loin dans la liste des résultats et de voir les correspondances qui seraient normalement rejetées en raison d'une faible signification statistique.

          Pearson WR et DJ Lipman (1988) Outils améliorés pour la comparaison de séquences biologiques. Proc. Natl. Acad. Sci. États-Unis 85(8) : 2444-2448.

        Aide sur les résultats FASTA

        Un exemple de sortie pour une recherche BLAST par rapport à la base de données UniProtKB est présenté ci-dessous

        1- Séquence de requête sur
        Cliquez sur ce bouton pour afficher la séquence de requête. Inversement, cliquez à nouveau dessus pour le masquer.

        2- Enregistrer les résultats sous
        Les résultats de la recherche peuvent être enregistrés sur l'ordinateur local de l'utilisateur. Les résultats seront enregistrés pour les entrées sélectionnées ou, si aucune protéine n'est sélectionnée, pour toutes les entrées. Cliquer sur « Tableau » enregistrera les colonnes affichées sous forme de fichier texte délimité par des tabulations, qui peut être importé dans une feuille de calcul pour une visualisation ou une analyse plus facile. Cliquer sur "FASTA" enregistrera les identifiants et les séquences au format FASTA.

        Trier les colonnes
        Les colonnes peuvent être triées par les valeurs correspondantes en cliquant sur la flèche à côté du titre de la colonne. Par défaut, le tableau est trié par Score.

        Les résultats de la recherche sont affichés dans un tableau avec les colonnes par défaut suivantes :

        Protéine AC/ID
        La protéine AC/ID fait référence au numéro d'accession et à l'ID d'UniProtKB, respectivement. En dessous de ces identifiants, vous pouvez choisir la vue iProClass ou UniProtKB du rapport sur les protéines. La source de la séquence UniProtKB est indiquée comme UniProtKB/Swiss-Prot ou UniProtKB/TrEMBL si la séquence protéique provient respectivement de la section Swiss-Prot ou TrEMBL d'UniProtKB.

        Nom de la protéine
        Nom commun donné à une protéine, qui identifie sa fonction ou spécifie ses caractéristiques.

        Longueur
        Nombre de résidus d'acides aminés dans le peptide ou la protéine.

        Nom de l'organisme
        Le genre et l'espèce de l'organisme source d'où provient la séquence. Des liens vers les informations de taxonomie du NCBI sont fournis.

        Identifiant PIRSF
        Si une protéine appartient à une famille PIRSF, alors cette colonne affichera l'identifiant de famille correspondant. Cliquez sur l'ID pour récupérer le rapport PIRSF (voir sortie annotée).

        Colonnes de similarité de séquence
        Il y a trois colonnes liées aux résultats FASTA. La colonne Alignement, à l'extrême droite, affiche les résultats FASTA sous forme graphique. La barre supérieure représente la séquence de requête. Les barres ci-dessous montrent la ou les régions sur d'autres séquences correspondant à la séquence de requête. La couleur de la barre indique l'ampleur du score FASTA. Cliquez sur l'une de ces barres pour voir son alignement FASTA associé à la séquence de requête.

        Aide relative aux séquences associées

        Récupérez des séquences associées basées sur des résultats BLAST pré-calculés, vous pourrez donc avoir un aperçu des protéines similaires à votre requête, beaucoup plus rapidement que d'exécuter BLAST. Cette procédure est effectuée environ tous les trois mois. Entrez l'identifiant de séquence UniProtKB et cliquez sur le bouton "Rechercher".

        1- Affichage de la valeur E
        Sélectionnez la valeur seuil E pour afficher vos résultats.

        2- Séquence de requête sur
        Cliquez sur ce bouton pour afficher la séquence de requête. Inversement, cliquez à nouveau dessus pour le masquer.

        3- Enregistrer les résultats sous
        Les résultats de la recherche peuvent être enregistrés sur l'ordinateur local de l'utilisateur. Les résultats seront enregistrés pour les entrées sélectionnées ou, si aucune protéine n'est sélectionnée, pour toutes les entrées. Cliquer sur « Tableau » enregistrera les colonnes affichées sous forme de fichier texte délimité par des tabulations, qui peut être importé dans une feuille de calcul pour une visualisation ou une analyse plus facile. Cliquer sur "FASTA" enregistrera les identifiants et les séquences au format FASTA.

        Trier les colonnes
        Les colonnes peuvent être triées par les valeurs correspondantes en cliquant sur la flèche à côté du titre de la colonne. Par défaut, le tableau est trié par Score.

        Les résultats de la recherche sont affichés dans un tableau avec les colonnes par défaut suivantes :

        Protéine AC/ID
        La protéine AC/ID fait référence au numéro d'accession et à l'ID d'UniProtKB, respectivement. En dessous de ces identifiants, vous pouvez choisir la vue iProClass ou UniProtKB du rapport sur les protéines. La source de la séquence UniProtKB est indiquée comme UniProtKB/Swiss-Prot ou UniProtKB/TrEMBL si la séquence protéique provient respectivement de la section Swiss-Prot ou TrEMBL d'UniProtKB.

        Nom de la protéine
        Nom commun donné à une protéine, qui identifie sa fonction ou spécifie ses caractéristiques.

        Longueur
        Nombre de résidus d'acides aminés dans le peptide ou la protéine.

        Nom de l'organisme
        Le genre et l'espèce de l'organisme source d'où provient la séquence. Des liens vers les informations de taxonomie du NCBI sont fournis.

        Identifiant PIRSF
        Si une protéine appartient à une famille PIRSF, alors cette colonne affichera l'identifiant de famille correspondant. Cliquez sur l'ID pour récupérer le rapport PIRSF (voir sortie annotée).

        Colonnes de similarité de séquence
        Il y a trois colonnes liées aux résultats BLAST. La colonne Alignement, à l'extrême droite, affiche les résultats BLAST sous forme graphique. La barre supérieure représente la séquence de requête. Les barres ci-dessous montrent la ou les régions sur d'autres séquences correspondant à la séquence de requête. La couleur de la barre indique l'amplitude du score BLAST. Cliquez sur l'une de ces barres pour voir son alignement associé à la séquence de requête.

        Correspondance peptidique


        Page de résultats de la correspondance peptidique

        1- Peptide de requête
        Affichez le peptide de requête et autorisez l'utilisateur à effectuer une nouvelle recherche en soumettant un nouveau peptide de requête.

        2- Enregistrer les résultats sous
        La sortie peut être enregistrée sur l'ordinateur local de l'utilisateur. Les résultats seront enregistrés pour les entrées sélectionnées ou, si aucune protéine n'est sélectionnée, pour toutes les entrées. Cliquer sur « Tableau » enregistrera les colonnes affichées sous forme de fichier texte délimité par des tabulations, qui peut être importé dans une feuille de calcul pour une visualisation ou une analyse plus facile. Cliquer sur "FASTA" enregistrera les identifiants et les séquences au format FASTA.

        Protéine AC/ID
        La protéine AC/ID fait référence aux identifiants UniProtKB ou UniRef100. En dessous de ces chiffres, vous pouvez choisir la vue iProClass ou UniProtKB/UniRef100 de chaque rapport de protéines. La source de la séquence UniProtKB est indiquée comme UniProtKB/Swiss-Prot ou UniProtKB/TrEMBL si la séquence protéique provient respectivement de Swiss-Prot ou TrEMBL.

        Nom de la protéine
        Nom commun donné à une protéine, qui identifie sa fonction ou spécifie ses caractéristiques.

        Longueur
        Nombre de résidus d'acides aminés dans le peptide ou la protéine.

        Nom de l'organisme
        Le genre et l'espèce de l'organisme source d'où provient la séquence. Des liens vers les informations de taxonomie du NCBI sont fournis.

        Identifiant PIRSF
        Si une protéine appartient à une famille PIRSF, alors cette colonne affichera l'identifiant de famille correspondant. Cliquez sur l'ID pour récupérer le rapport PIRSF (voir sortie annotée).

        Portée de correspondance
        Cette colonne affiche en rouge la requête peptidique dans la séquence.

        5- Organismes multiples
        Cliquez pour afficher les identifiants de taxonomie des organismes appariés.

        6- Parcourir par groupe de taxonomie
        Cliquez pour afficher les groupes de taxonomie des séquences appariées comme indiqué ci-dessous.

        Recherche de modèle

        Un motif est une formule (expression régulière) qui représente la région conservée d'un groupe de protéines apparentées. Une fois construit, le motif est utilisé par un programme de correspondance de motifs pour trouver les occurrences possibles de la région conservée dans la base de données de séquences.

        PROSITE est une base de données qui contient des modèles et des profils spécifiques à plus d'un millier de familles ou domaines de protéines. Chacune de ces signatures est accompagnée d'une documentation fournissant des informations générales sur la structure et la fonction de ces protéines.

        L'identification de modèles dans une protéine ou un groupe de protéines peut aider à évaluer la fonction des protéines ou à prédire une certaine modification post-traductionnelle. Cependant, les résultats de la recherche de modèles doivent être approfondis, car en raison de la nature de l'approche, les modèles sont souvent trop spécifiques (nombreux faux négatifs) ou insuffisamment sélectifs (forte probabilité d'occurrence). Comme c'est le cas par exemple pour le patron PROSITE :
        PS00001
        ID ASN_MODÈLE DE GLYCOSYLATION.
        Site de N-glycosylation DE.
        LA POÊLE-

        -[ST]-


        Ce modèle peut être trouvé dans la plupart des protéines, cependant, la N-glycosylation est une modification qui a lieu dans le réticulum endoplasmique pendant la synthèse des protéines membranaires et sécrétées.

          Utilisez des lettres majuscules pour les résidus d'acides aminés et mettez un "-" entre deux acides aminés (pas obligatoire).

        • [ LIVM ] signifie que L, I, V ou M peuvent être en première position.
        • signifie que C et F ne doivent pas être dans cette position particulière
        • x (3) est le même que "xxx"
        • " x (1,4) représente "x" ou "xx" ou "xxx" ou "xxxx"
        • ">MDEL" ne trouve que les séquences commençant par MDEL
        • "DEL>" ne trouve que les séquences se terminant par DEL

        Remarque : Vous pouvez également écrire le modèle ci-dessus sous la forme :
        [LIVM] [VIC] x (2) G [DENQTA] x [GAC] x (2) [LIVMFY] (4) x (2) G

        Résultat pour les protéines avec le motif PROSITE PS00888 (Cyclic nucleotide-binding domain signature 1)

        1- Enregistrer les résultats sous
        La sortie peut être enregistrée sur l'ordinateur local de l'utilisateur. Les résultats seront enregistrés pour les entrées sélectionnées ou, si aucune protéine n'est sélectionnée, pour toutes les entrées. Cliquer sur « Tableau » enregistrera les colonnes affichées sous forme de fichier texte délimité par des tabulations, qui peut être importé dans une feuille de calcul pour une visualisation ou une analyse plus facile. Cliquer sur "FASTA" enregistrera les identifiants et les séquences au format FASTA.

        3- Affichage des résultats
        Les résultats de la recherche sont affichés dans un tableau. Les colonnes peuvent être triées par les valeurs correspondantes en cliquant sur la flèche à côté du titre de la colonne.

        Protéine AC/ID
        La protéine AC/ID fait respectivement référence à l'accession et à l'identifiant UniProtKB. En dessous de ceux-ci, vous pouvez choisir la vue iProClass ou UniProtKB de chaque rapport sur les protéines. La source de la séquence UniProtKB est indiquée comme UniProtKB/Swiss-Prot ou UniProtKB/TrEMBL si la séquence protéique provient respectivement de Swiss-Prot ou TrEMBL.

        Nom de la protéine
        Nom commun donné à une protéine, qui identifie sa fonction ou spécifie ses caractéristiques.

        Longueur
        Nombre de résidus d'acides aminés dans le peptide ou la protéine.

        Nom de l'organisme
        Le genre et l'espèce de l'organisme source d'où provient la séquence. Des liens vers les informations de taxonomie du NCBI sont fournis.

        Identifiant PIRSF
        Si une protéine appartient à une famille PIRSF, alors cette colonne affichera l'identifiant de famille correspondant. Cliquez sur l'ID pour récupérer le rapport PIRSF (voir sortie annotée).

        Portée de correspondance
        Cette colonne affiche la plage de séquences pour le modèle de requête.

        Résultat partiel pour les patrons PROSITE dans UniProtKB O05689

        Aide sur l'alignement multiple

        Sélectionnez le programme d'alignement : ClustalW, T-Cofee ou Muscle. Ensuite, saisissez plusieurs séquences (pas plus de 70) avec leurs lignes ID correspondantes au format FASTA, ou saisissez plusieurs ID UniProtKB séparés par des lignes, des virgules ou des espaces. Cliquez ensuite sur le bouton « Envoyer ».
        La page de résultats affichera l'alignement et la visionneuse d'alignement. Pour ClustalW et T-Coffee, l'arborescence et l'alignement des voisins peuvent être affichés, modifiés et enregistrés à l'aide de la visionneuse PIR-TAV ou de JalView (voir ci-dessous). Pour Muscle, seul Jalview est disponible.

        Format FASTA
        Une séquence au format FASTA commence par une description sur une seule ligne, suivie de lignes de données de séquence. La ligne de description se distingue des données de séquence par un symbole supérieur à (">") dans la première colonne. L'un des avantages de l'utilisation du format FASTA est que l'identifiant de séquence sera signalé avec les résultats. Un exemple de séquence au format FASTA est :

        >gi|3287971|sp|P37025|LIGT_ECOLI 2'-5' ARN ligase MSEPQRLFFAIDLPAEIREQIIHWRATHFPPEAGRPVAADNLHLTLAFLGEVSAEK EKALSLLAGRIRQPGFTLTLDDAGQWLRSRVVWLGMRQPPRGLIQLANTIPHPPMLRSQA ARSGLLCFQSASSNRPFLRQLK

        Aide à l'alignement par paires

        Insérez deux séquences en utilisant le code d'acides aminés à une lettre ou entrez deux codes identifiants UniProtKB. Appuyez sur le bouton « Soumettre » et les résultats de l'alignement afficheront les alignements complets SSEARCH Smith-Waterman entre deux séquences (programme SSEARCH version 3.4t24 21 juillet 2004).

        Alignement par paire de P53039 et Q6FQ69

        Aide sur le mappage d'ID

        Cette fonction permet le mappage des identifiants entre UniProtKB et d'autres bases de données

        Spécifiez d'abord le type d'ID de vos données source (plusieurs types d'ID peuvent être sélectionnés à l'aide de la touche ctrl). Spécifiez le type d'ID auquel vous souhaitez que le mappage. Tapez ou collez les identifiants dans la case prévue, séparés par un espace ou une touche retour. Alternativement, vous pouvez télécharger un fichier avec une liste d'ID. Sélectionnez le format de sortie et enfin, appuyez sur "Carte".

        La page de résultats contient la liste des correspondances d'ID. Les identifiants peuvent être coupés et collés si nécessaire ou enregistrés sous forme de fichier texte à l'aide de l'option « enregistrer sous » fournie par votre navigateur Web.
        Voir la sortie annotée ci-dessous.

        Mappage des numéros GI vers les AC UniProt

        Aide au calcul de la composition/du poids moléculaire

        Récupérez les informations de composition et le poids moléculaire d'une ou plusieurs séquences en fonction de l'identifiant UniProtKB ou du code d'acide aminé à une lettre. Les résultats contiennent le nombre de résidus et le pourcentage pour chaque acide aminé dans la séquence. Les notes de calcul pour le poids moléculaire et le poids moléculaire pour chaque acide aminé sont également données.

        Composition en poids moléculaire pour P53039

        Analyse PIRSF

        Recherchez votre séquence de requête par rapport aux familles PIRSF entièrement organisées. Lorsque vous soumettez votre séquence de requête, elle sera recherchée par rapport aux modèles HMM complets et de domaine pour les PIRSF entièrement organisés par le programme HMMER. Si une correspondance est trouvée, les régions et les statistiques correspondantes seront affichées. La séquence de requête doit être saisie à l'aide d'un code à une seule lettre ou d'un identifiant UniProtKB.

        Tableau des codes de séquence des acides aminés

        Identifiants UniProtKB pour les outils de recherche et d'analyse BLAST/FASTA

        Le tableau suivant montre des exemples de numéro d'accession et d'ID d'UniProtKB

        Rapport PIRSF Exemple de rapport pour PIRSF000186. Des informations sur les champs numérotés sont fournies ci-dessous. 1- Vue DAG de la hiérarchie PIRSF 2- Répartition taxonomique du PIRSF 3- Alignement multiple 4- Architecture de domaine

        Aide sur le répertoire des protéines principales

        Cette section décrit la page de recherche de texte dans le répertoire de protéines principales. Le répertoire principal contient des informations sur les protéines et les réactifs identifiés par les centres de recherche en biodéfense protéomique du NIAID. La mise en page globale de la page est similaire aux résultats de recherche de texte PIR réguliers, mais elle diffère dans les colonnes par défaut affichées et a des attributs supplémentaires à rechercher. Il existe deux affichages en colonnes 1) affichage par défaut qui est utilisé pour afficher plusieurs types de données ensemble (c'est-à-dire MS_proteomic et Microarray) et, 2) spécifique au type de données qui est utilisé lorsqu'un seul type de données est sélectionné et contient des informations supplémentaires qui s'appliquent à ces données tapez seulement. Pour afficher l'affichage spécifique aux données à partir du menu déroulant --Sélectionnez un type de données à afficher-- sélectionnez un type de données.

        Affichage par défaut pour plusieurs types de données

        Affichage spécifique au type de données (microarray)

        Options de recherche et de résultats

        1- Parcourir la sélection
        Par défaut, le répertoire affiche toutes les données. Cette fonctionnalité, un menu déroulant d'options en haut de la page, vous permet de restreindre votre navigation par 1) type de données, 2) Centre de recherche en protéomique et 3) Organisme

        2- Recherche
        Vous permet d'effectuer une recherche supplémentaire au cas où vous souhaiteriez filtrer davantage votre sortie ou si vous souhaitez lancer une nouvelle recherche (pas besoin de revenir à la page précédente). Les options disponibles sont affichées dans un menu déroulant et sont les mêmes attributs de protéines que ceux trouvés dans la base de données iProClass avec l'ajout d'attributs spécifiques au répertoire répertoriés sous l'en-tête « Répertoire principal ». Entrez n'importe quelle chaîne de texte ou sous-chaîne, la casse n'a pas d'importance. Si vous souhaitez déterminer uniquement la présence ou l'absence d'une valeur, utilisez les mots « non nul » ou « null ». Les caractères génériques sont autorisés.

        3- Options d'affichage
        En fonction de vos besoins spécifiques, vous pouvez choisir les colonnes à afficher. Pour cela, cliquez sur le bouton "Option d'affichage", sélectionnez le(s) champ(s) concerné(s) dans la liste "Champs non affichés" et transférez-les dans la liste "Champs à afficher" via le bouton ">". Inversement, les colonnes peuvent être supprimées de l'affichage. Enfin, cliquez sur « Appliquer » pour que les modifications prennent effet.

        4- Enregistrer les résultats sous
        La sortie peut être enregistrée sur l'ordinateur local de l'utilisateur. Les résultats seront enregistrés pour les entrées sélectionnées ou, si aucune protéine n'est sélectionnée, pour toutes les entrées. Cliquer sur « Tableau » enregistrera les colonnes affichées sous forme de fichier texte délimité par des tabulations, qui peut être importé dans une feuille de calcul pour une visualisation ou une analyse plus facile. Cliquer sur "FASTA" enregistrera les identifiants et les séquences au format FASTA.


        Affichage spécifique au type de données (microarray)

        6- Affichage des résultats
        Les résultats de la recherche sont affichés dans un tableau personnalisable. Les colonnes exactes affichées dépendront des champs recherchés et des préférences de l'utilisateur.

        Protéine AC/ID
        La protéine AC/ID fait référence aux identifiants UniProtKB ou UniParc. En dessous de ces chiffres, vous pouvez choisir la vue iProClass ou UniProtKB/UniParc du rapport sur les protéines. La source de la séquence UniProtKB est indiquée comme UniProtKB/Swiss-Prot ou UniProtKB/TrEMBL si la séquence protéique provient respectivement de la section Swiss-Prot ou TrEMBL de la base de connaissances UniProt., respectivement. Alternativement, l'ID UniParc sera affiché si la séquence n'est pas présente dans la base de données UniProtKB mais est présente dans UniParc.

        Dir.ID
        L'ID de répertoire est un identifiant unique sélectionné parmi les données soumises par le Centre de recherche protéomique. Il est utilisé dans le répertoire principal pour identifier un résultat de recherche spécifique et pour lier les informations sur les protéines dans le répertoire principal aux résultats détaillés dans la banque de protéines.

        Centre
        Identifie le NIAID Biodefense Proteomics Research Center qui a produit les données. En cliquant sur le nom, vous affichez des informations supplémentaires sur le centre et les données qu'ils ont soumises.

        Type de données
        Identifie le type de données fournies. Cliquer sur le nom du type de données ouvre une nouvelle fenêtre avec des informations sur les protéines affichées dans le format spécifique au type de données.

        Expérience #
        Liens vers des données expérimentales connexes dans la banque de données sur les protéines.

        Nom de la protéine
        Nom commun donné à une protéine, qui identifie sa fonction ou spécifie ses caractéristiques.

        Longueur
        Nombre de résidus d'acides aminés dans le peptide ou la protéine.

        Nom de l'organisme
        Le genre et l'espèce de l'organisme source d'où provient la séquence. Des liens vers les informations de taxonomie du NCBI sont fournis.

        Identifiant PIRSF
        Si une protéine appartient à une famille PIRSF, alors cette colonne affichera l'identifiant de famille correspondant. Cliquez sur l'ID pour récupérer le rapport PIRSF (voir sortie annotée).

        7 Options de recherche spécifiques au type de données
        Tous les champs communs répertoriés ci-dessus peuvent être recherchés, ainsi que toutes les colonnes facultatives qu'un utilisateur peut ajouter. De plus, il existe des champs spécifiques au type de données qui ne sont affichés que dans l'affichage spécifique au type de données mais peuvent également être recherchés. Remarque : certains champs spécifiques aux réactifs peuvent être vides.

        Aide complète sur les protéomes prédits

        Cet outil permet des recherches textuelles limitées aux protéomes complets tels qu'annotés par le Consortium UniProt et étudiés par le Programme de recherche en protéomique de la biodéfense. Les résultats sont liés au Master Protein Directory qui contient des informations expérimentales sur certaines des protéines.

        Pour commencer, sélectionnez les protéomes d'intérêt et recherchez.

        Options de recherche et de résultats

        1- Recherche
        Une fois dans l'outil, vous pouvez restreindre davantage votre recherche. Les options disponibles sont affichées dans un menu déroulant et sont les mêmes attributs de protéines que ceux trouvés dans la base de données iProClass avec l'ajout de l'option - Master Directory (MD) . Entrez n'importe quelle chaîne de texte ou sous-chaîne, la casse n'a pas d'importance.Si vous souhaitez déterminer uniquement la présence (+) ou l'absence (vide) d'une valeur, utilisez les mots « non nul » ou « null ». Les recherches avec caractères génériques sont autorisées.

        2- Options d'affichage
        En fonction de vos besoins spécifiques, vous pouvez choisir les colonnes à afficher. Pour cela, cliquez sur le bouton "Option d'affichage", sélectionnez le(s) champ(s) concerné(s) dans la liste "Champs non affichés" et transférez-les dans la liste "Champs à afficher" via le bouton ">". Inversement, les colonnes peuvent être supprimées de l'affichage. Enfin, cliquez sur « Appliquer » pour que les modifications prennent effet.

        3- Enregistrer les résultats sous
        La sortie peut être enregistrée sur l'ordinateur local de l'utilisateur. Les résultats seront enregistrés pour les entrées sélectionnées ou, si aucune protéine n'est sélectionnée, pour toutes les entrées. Cliquer sur « Tableau » enregistrera les colonnes affichées sous forme de fichier texte délimité par des tabulations, qui peut être importé dans une feuille de calcul pour une visualisation ou une analyse plus facile. Cliquer sur "FASTA" enregistrera les identifiants et les séquences au format FASTA.

        5- Affichage des résultats
        Les résultats de la recherche sont affichés dans un tableau personnalisable. Les colonnes exactes affichées dépendront des champs recherchés et des préférences de l'utilisateur.

        Protéine AC/ID
        La protéine AC/ID fait référence aux identifiants UniProtKB ou UniParc. En dessous de ces chiffres, vous pouvez choisir la vue iProClass ou UniProtKB/UniParc du rapport sur les protéines. La source de la séquence UniProtKB est indiquée comme UniProtKB/Swiss-Prot ou UniProtKB/TrEMBL si la séquence protéique provient respectivement de la section Swiss-Prot ou TrEMBL. Alternativement, l'ID UniParc sera affiché si la séquence n'est pas présente dans la base de données UniProtKB avec le rapport UniParc.

        MD (Répertoire principal)
        Toute protéine avec des informations présentes dans le répertoire principal du programme de recherche en protéomique de la biodéfense est indiquée par un (+) dans la colonne MD. Pour restreindre votre recherche aux seules protéines présentes dans le MD, sélectionnez « Répertoire principal » dans les options du champ de recherche et saisissez la valeur « oui » ou « non nul ».

        Nom de la protéine
        Nom commun donné à une protéine, qui identifie sa fonction ou spécifie ses caractéristiques.

        Longueur
        Nombre de résidus d'acides aminés dans le peptide ou la protéine.

        Nom de l'organisme
        Le genre et l'espèce de l'organisme source d'où provient la séquence. Des liens vers les informations de taxonomie du NCBI sont fournis.

        Identifiant PIRSF
        Si une protéine appartient à une famille PIRSF, alors cette colonne affichera l'identifiant de famille correspondant. Cliquez sur l'ID pour récupérer le rapport PIRSF (voir sortie annotée).

        Séq.
        Cette colonne indique le nombre de hits BLAST précalculés obtenus à l'aide des paramètres par défaut. Seules 300 séquences maximum seront affichées. En cliquant sur le numéro, vous accédez à la page de séquence associée. Cela permet d'avoir un aperçu de la similarité des séquences de manière très rapide. Le nombre lui-même fournit déjà des informations sur le caractère unique de la protéine. Par exemple, un nombre très faible peut vous indiquer que la requête est spécifique à une certaine espèce, genre, taxon, etc. Le signe " + " à côté du titre de la séquence liée permet de comparer le nombre de séquences liées à 3 valeurs E différentes coupures comme indiqué ci-dessous.

        Analyse GO Slim

        Les GO slims sont des versions plus petites des ontologies génétiques contenant un sous-ensemble des termes de l'ensemble GO. Ils donnent un large aperçu du contenu de l'ontologie sans le détail des termes spécifiques à grain fin. Les GO slims sont particulièrement utiles pour donner un résumé des résultats de l'annotation GO d'un génome ou d'un protéome lorsqu'une classification large de la fonction du produit génique est requise.

        Vous pouvez afficher les termes GO slim pour la fonction biologique, le composant et le processus en sélectionnant le bouton « Afficher GO Slim » dans la barre d'outils d'analyse. Vous pouvez ensuite afficher les statistiques des ontologies individuelles (Fonction, Composant et Fonction) en vérifiant les entrées d'intérêt et en sélectionnant l'ontologie à afficher. Suivez les liens GO ID pour en savoir plus sur le terme GO.

        Aide du répertoire des réactifs maîtres

        Cette section décrit la page Recherche de texte dans le répertoire de réactifs maître. Le répertoire des réactifs contient des réactifs identifiés par les centres de recherche en protéomique de la biodéfense du NIAID et fournit des liens vers des référentiels où les réactifs peuvent être obtenus. La mise en page globale de la page est similaire aux résultats de recherche de texte PIR réguliers, mais elle diffère dans les colonnes par défaut affichées et a des attributs supplémentaires à rechercher. Il y a deux affichages en colonnes 1) affichage par défaut qui est utilisé pour afficher plusieurs types de réactifs ensemble (c'est-à-dire anticorps et clones) et, 2) type de réactif spécifique qui est utilisé lorsqu'un seul type de réactif est sélectionné et contient des informations supplémentaires qui s'appliquent à ce réactif seul.

        Affichage par défaut pour plusieurs types de réactifs

        Affichage spécifique au type de réactif (anticorps)

        Options de recherche et de résultats

        1- Parcourir la sélection
        Par défaut, le répertoire affiche tous les réactifs. Cette fonctionnalité, un menu déroulant d'options, vous permet de restreindre votre navigation par 1) type de réactif, 2) centre de recherche en protéomique et 3) organisme

        2- Recherche
        Vous permet d'effectuer une recherche supplémentaire au cas où vous souhaiteriez filtrer davantage votre sortie ou si vous souhaitez lancer une nouvelle recherche (pas besoin de revenir à la page précédente). Les options disponibles sont affichées dans un menu déroulant (voir les options actuelles ci-dessous). Entrez n'importe quelle chaîne de texte ou sous-chaîne, la casse n'a pas d'importance. Si vous souhaitez déterminer uniquement la présence ou l'absence d'une valeur, utilisez les mots « non nul » ou « null ».

        3- Options d'affichage
        En fonction de vos besoins spécifiques, vous pouvez choisir les colonnes à afficher. Pour cela, cliquez sur le bouton "Option d'affichage", sélectionnez le(s) champ(s) concerné(s) dans la liste "Champs non affichés" et transférez-les dans la liste "Champs à afficher" via le bouton ">". Inversement, les colonnes peuvent être supprimées de l'affichage. Enfin, cliquez sur « Appliquer » pour que les modifications prennent effet.

        4- Enregistrer les résultats sous
        La sortie peut être enregistrée sur l'ordinateur local de l'utilisateur. Les résultats seront enregistrés pour les entrées sélectionnées ou, si aucun réactif n'est sélectionné, pour toutes les entrées. Cliquer sur « Tableau » enregistrera les colonnes affichées sous forme de fichier texte délimité par des tabulations, qui peut être importé dans une feuille de calcul pour une visualisation ou une analyse plus facile.

        5- Affichage des résultats
        Les résultats de la recherche sont affichés dans un tableau personnalisable. Les colonnes exactes affichées dépendront des champs recherchés et des préférences de l'utilisateur. Les colonnes par défaut sont décrites ci-dessous.

        Identifiant du réactif
        L'ID du réactif fait référence à un identifiant unique. Si le réactif est déposé dans la ressource BEI, c'est le même identifiant que celui utilisé au BEI.

        Type de réactif
        Identifie le type de réactif. Cliquer sur le nom du type de réactif ouvre une nouvelle fenêtre avec des informations sur le réactif affichées dans le format spécifique au réactif.

        Nom/Description
        Texte descriptif du réactif.

        Nom de l'organisme
        Le genre et le nom de l'espèce de l'organisme source à partir duquel ou pour lequel le réactif a été développé. Par exemple : Les souches bactériennes indiquent ici le nom de l'espèce bactérienne, pas la souche. Les anticorps bien que provenant de souris ou de lapin listent les antigènes de l'organisme. Des liens vers les informations de taxonomie du NCBI sont fournis.

        Centre
        Identifie le NIAID Biodefense Proteomics Research Center qui a produit le réactif. En cliquant sur le nom, vous affichez des informations supplémentaires sur le centre et les données qu'ils ont soumises.

        Expérience #
        Liens vers des données expérimentales connexes dans la banque de données sur les protéines. Si ces réactifs étaient utilisés pour un ensemble particulier d'expériences, ce nombre serait lié à ces données.

        Publication
        Liens vers les publications PRC qui ont utilisé le réactif.

        La source
        Liens vers des référentiels de réactifs où les utilisateurs peuvent obtenir le réactif.

        6- Options de recherche spécifiques aux réactifs
        Tous les champs communs énumérés ci-dessus peuvent être recherchés. De plus, il existe des champs spécifiques aux réactifs qui ne sont affichés que dans l'affichage spécifique aux réactifs mais peuvent également être recherchés. Remarque : certains champs spécifiques aux réactifs peuvent être vides.

        Aide de Proteomes de référence

        1. Que sont les protéomes de référence ?
        Les protéomes de référence (RP) sont des protéomes sélectionnés parmi les groupes de protéomes représentatifs (RPG) contenant des protéomes similaires calculés sur la base de la co-appartenance aux clusters UniRef50. Le protéome de référence est le protéome qui peut le mieux représenter tous les protéomes de son groupe en termes de la majorité de l'espace de séquence et des informations. Des RP à 75 %, 55 %, 35 % et 15 % de seuil de co-adhésion sont fournis pour permettre aux utilisateurs de diminuer ou d'augmenter la granularité de l'espace de séquence en fonction de leurs besoins.

        2. Référence Proteomes BLAST recherche.
        1. Sélectionnez une base de données La recherche BLAST peut être effectuée sur RP75, RP55, RP35 ou RP15 : les RP inférieurs (tels que RP15) ont moins de protéomes que les RP plus élevés (tels que RP75). Par exemple, pour obtenir le moins de résultats BLAST, choisissez RP15. Pour une aide supplémentaire sur BLAST, veuillez consulter https://proteininformationresource.org/pirwww/support/help.shtml#3.

        3. Disponibilité et utilisation de RP.
        Pour les valeurs de seuil de 75, 55, 35 et 15 (RP75, RP55, RP35 et RP15), les fichiers correspondants du groupe protéomique représentatif sont fournis, via les liens de la page d'accueil RP, au format ci-dessous : fichiers au format FASTA pour les postes RP75, RP55, RP35 et RP15. Les utilisateurs peuvent choisir de créer leur propre ensemble de RP personnalisé en utilisant la table basée sur les taxons ou le script perl disponible via un lien à partir de la page d'accueil RP. Par exemple, nous pensons que, pour certains utilisateurs, l'ensemble idéal pourrait être RP75 pour les animaux + RP55 pour d'autres organismes cellulaires + tout génome de référence GO manquant.

        4. Référencez la disponibilité de Proteome à partir de l'interface iProClass.
        iProClass est un entrepôt de données intégré contenant toutes les protéines UniProtKB et des protéines supplémentaires provenant des ressources NCBI. Les protéines des ensembles de protéomes représentatifs définis sont indexées dans iProClass et sont disponibles pour BLAST (http://proteininformationresource.org/rps/blast_rp.shtml). De plus, toutes les protéines de l'ensemble RP55 peuvent être récupérées à partir de http://proteininformationresource.org/pirwww/search/textsearch.shtml en sélectionnant Rep Proteome puis en tapant not null et en cliquant sur Search. Les utilisateurs peuvent effectuer un filtrage supplémentaire sur l'ensemble récupéré en effectuant des recherches booléennes à l'aide de plus de 65 champs disponibles dans le menu déroulant de recherche de texte. Le BLAST et les résultats de la recherche textuelle peuvent être téléchargés à partir de la page des résultats pour une analyse plus approfondie.

        5. Parcourir les protéomes de référence.
        Les RP aux quatre seuils différents peuvent être consultés sur http://proteininformationresource.org/cgi-bin/rps_tree.pl. Les nœuds les plus élevés sont les archées, les bactéries et les eucaryotes et la vue entièrement agrandie montre tous les protéomes qui ont été analysés pour identifier les PR. Parcourir les RP à différents seuils pour différents nœuds de taxonomie peut fournir des indices sur le CMT le mieux adapté à une branche particulière et sur la manière dont les RP sont distribués dans l'arbre de taxonomie. Une fois qu'un ensemble souhaité de RP est affiché à l'écran, il peut être imprimé pour référence future.

        6. Mise à jour des données des protéomes de référence.
        Les ensembles de protéines utilisés pour la recherche de texte et la recherche BLAST sont mis à jour toutes les quatre semaines. De nouveaux protéomes sont ajoutés tous les six mois. Toutes les versions sont archivées pendant au moins 5 ans.


        Informations sur l'auteur

        Affiliations

        Division des sciences biologiques, Laboratoire national du nord-ouest du Pacifique, Richland, WA, 99352, États-Unis

        Charles Ansong, Samuel H Payne, Jessica L Martin, Meagan C Burnet, Matthew E Monroe, Richard D Smith et Joshua N Adkins

        Laboratoire des sciences moléculaires de l'environnement, Laboratoire national du nord-ouest du Pacifique, Richland, WA, 99352, États-Unis

        Nikola Tolić et Samuel O Purvine

        Institut de recherche sur les vaccins de San Diego, San Diego, CA, 92121, États-Unis

        Steffen Porwollik et Michael McClelland

        Pathogen Functional Genomics Resource Center, J. Craig Venter Institute, Rockville, MD, 20850, États-Unis

        Marcus Jones, Pratap Venepally et Scott N Peterson

        Département de microbiologie moléculaire et d'immunologie, Université de la santé et des sciences de l'Oregon, Portland, OR, 97239, États-Unis


        Voir la vidéo: Les Modifications post-traductionnelles: Acétylation (Mai 2022).