- BLAST: les bases
comparer la séquence CC16_SCHPO de Swiss-Prot à la
base de données non-redondante de protéines avec le
programme BLAST. Utiliser
les paramètres par défaut.
-
Combien de séquences y a-t-il dans la base de données ?
Combien d'amino-acides ?
-
Que représente le score ? La E-value ?
-
Trouve-t-on des homologues ?
-
Essayer avec blosum90 et blosum45. Quel est l'effet en
termes de sensibilité et de sélectivité ?
-
Essayer sans le filtre à régions de basse complexité.
Quel est l'effet en termes de sélectivité et de
sensibilité ?
-
La séquence W99073 d'EMBL est un EST de
souris. Comparer cette séquence nucléotidique à Swiss-Prot, en
utilisant le programme blastx (même site que
l'exercice précédent).
Questions :
-
Cet EST correspond-il à une région codante ?
-
La séquence complète de la protéine est-elle connue chez
la souris ?
-
Examiner la localisation des régions similaires. Sont-ils
répartis régulièrement le long de l'EST, ou y a-t-il des
régions plus conservées que d'autres ? Les régions
conservées ont-elles une fonction commune ?
-
Mettre en évidence les exons et les introns du gène TNFA
humain (HSTNFAB) en le comparant aux protéines avec
blastx. Quel est l'effet des filtres à basse
complexité ?
-
L'entrée EMBL U22894 contient la séquence d'un élément
amplifiable de Streptomyces lividans, une bactérie. Il
est fait mention d'un ORF (Open Reading Frame, qui
encode une protéine hypothétique) nommé ORF 4.7. Comparer cet
ORF aux bases de données de protéines.
Questions :
-
Quelles parties de la protéine hypothétique sont
similaires à d'autres séquences ?
-
Combien de types différents de domaines contient-elle ?
-
L'annotation "chitinase homolog" dans EMBL est-elle correcte ?