-
-
Local.
-
Il s'agit du pourcentage de résidus identiques dans
l'alignement concerné.
-
Le symbole ":" désigne une paire de résidus
identiques, "." désigne une paire de résidus
similaires.
-
Quand deux résidus différents sont biochimiquement proches
(par leur charge, leur polarité, leur taille, etc.), leur
substitution est fréquente et ils sont notés par
".". Les substitutions rarement observées sont
laissées en blanc. C'est la matrice de substitutions qui
sert de référence.
-
Lorsque deux acides aminés sont dissemblables, il arrive
que le score de l'alignement soit meilleur en décalant une
partie de la séquence, i.e. en introduisant une
lacune. Ceci dépend des pénalités d'ouverture et
d'extension, ainsi que de la matrice de substitution.
-
-
L'intensité du point en (i,j) représente le degré de
similarité entre la séquence horizontale autour du
ième résidu et la séquence verticale autour du
jème résidu. La région prise en compte est une
fenêtre centrée sur i et j, respectivement. Ces
scores dépendent de la matrice de substitution.
-
Les seuils permettent de mettre en blanc ou noir tous les
points dont le score est inférieur ou supérieur à une
certaine valeur, ce qui permet par exemple d'éliminer le
bruit de fond.
-
Quand les deux seuils sont bas, on distingue mal le signal
du bruit de fond : la sensibilité est bonne mais la
sélectivité est mauvaise. Quand ils sont hauts, on est
très sélectif mais peu sensible.
-
Un réglage particulièrement utile est de mettre le seuil
bas juste en dessous du plus bas score significatif, et le
seuil haut juste en dessus : la gradation des niveaux de
gris s'étend ainsi sur toute la gamme des scores
significatifs. Toutefois, ce n'est pas toujours possible.
-
On observe une diagonale continue (et suivant la protéine, d'autres
caractéristiques comme des répétitions)..
-
-
Oui, dans tous les cas les séquences ont des régions similaires
-
Seulement dans le cas c.
-
On obtient la meilleure sensibilité avec Lalign, en utilisant
une matrice peu sélective (ex. Blosum30). La sélectivité s'en
trouve réduite d'autant.
-
Des pénalités plus élevées donnent des alignements plus
nombreux et plus courts. Les matrices peu sélectives donnent
des alignements plus longs, mais de moindre similarité.
-
Une grande taille de fenêtre est peu sensible mais assez
sélective (i.e., les régions ressortent bien mais la
résolution est faible) ; une petite fenêtre donne des
détails plus fins, mais avec un bruit de fond élevé.
-
Les comparaisons graphiques montrent immédiatement toutes les
régions de similitude, ainsi que leurs emplacements
respectifs.
-
-
La grosse tache carrée est une région de basse complexité,
en l'occurence une région riche en sérine.
-
Il s'agit d'un ARN messager mature, contre le gène
correspondant. Les interruptions de la diagonale
correspondent aux introns.
-
Il s'agit d'un cDNA dans lequel la transcriptase réverse a
fait un tour sur elle-meme : la fin de la séquence est le
complément inverse du début, d'où la deuxième
diagonale dans l'autre sens.
Thomas Junier
Last modified: Thu Dec 10 17:00:33 CET 1998