Comparaisons 2 à 2 : réponses

    1. Local.
    2. Il s'agit du pourcentage de résidus identiques dans l'alignement concerné.
    3. Le symbole ":" désigne une paire de résidus identiques, "." désigne une paire de résidus similaires.
    4. Quand deux résidus différents sont biochimiquement proches (par leur charge, leur polarité, leur taille, etc.), leur substitution est fréquente et ils sont notés par ".". Les substitutions rarement observées sont laissées en blanc. C'est la matrice de substitutions qui sert de référence.
    5. Lorsque deux acides aminés sont dissemblables, il arrive que le score de l'alignement soit meilleur en décalant une partie de la séquence, i.e. en introduisant une lacune. Ceci dépend des pénalités d'ouverture et d'extension, ainsi que de la matrice de substitution.
    1. L'intensité du point en (i,j) représente le degré de similarité entre la séquence horizontale autour du ième résidu et la séquence verticale autour du jème résidu. La région prise en compte est une fenêtre centrée sur i et j, respectivement. Ces scores dépendent de la matrice de substitution.
    2. Les seuils permettent de mettre en blanc ou noir tous les points dont le score est inférieur ou supérieur à une certaine valeur, ce qui permet par exemple d'éliminer le bruit de fond.
    3. Quand les deux seuils sont bas, on distingue mal le signal du bruit de fond : la sensibilité est bonne mais la sélectivité est mauvaise. Quand ils sont hauts, on est très sélectif mais peu sensible.
    4. Un réglage particulièrement utile est de mettre le seuil bas juste en dessous du plus bas score significatif, et le seuil haut juste en dessus : la gradation des niveaux de gris s'étend ainsi sur toute la gamme des scores significatifs. Toutefois, ce n'est pas toujours possible.
    5. On observe une diagonale continue (et suivant la protéine, d'autres caractéristiques comme des répétitions)..
    1. Oui, dans tous les cas les séquences ont des régions similaires
    2. Seulement dans le cas c.
    3. On obtient la meilleure sensibilité avec Lalign, en utilisant une matrice peu sélective (ex. Blosum30). La sélectivité s'en trouve réduite d'autant.
    4. Des pénalités plus élevées donnent des alignements plus nombreux et plus courts. Les matrices peu sélectives donnent des alignements plus longs, mais de moindre similarité.
    5. Une grande taille de fenêtre est peu sensible mais assez sélective (i.e., les régions ressortent bien mais la résolution est faible) ; une petite fenêtre donne des détails plus fins, mais avec un bruit de fond élevé.
    6. Les comparaisons graphiques montrent immédiatement toutes les régions de similitude, ainsi que leurs emplacements respectifs.
    1. La grosse tache carrée est une région de basse complexité, en l'occurence une région riche en sérine.
    2. Il s'agit d'un ARN messager mature, contre le gène correspondant. Les interruptions de la diagonale correspondent aux introns.
    3. Il s'agit d'un cDNA dans lequel la transcriptase réverse a fait un tour sur elle-meme : la fin de la séquence est le complément inverse du début, d'où la deuxième diagonale dans l'autre sens.

Thomas Junier
Last modified: Thu Dec 10 17:00:33 CET 1998