Lista de Discussão de MAC 5726 - Biologia Computacional
[Prévia por Data][Próxima por Data]
[Prévia por Assunto][Próxima por Assunto]
[Índice por Data][Índice por Assunto]
[Envie uma nova mensagem para a lista]
[Responda esta mensagem]
RE: Base desconhecida?
- Subject: RE: Base desconhecida?
- From: "Jose Augusto R. Soares" <jose@ime.usp.br>
- Date: Tue, 04 Sep 2001 11:45:49 -0300
Oi Jorge,
As bases são quatro mesmo. O que acontece é que pode ter uma posição
na seqüência que não se sabe exatamente que base aparece lá.
Para resolver isso, foram feitos códigos para todos os subconjuntos
não vazios das 4 bases, resultando em (2 elevado a 4) - 1 = 15
códigos.
Se aparecer um R como base isso quer dizer que se sabe que é um A ou G
naquela posição, mas não se tem certeza disso.
Segue abaixo o significado de cada um dos códigos.
Zé Augusto
PS.: Não se preocupem com esse detalhe na hora de fazer o
trabalho. Podem considerar pontuação 0 para qualquer alinhamento
envolvendo esses códigos.
(da página http://laguerre.psc.edu/general/software/packages/maxsegs/user.html#a11)
NAME CODE MEANING
Adenine A A
Cytosine C C
Guanine G G
Thymine/Uracil T/U T/U
M A or C
R A or G
W A or T/U
S C or G
Y C or T/U
K G or T/U
V A or C or G
H A or C or T/U
D A or G or T/U
B C or G or T/U
X/N A or C or G or T/U
Jorge F. Del Teglia wrote (on Sep 4, 2001):
> Olá,
>
> Estive olhando as seqüências de bases solicitadas para o EP, e no
> particular caso da "J00413 - Mouse beta-globin major gene", na posição 279
> da sequência (tem 6532 bases), tem uma letra 'N' .
> Pelo que lembro, as bases validas são A, G, C, T e U.
>
> Alguém pode-me explicar?
>
> Obrigado,
>
>
> -----------------------------------------------
> Jorge F. Del Teglia
>
> jorgefdt@uol.com.br
> jorgefdt@hotmail.com