Lista de Discussão da Disciplina Biologia Computacional
[Prévia por Data][Próxima por Data]
[Prévia por Assunto][Próxima por Assunto]
[Índice por Data][Índice por Assunto]
[Envie uma nova mensagem para a lista]
[Responda esta mensagem]
Detalhes sobre programas de Biologia (longo!)
- Subject: Detalhes sobre programas de Biologia (longo!)
- From: Rogerio Brito <rbrito@iname.com>
- Date: Fri, 22 Oct 1999 02:00:38 -0200
Há alguns dias, eu enviei uma mensagem para a lista dizendo
que a Debian GNU/Linux possuía diversos programas empacotados
relacionados a Biologia Computacional.
Eu estive conversando com o professor Zé Augusto e ele pediu
que eu desse uma pesquisada um pouco mais a fundo sobre os
programas que eu encontrei.
Aqui estão alguns detalhes a mais sobre os programas:
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
* blast2: esta é a versão oficial do NCBI (National Center for
Biotechnology Information) do programa de buscas de padrões
em bancos de dados.
O pacote da Debian inclui apenas o programa e não os dados
(imagino que isso seja porque os dados não sejam livres e/ou
sejam muitos).
O pacote da Debian possui 79KB comprimido e 130KB instalado.
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
* readseq: este é um pacote cuja função é prover leitura e
escrita de arquivos de dados de Biologia (por exemplo,
arquivos que contenham alinhamentos e/ou informações sobre
proteínas).
Pelo que eu entendi, ele funciona como uma biblioteca
compartilhada e é usado por diversos outros pacotes da
Debian.
A biblioteca entende 18 formatos, sendo que 16 são formatos
de saída e 17 são formatos de entrada.
Observação: eu estive dando uma olhada e esta biblioteca é
*bem* velhinha. A versão mais nova que eu consegui encontrar
na rede foi uma versão de 1 de fevereiro de 1993. Obviamente
outros milhares de formatos devem ter sido inventados desde
então. :-)
O pacote da Debian possui 49KB comprimido e 95KB instalado.
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
* fastlink: eu infelizmente não consegui muita informação
sobre este programa além da pouca descrição do pacote da
Debian:
[Biology] A faster version of pedigree programs of Linkage
Fastlink is much faster than the original Linkage but does
not implement all the programs.
O pacote da Debian possui 841KB comprimido e 1185KB
instalado.
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
* fastDNAml: este daqui é um programa para mexer com árvores
filogenéticas. Segundo a própria homepage do programa, ele é
destinado a:
"fastDNAml is a program for estimating maximum likelihood
phylogenetic trees from nucleotide sequences."
Um comentário (ainda que não uma definição) sobre o
significado de maximum likelihood phylogenetic trees" está
na página 211 do livro do Meidanis, no primeiro parágrafo
das notas bibliográficas:
"As we mentioned at the beginning of this chapter, our
coverage of phylogenetic tree algorithms is narrow relative
to the vastness of the field. In particular, we have not
covered algorithms based on statistical analyses of the
problem, commonly known as maximum likelihood methods."
Obviamente, quando vimos algoritmos para árvores
filogenéticas nós não levamos em consideração nenhuma
análise estatística.
Este programa é baseado em um outro programa (aparentemente
famoso) chamado PHYLIP (the PHYLogeny Inference Package) que
foi escrito por Joseph Felsenstein.
O endereço (notem a URL :-) ) do fastDNAml é:
<http://geta.life.uiuc.edu/~gary/programs/fastDNAml.html>
Apenas por curiosidade, uma das sub-páginas de <www.gnu.org>
aponta para o link acima do fastDNAml.
O endereço do PHYLIP é:
<http://evolution.genetics.washington.edu/phylip/general.html>
O pacote da Debian do fastDNAml possui 55KB comprimido e
176KB instalado.
O pacote da Debian do PHYLIP possui 650BK comprimido e
1205KB instalado (notem a diferença de tamanho).
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
* ncbi-tools6 e ncbi-tools6-dev: diversas bibliotecas
dinâmicas desenvolvidas pelo NCBI que são usadas por outros
pacotes para aplicações de biologia computacional.
Como é tradição na Debian, o pacote ncbi-tools6 possui
apenas as bibliotecas dinâmicas necessárias para rodar os
programas (como usuários), enquanto aqueles que desejarem
desenvolver programas que usem estas bibliotecas devem
instalar o pacote ncbi-tools6-dev (por exemplo, os pacotes
*-dev incluem arquivos .h para desenvolvimento em linguagem
C).
O pacote blast2 usa o pacote ncbi-tools6.
O pacote da Debian do ncbi-tools6 possui 1428KB comprimido e
4540KB instalado.
O pacote da Debian do ncbi-tools6 possui 2765KB comprimido e
7088KB (!) instalado.
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
* bioperl: aqui, o filet-mignon dos pacotes, aparentemente.
O bioperl é, talvez, o pacote dos que eu vi na Debian que
possui o maior desenvolvimento. A idéia aqui é construir
módulos para o Perl (algo mais ou menos parecido como
bibliotecas), para deixá-los disponíveis no CPAN (para quem
conhece o CTAN, o CPAN está para o Perl assim como o CTAN
está para o (La)TeX).
Há muita informação sobre o bioperl (mas muita *MESMO*) no
site: <http://bio.perl.org>.
Lá vocês encontrarão desde documentação até código,
passando, inclusive, por alguns FAQs e por uma tabela
bastante informativa, contendo quais são os módulos que
estão sendo implementados, sua importância e quanto por
cento de código que já foi implementado de cada área.
Eu recomendo fortemente que vocês dêem uma olhadinha na
tabela em: <http://bio.perl.org/Projects/areas.html>.
Um pedacinho desta página:
"Areas of interest
This list is to idenitify key areas where bioperl might
provide sensible solutions for bioinformatics.
For each area we give a number of criteria about its status
in bioperl:
- an indicator of importance ranked from 0 to 5, with 0
being the most important
- a percentage of how much functionality currently in
bioperl that covers this area
- whether or not this functionality exists in a working
form in the current CORE modules (as of Feburary 1999)."
O pacote da Debian do bioperl possui 916KB comprimido e
1993KB instalado.
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Bem, é isso, pessoal. Espero que vocês tenham apreciado os
comentários.
Abraços, Roger...
--
=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=
Rogerio Brito - rbrito@iname.com - http://www.ime.usp.br/~rbrito/
Nectar homepage: http://www.linux.ime.usp.br/~rbrito/opeth/
=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=