Lista de Discussão da Disciplina Biologia Computacional


[Prévia por Data][Próxima por Data]
[Prévia por Assunto][Próxima por Assunto]
[Índice por Data][Índice por Assunto]
[Envie uma nova mensagem para a lista] [Responda esta mensagem]

Detalhes sobre programas de Biologia (longo!)




	Há alguns dias, eu enviei uma mensagem para a lista dizendo
	que a Debian GNU/Linux possuía diversos programas empacotados
	relacionados a Biologia Computacional.

	Eu estive conversando com o professor Zé Augusto e ele pediu
	que eu desse uma pesquisada um pouco mais a fundo sobre os
	programas que eu encontrei.

	Aqui estão alguns detalhes a mais sobre os programas:

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
	* blast2: esta é a versão oficial do NCBI (National Center for
          Biotechnology Information) do programa de buscas de padrões
          em bancos de dados.

	  O pacote da Debian inclui apenas o programa e não os dados
	  (imagino que isso seja porque os dados não sejam livres e/ou
	  sejam muitos).

	  O pacote da Debian possui 79KB comprimido e 130KB instalado.
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
	* readseq: este é um pacote cuja função é prover leitura e
          escrita de arquivos de dados de Biologia (por exemplo,
          arquivos que contenham alinhamentos e/ou informações sobre
          proteínas).

	  Pelo que eu entendi, ele funciona como uma biblioteca
	  compartilhada e é usado por diversos outros pacotes da
	  Debian.

	  A biblioteca entende 18 formatos, sendo que 16 são formatos
	  de saída e 17 são formatos de entrada.

	  Observação: eu estive dando uma olhada e esta biblioteca é
	  *bem* velhinha. A versão mais nova que eu consegui encontrar
	  na rede foi uma versão de 1 de fevereiro de 1993. Obviamente
	  outros milhares de formatos devem ter sido inventados desde
	  então. :-)

	  O pacote da Debian possui 49KB comprimido e 95KB instalado.
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
	* fastlink: eu infelizmente não consegui muita informação
	  sobre este programa além da pouca descrição do pacote da
	  Debian:

	  [Biology] A faster version of pedigree programs of Linkage
	  Fastlink is much faster than the original Linkage but does
	  not implement all the programs.

	  O pacote da Debian possui 841KB comprimido e 1185KB
	  instalado.
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
	* fastDNAml: este daqui é um programa para mexer com árvores
          filogenéticas. Segundo a própria homepage do programa, ele é
	  destinado a:

	  "fastDNAml is a program for estimating maximum likelihood
	  phylogenetic trees from nucleotide sequences."

	  Um comentário (ainda que não uma definição) sobre o
	  significado de maximum likelihood phylogenetic trees" está
	  na página 211 do livro do Meidanis, no primeiro parágrafo
	  das notas bibliográficas:

	  "As we mentioned at the beginning of this chapter, our
	  coverage of phylogenetic tree algorithms is narrow relative
	  to the vastness of the field. In particular, we have not
	  covered algorithms based on statistical analyses of the
	  problem, commonly known as maximum likelihood methods."

	  Obviamente, quando vimos algoritmos para árvores
	  filogenéticas nós não levamos em consideração nenhuma
	  análise estatística.

	  Este programa é baseado em um outro programa (aparentemente
	  famoso) chamado PHYLIP (the PHYLogeny Inference Package) que
	  foi escrito por Joseph Felsenstein.

	  O endereço (notem a URL :-) ) do fastDNAml é:
	  <http://geta.life.uiuc.edu/~gary/programs/fastDNAml.html>

	  Apenas por curiosidade, uma das sub-páginas de <www.gnu.org>
	  aponta para o link acima do fastDNAml.

	  O endereço do PHYLIP é:
	  <http://evolution.genetics.washington.edu/phylip/general.html>

	  O pacote da Debian do fastDNAml possui 55KB comprimido e
	  176KB instalado.

	  O pacote da Debian do PHYLIP possui 650BK comprimido e
	  1205KB instalado (notem a diferença de tamanho).
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
	* ncbi-tools6 e ncbi-tools6-dev: diversas bibliotecas
	  dinâmicas desenvolvidas pelo NCBI que são usadas por outros
	  pacotes para aplicações de biologia computacional.

	  Como é tradição na Debian, o pacote ncbi-tools6 possui
	  apenas as bibliotecas dinâmicas necessárias para rodar os
	  programas (como usuários), enquanto aqueles que desejarem
	  desenvolver programas que usem estas bibliotecas devem
	  instalar o pacote ncbi-tools6-dev (por exemplo, os pacotes
	  *-dev incluem arquivos .h para desenvolvimento em linguagem
	  C).

	  O pacote blast2 usa o pacote ncbi-tools6.

	  O pacote da Debian do ncbi-tools6 possui 1428KB comprimido e
	  4540KB instalado.

	  O pacote da Debian do ncbi-tools6 possui 2765KB comprimido e
	  7088KB (!) instalado.
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
	* bioperl: aqui, o filet-mignon dos pacotes, aparentemente.

	  O bioperl é, talvez, o pacote dos que eu vi na Debian que
	  possui o maior desenvolvimento. A idéia aqui é construir
	  módulos para o Perl (algo mais ou menos parecido como
	  bibliotecas), para deixá-los disponíveis no CPAN (para quem
	  conhece o CTAN, o CPAN está para o Perl assim como o CTAN
	  está para o (La)TeX).

	  Há muita informação sobre o bioperl (mas muita *MESMO*) no
	  site: <http://bio.perl.org>.

	  Lá vocês encontrarão desde documentação até código,
	  passando, inclusive, por alguns FAQs e por uma tabela
	  bastante informativa, contendo quais são os módulos que
	  estão sendo implementados, sua importância e quanto por
	  cento de código que já foi implementado de cada área.

	  Eu recomendo fortemente que vocês dêem uma olhadinha na
	  tabela em: <http://bio.perl.org/Projects/areas.html>.

	  Um pedacinho desta página:

	  "Areas of interest 

	  This list is to idenitify key areas where bioperl might
	  provide sensible solutions for bioinformatics.

          For each area we give a number of criteria about its status
          in bioperl:

	    - an indicator of importance ranked from 0 to 5, with 0
              being the most important

	    - a percentage of how much functionality currently in
              bioperl that covers this area

	    - whether or not this functionality exists in a working
	      form in the current CORE modules (as of Feburary 1999)."

	  O pacote da Debian do bioperl possui 916KB comprimido e
	  1993KB instalado.

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -

	Bem, é isso, pessoal. Espero que vocês tenham apreciado os
	comentários.


	Abraços, Roger...
	  

-- 
=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=
  Rogerio Brito - rbrito@iname.com - http://www.ime.usp.br/~rbrito/
     Nectar homepage: http://www.linux.ime.usp.br/~rbrito/opeth/
=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=