Dando continuidade ao ciclo de seminário do programa de pós-graduação em estatística da UFPE - 2013 teremos
Título: Dados estatísticos sobre a vida biológica: a aleatoriedade como marca indelével no genoma das espécies.
Palestrante:ProfHélio Magalhães de Oliveira, Docteur de l’ENST, CTG-UFPE
Departamento de Eletrônica & Sistemas
Universidade Federal de Pernambuco UFPE
Data: 21 de agosto de 2013 (quarta-feira)
Horário: 16:00 horas
Local: Auditório Ruy Gomes - Departamento de Estatística da UFPE, Segundo andar do CCEN
Resumo
Apesar de ser amplamente conhecido, o mapeamento de DNA em proteínas permanece como uma das descobertas importantes sobre a vida. Uma abordagem para um cálculo aproximado do número de genes de um genoma é apresentada, a qual leva em consideração o valor esperado do comprimento das proteínas nas espécies. Uma série de vírus, bactérias e até genomas eucarióticos são examinados. Dados estatísticos de genomas são apresentados, os quais sugerem o tamanho médio de proteína de uma espécie como sendo um critério para avaliar a complexidade da vida. A distribuição do gene humano nos 23 cromossomos é investigada, enfatizando a taxa de genômica, o comprimento médio de éxons, e a média de éxons por gene. Mostra-se que para armazenar a lista completa de todos os genes de um ser humano definitivamente requer menos do que 10 MB. Responde-se também, até certo ponto, uma série de questões sobre íntrons. Ilumina-se como a diferença entre a transcrição eucariótica e a procariótica surgiu. Argumentos contra a teoria "introns-early" são apresentados. Sugere-se que os íntrons tenham gradualmente aparecido nas células eucarióticas como um mecanismo (Darwiniano) probabilístico para proteger a replicação. Os mecanismos envolvidos no aumento da confiabilidade da replicação do DNA são elucidados. Códigos evolutivos biológicos correspondem ao paradigma de Shannon: eles são longos códigos, verdadeiramente aleatórios. Sugere-se, portanto, que não sejam feitos esforços na descoberta de propriedades funcionais de controle de erro dos íntrons, muito menos em pesquisar na estrutura por trás de íntrons.
Palavras-chave: complexidade do genoma, a informação genômica, o tamanho médio de proteínas, genoma humano, íntrons, a evolução biológica, os códigos de controle de erro.
Title: Statistical figures about biological life: randomness as indelible imprint in the genome of species.
Abstract
Despite the fact that it is extensively known, the DNA mapping into proteins remains as one of the relevant discoveries about life. An approach for approximately calculating the number of genes in a genome is presented, which takes into account the average protein length expected for the species. A number of virus, bacterial and eukaryotic genomes are scrutinized. Genome figures are presented, which support the average protein size of a species as a criterion for assessing life complexity. The human gene distribution in the 23 chromosomes is investigated emphasizing the genomic rate, the mean "exon" length, and the mean "exons" per gene. It is shown that storing all genes of a single human definitely requires less than 10 MB. Answers are also given, to a certain extent, a number of inquiries about introns. It is enlightened why the difference between eukaryotic and prokaryotic transcription arise. Arguments in opposition to the "introns-early theory" are presented. It is suggested that introns have gradually took place in eukaryotic cells as a (Darwinian) probabilistic mechanism to protect replication. We elucidade the mechanisms involved in the augmenting the reliability of the DNA. Biological evolutionary codes match Shannon's paradigm: they are long truly random codes. It is suggested therefore that effort for discovering introns functional error-control properties should not be made, nor should structure be searched behind introns.
Keywords: Genome complexity, genomic information, average protein size, human genome, introns, biological evolution, error-control codes.