O que é um grafo topológico? O que é uma floresta radicada?

Este capítulo apresenta uma importante classe de grafos: os grafos topológicos (também conhecidos como grafos topologicamente numerados, ou grafos topologicamente ordenados). Grafos topológicos são como animais domesticados, enquanto grafos não topológicos são como animais selvagens.

A definição de grafos topológicos exige que os vértices sejam numerados de uma certa maneira. Assim, cada grafo é acompanhado de uma numeração (= ranking) dos vértices, ou seja, uma atribuição de números inteiros aos vértices. Essa numeração dos vértices será representada por um vetor cujos índices são vértices e cujos elementos são números inteiros.

Três tipos especiais de grafos topológicos também serão apresentados: as florestas radicadas, as árvores radicadas, e os grafos bipartidos dirigidos.

Grafos topológicos

Um grafo é topológico se admite uma numeração topológica dos vértices. Uma numeração topo[] dos vértices é topológica se

para todo arco v-w. (Note que a numeração dos vértices não tem relação alguma com os nomes 0 1 ... V-1 dos vértices.) Se os vértices do grafo forem dispostos ao longo de um linha vertical em ordem crescente da numeração topológica, todos os arcos apontarão para baixo. A seguinte função recebe uma numeração topo[0..V-1] de um grafo G representado por listas de adjacência e decide se essa numeração é topológica:

A maioria dos grafos não tem numeração topológica. Por outro lado, um grafo pode ter várias numerações topológicas diferentes.

Exemplo A. Como os vértices de nossos grafos são números inteiros, podemos compará-los. Se v < w para todo arco v-w então o grafo é topológico. A numeração topológica nesse caso é a identidade: topo[v] ≡ v para cada v.

Exemplo B. As duas figuras abaixo representam o mesmo grafo. A segunda sugere a numeração topológica dada pelo seguinte vetor:

As três propridades são quase óbvias. Segue imediatamente das propriedades 2 e 3 que todo grafo topológico tem pelo menos uma fonte e pelo menos um sorvedouro. (A recíproca da primeira propriedade é verdadeira, mas a tecnologia necessária para provar essa recíproca só será desenvolvida nos próximos capítulos.)

Grafos topológicos aparecem naturalmente em muitas aplicações. Imagine, por exemplo, que cada vértice é uma tarefa de um grande projeto e que um arco v-w indica que a tarefa w só pode começar depois que a tarefa v tiver sido concluída. Imagina também que o projeto está a cargo de alguém que só pode executar uma tarefa por vez. Nesse caso, uma numeração topológica dá uma possível ordem de execução das tarefas. (Um exemplo concreto: a primeira providência do utilitário make é construir o grafo de dependências das tarefas e obter uma numeração topológica dos vértices do grafo.)

Variantes. [!]

Grafos topológicos podem ser discutidos em termos de três conceitos equivalentes ao de uma numeração topológica:

Esses três conceitos têm a mesma força que uma numeração topológica: um grafo tem uma numeração topológica se e somente se tem uma numeração anti-topológica, se e somente se tem uma permutação topológica, se e somente se tem uma permutação anti-topológica.

Exemplo C. Veja a permutação topológica que corresponde à numeração topo[] do exemplo B:

Exercícios 1

O que é um grafo topológico?
Considere o grafo do exemplo B. Exiba uma numeração topológica diferente da que foi dada no exemplo. A numeração não precisa ser injetiva: dois ou mais vértices podem ter o mesmo número. Exiba também uma numeração anti-topológica, uma permutação topológica dos vértices, e uma permutação anti-topológica.
Exiba uma numeração topológica do grafo da figura. A numeração não precisa ser injetiva: dois ou mais vértices podem ter o mesmo número. Exiba também uma numeração anti-topológica, uma permutação topológica, e uma permutação anti-topológica.
Mostre que o grafo-caminho definido pelo conjunto de arcos 4-1 1-5 5-0 0-2 2-3 3-6 tem uma numeração topológica. Mostre que o grafo-ciclo definido pelo conjunto de arcos 4-1 1-5 5-0 0-2 2-3 3-0 não tem numeração topológica.
Sejam s e t dois vértices de um grafo topológico. Suponha que existe um caminho de s a t. Mostre que não existe caminho de t a s.
★ Verificação de permutação topológica. Escreva uma função que receba um grafo e uma permutação vv[0..V-1] dos seus vértices e verifica se a permutação é topológica.
★ Conversão de permutação em numeração. Escreva uma função que converta uma numeração (não necessariamente topológica) dos vértices de um grafo na correspondente permutação. Escreva outra função que converta uma permutação na correspondente numeração.
★ Propriedades. Prove as três propriedades de grafos topológicos enunciadas acima.
Número de arcos. Mostre que todo grafo topológico com V vértices tem no máximo V(V−1)/2 arcos. Mostre que existem grafos topológicos com V(V−1)/2 arcos.

Um algoritmo de numeração topológica

Como encontrar uma numeração topológica de um grafo? O seguinte algoritmo de eliminação iterada de fontes responde a pergunta. Remova uma fonte do grafo; depois remova uma fonte do grafo resultante; e assim sucessivamente. (Em outras palavras, remova fontes recursivamente.) Numere os vértices — 0, 1, 2, etc. — à medida que são removidos. Se todos os vértices forem removidos, a numeração é topológica; senão, não existe numeração topológica.

A justificativa do algoritmo é simples. Note que um vértice v é removido e numerado somente depois que forem removidos e numerados todos os vértices u tais que u-v é um arco. Logo, se ambas as pontas de um arco u-v estão numeradas então o número de u é menor que o número de v. Portanto, se todos os vértices são numerados então a numeração é topológica. Suponha agora que o algoritmo termina antes que todos os vértices sejam numerados e removidos. Nesse caso, o grafo restante não tem fontes. Como todo grafo topológico tem pelo menos uma fonte, o grafo restante não é topológico. Segue daí que o grafo original também não era topológico.

Segue uma implementação ao pé da letra do algoritmo de eliminação de fontes. Como nossa estrutura de dados tem dificuldade em lidar com remoção de vértices, a implementação remove arcos:

A função é muito ineficiente. Num grafo com V vértices e A arcos, cada invocação de GRAPHindeg() consome V+A unidades de tempo e portanto cada vez que topol() procura uma fonte, gasta V(V+A) unidades de tempo no pior caso. Como tudo é repetido V vezes, temos um consumo total de V²(V+A). É muito lento! Além disso, essa implementação ao pé da letra tem o efeito indesejável de destruir o grafo.

Para fazer uma implementação eficiente do algoritmo, podemos remover arcos virtualmente, mantendo atualizado um vetor indeg[] com os graus de entrada virtuais dos vértices. Se indeg[v] ≡ 0 então v é uma fonte virtual. Além disso, para que não percamos tempo procurando essas fontes virtuais, podemos mantê-las numa fila.

Essa implementação é muito rápida: consome apenas V+A unidades de tempo, mesmo no pior caso.

Exercícios 2

Aplique o algoritmo de eliminação iterada de fontes ao grafo definido pelos arcos 0-1 0-2 0-4 1-2 2-3 4-2 4-5 5-3 6-4 6-7 7-5 .
A fila de vértices fila[comeco..fim-1] poderia ser tratada como uma pilha?

Florestas radicadas

Uma floresta radicada é um grafo topológico sem vértices com grau de entrada maior que 1. (O adjetivo radicada é importante; a palavra floresta sem o adjetivo está reservada para a versão não-dirigida do conceito.)

(É tentador pensar que florestas radicadas podem ser definidas sem referência a grafos topológicos. É tentador imaginar que todo grafo com pelo menos uma fonte e sem vértices de grau de entrada maior que 1 é uma floresta radicada. Mas isso não é verdade.)

Exemplo D. A figura mostra uma floresta radicada com arcos 4-5 5-0 5-1 ... 7-9 7-10. O seguinte vetor exibe a numeração topológica sugerida pela figura:

Propriedades. É claro que florestas radicadas não têm ciclos. É claro também que todo vértice de uma floresta radicada é término de um caminho que começa em uma fonte, e todo vértice é origem de um caminho que termina em um sorvedouro. Além disso, florestas radicadas têm a seguinte propriedade adicional, facilmente deduzida da definição:

Segue daí imediatamente que, para quaisquer dois vértices x e y, existe no máximo um caminho de x a y. Ademais, se existe um caminho de x a y então não existe caminho de y a x.

Terminologia. Usamos uma terminologia natural e sugestiva para falar sobre florestas radicadas:

O vetor de pais (= parent array) de uma floresta radicada é um vetor que associa a cada vértice (exceto uma raiz) o seu pai. Se p[] é um vetor de pais e w não é uma raiz, então p[w] é o pai de w. Se w é uma raiz, adotamos a convenção p[w] ≡ w. Para qualquer vértice w, a sequência

termina necessariamente em uma raiz. Diremos que essa sequência é a regressão (= recessional sequence) de w. O inverso dessa sequência é o caminho que leva da raiz a w (passando por todos os ancestrais de w). Por exemplo, a floresta radicada exemplo D tem o seguinte vetor de pais:

A profundidade de um vértice w numa floresta radicada é o comprimento do único caminho que começa em alguma raiz e termina em w. A altura da floresta radicada é a profundidade de um vértice de profundidade máxima. (É claro que um vértice de profundidade máxima é uma folha.)

Exercícios 3

O grafo cujos arcos são 0-1 1-2 2-3 4-5 5-6 6-7 8-9 9-10 9-11 admite uma numeração topológica? Em caso afirmativo, o grafo é uma floresta radicada?
Escreva uma função booleana eficiente isRootedForest() que decida se um grafo é uma floresta radicada.
Escreva uma função que receba uma floresta radicada e devolva uma raiz da floresta.
Exiba um grafo topológico que não seja uma floresta radicada.
Prove a seguinte propriedade fundamental, já enunciada acima: todo vértice de uma floresta radicada é término de um único caminho que começa numa fonte.
★ Caminhos a partir de uma raiz. Prove a seguinte afirmação: para quaisquer dois vértices u e z de uma floresta radicada, u é ancestral de z se e somente se o único caminho de uma raiz até z passa por u.
★ Descendentes de primos. Prove a seguinte afirmação: para quaisquer dois vértices s e x de uma floresta radicada, se s é primo de x então todo descendente de s é primo de todo descendente de x.
Nem tudo que reluz é ouro. Exiba um grafo que tem pelo menos uma fonte, não tem vértices com grau de entrada maior que 1, mas não é uma floresta radicada.
★ Número de arcos. Mostre que toda floresta radicada com V vértices tem no máximo V−1 arcos.
Vetor de pais. Escreva uma função que receba uma floresta radicada F e devolva o vetor de pais da floresta.
★ Vetor de pais. Seja p[0..V-1] um vetor cujos elementos pertencem ao conjunto 0..V-1. É verdade que p[] é o vetor de pais de alguma floresta radicada com vértices 0 1 2 ... V-1?
Escreva uma função que receba o vetor de pais de uma floresta radicada e um vértice w e imprima o caminho que leva de uma raiz da floresta até w.
★ Profundidade. Escreva uma função depth() que calcule a profundidade de um vértice v em uma floresta radicada F. (Dica: Primeiro, calcule o vetor de pais pa[] de F. Depois, delegue o cálculo da profundidade a uma função recursiva depthR() apropriada.)
★ Altura. Escreva uma função que calcule a altura de uma floresta radicada.
Atualize suas bibliotecas. Acrescente as funções sugeridas nos exercícios acima à biblioteca GRAPHmatrix que mencionamos no capítulo Estruturas de dados para grafos. Também acrescente as versões apropriadas à biblioteca GRAPHlists. Atualize os correspondentes arquivos-interface.
★ Grafo funcional. Um grafo G é funcional se não tem vértices de grau de entrada maior que 1. (Portanto, toda floresta radicada é um grafo funcional e todo grafo funcional topológico é uma floresta radicada.) 1. Mostre que todo grafo funcional pode ser representado por um vetor de pais. 2. Mostre que todo vetor pa[] indexado por um conjunto I e com valores em I (podemos dizer que os elementos de I são vértices) define um grafo funcional. 3. Mostre que quaisquer dois ciclos de um grafo funcional não têm vértices em comum. 4. Seja G um grafo funcional e R um conjunto de arcos de G que contém exatamente um arco de cada ciclo. Seja G − R o subgrafo que se obtém quando todos os arcos de R são removidos de G. Mostre que G − R é uma floresta radicada.

Árvores radicadas

Uma árvore radicada (= branching) é uma floresta radicada que tem uma só raiz. (O adjetivo radicada é importante; a palavra árvore sem o adjetivo está reservada para a versão não-dirigida do conceito.)

Propriedades. Segue imediatamente das propriedades de florestas radicadas que todo vértice de uma árvore radicada é término de um e um só caminho que começa na única raiz. Segue também que toda floresta radicada consiste em uma ou mais árvores radicadas, cada árvore radicada correspondendo a uma das raízes da floresta.

Exemplo E. A figura mostra uma árvore radicada com arcos 4-2 4-3 ... 0-5 0-8 e numeração topológica dada pelo seguinte vetor:

Exercícios 4

Verifique que o conjunto de arcos 0-1 1-2 1-3 3-4 3-5 0-6 6-7 6-8 6-9 0-10 10-11 define uma árvore radicada. Para começar, calcule o vetor de pais. Faça isso sem desenhar figuras.
Dê duas numerações topológicas diferentes para a árvore radicada do exemplo exemplo E.
Raiz tem o menor número. Seja topo[] uma numeração topológica de uma árvore radicada. Mostre que um vértice r é a raiz da árvore se e somente se topo[r] < topo[v] para todo vértice v diferente de r.
Escreva uma função booleana eficiente isRootedTree() que decida se um dado grafo é uma árvore radicada.
Nem tudo que reluz é ouro. Exiba um grafo que tem exatamente uma fonte, não tem vértices com grau de entrada maior que 1, mas não é uma árvore radicada.
Número de arcos. Mostre que toda árvore radicada com V vértices tem exatamente V−1 arcos.
Escreva uma função que receba uma árvore radicada e devolva a raiz da floresta.
★ Altura. Escreva uma função que calcule a altura de uma árvore radicada.
Atualize suas bibliotecas. Acrescente as funções sugeridas nos exercícios acima à biblioteca GRAPHmatrix que mencionamos no capítulo Estruturas de dados para grafos. Também acrescente as versões apropriadas à biblioteca GRAPHlists. Atualize os correspondentes arquivos-interface.

Grafos bipartidos dirigidos

Um grafo é bipartido dirigido se tiver uma numeração topológica com apenas dois valores: 0 e 1. (Não confunda grafo bipartido dirigido com bipartido não-dirigido.) Em outras palavras, um grafo é bipartido dirigido se existe uma numeração topo[] dos vértices tal que, para cada arco v-w, topo[v] vale 0 e topo[w] vale 1.

Grafos bipartidos dirigidos aparecem naturalmente em muitas situações. Imagine, por exemplo, que alguns vértices representam pessoas, outros vértices representam clubes, e um arco v-w significa que a pessoa v é membro do clube w. Uma versão mais concreta desse exemplo: alguns vértices representam filmes de cinema, outros representam atores e atrizes, e um arco v-w significa que o ator/atriz w teve um papel no filme v.

Propriedade. Grafos bipartidos dirigidos têm uma propriedade óbvia: todo vértice é uma fonte ou um sorvedouro.

Exemplo F. O grafo com vértices 0 1 2 3 4 e arcos 0-2 0-3 1-3 1-4 é bipartido dirigido. O seguinte vetor topo[] define a numeração topológica apropriada:

Exercícios 5

Escreva uma função booleana eficiente isDirectedBipartite() que diga se um dado grafo é bipartido dirigido. Em caso afirmativo, a função deve devolver uma numeração topológica com valores 0 e 1. Que informação o algoritmo pode devolver para comprovar uma resposta negativa?
Número de arcos. Mostre que todo grafo bipartido dirigido com V vértices tem no máximo ⌊V²/4⌋ (ou seja, o piso de V²/4) arcos.
Atualize suas bibliotecas. Acrescente as funções sugeridas nos exercícios acima à biblioteca GRAPHmatrix que mencionamos no capítulo Estruturas de dados para grafos. Também acrescente as versões apropriadas à biblioteca GRAPHlists. Atualize os correspondentes arquivos-interface.

Perguntas e respostas

Pergunta: Muitos livros usam a expressão grafo topologicamente ordenado. Por que este sítio prefere o neologismo grafo topológico?
Resposta: Porque o neologismo é mais curto…
Pergunta: Por que grafos topológicos têm esse nome? Qual a relação com a Topologia?
Resposta: O adjetivo topológico tem razões históricas que não vale a pena discutir.
Pergunta: Por que usar o adjetivo radicada? Não seria mais simples dizer apenas floresta e árvore?
Resposta: Quero reservar as palavras floresta e árvore, sem o adjetivo, para a versão não-dirigida dos dois conceitos.
Pergunta: Por que escrevo x ≡ y em vez de x = y?
Resposta: Infelizmente, o operador = tem dois significados conflitantes: em matemática ele significa igualdade, enquanto em muitas linguagens de programação ele significa atribuição. Para ser consistente com as linguagens de programação, eu poderia escrever ==. Mas isso é tipograficamente feio quando usado em texto normal. Prefiro a forma alternativa ≡ de ==, assim como prefiro a forma alternativa ≤ de <=.