A Biologia de Sistemas é a área que estuda a interação entre os diversos componentes de sistemas biológicos. Muito comumente, recorre-se à definição do paradigma seguido pela biologia de sistemas como a antítese do reducionismo, o holismo. De modo simplificado e muito contestado, diz-se que o reducionismo biológico descreve um sistema como nada mais que a soma de suas partes [1]. Uma das críticas a essa definição é que, ainda que um sistema seja a soma de partes menores, esse sistema pode possuir propriedades alheias a essas partes isoladas. Desse modo, o objetivo do holismo nesse contexto não é de substituir o reducionismo biológico, mas de complementá-lo. O holismo, do grego holos,que significa inteiro ou todo, parte do pensamento de que as propriedades de um sistema não podem ser explicadas meramente pela soma de suas partes menores. Isso implica que o sistema como um todo determina como se comportam essas partes menores. Com esse pensamento em mente, veio a calhar a representação de alguns sistemas biológicos através de grafos.

Uma rede, ou grafo, pode ser descrita como uma forma de representar a interação entre componentes de um sistema. Esses componentes são chamados de nós ou vértices, enquanto que a interação entre eles é representada através de uma linha e chamada de aresta. As redes complexas são caracterizadas por sua capacidade de modelar sistemas complexos, como relacionamentos existentes na natureza, isto é, quando suas propriedades não são uma consequência natural de seus elementos constituintes vistos isoladamente [2]. Embora existam vários tipos de redes biológicas, a ideia aqui não é falar sobre os vários tipos e suas propriedades, mas como essas redes podem facilitar nossa compreensão desses sistemas. A título de curiosidade, no entanto, dois tipos de redes bastante comuns na Bioinformática são as redes de interação proteína-proteína (PPI Networks ou Protein-Protein Interaction Networks) e redes regulatórias (Gene Regulatory Networks). Uma vez que essas redes têm como objetivo representar um “todo”, é comum ouvir palavrinhas terminadas com “oma” (ou omics, em inglês). A totalidade dos seus genes é o seu genoma. A totalidade de interações entre proteínas (que você visualiza com as redes PPI) é seu interactoma e a totalidade de regulações de transcritos (produções de moléculas de RNA a partir de DNA, a transcrição) de transcriptoma.

Você sabia que o DNA contido no núcleo de cada célula do seu corpo, se estirado em linha reta, mediria mais ou menos 2 metros? Se levarmos em conta que seu corpo tem mais ou menos 37,2 trilhões de células, de acordo com um artigo da Super Interessante, você teria “… 74,4 trilhões de quilômetros de material genético dentro de você. É o suficiente para ir e voltar de Plutão cinco vezes – no ponto da órbita do planeta em que ele passa mais longe da Terra, que fique claro.” Essa molécula chamada de DNA, a maior molécula conhecida pelo homem, contém o seu genoma que tem mais de 60 mil genes, se você considerar genes codificantes (que produzem proteínas funcionais) e genes não codificantes (que até pouco, eram em grande parte chamados de DNA lixo). Devido a um processo chamado de splicing alternativo, um mesmo gene pode dar origem a várias proteínas e, dado que o RNA é de certo modo o estágio intermediário entre o gene e a proteína, também origina vários transcritos (RNAs) diferentes. Já deve estar dando um nó na sua cabeça essa quantidade toda, né? A propósito, não fosse um sistema de compactação de material genético, nós provavelmente não conseguiríamos abrigar tanto material genético dentro de nossas pequeninas células :-P

A todo instante, nosso transcriptoma está sendo alterado. Novos genes estão sendo regulados para expressar mais (dar origem a mais transcritos, moléculas de RNAs), menos, ou simplesmente parar de ser expresso. O interessante é que isso não se restringe a nós humanos! Enquanto pesquisavam o que acontecia quando se tocava em plantas (dentre outros tipos de ações), cientistas observaram algo surpreendente e inesperado. Milhares de genes tiveram suas quantidades alteradas em questões de minutos após gotículas de água tocarem suas folhas (e retornaram ao nível de expressão habitual após alguns minutos). E você achando que plantas não sentiam nada, né?!

Sem entrar em detalhes sobre o maquinário que é responsável pela “transformação” da informação do gene (região do DNA) em um produto (a proteína), existem atores bastante importantes e que sua apresentação é indispensável: Os fatores de transcrição. Embora não sejam os únicos responsáveis por “ativar” um gene ou “desativar” um gene, esse papel quase sempre é atribuído a eles. Como não poderia ser diferente, mais de um fator de transcrição podem regular a expressão de um mesmo gene, ou um fator de transcrição apenas regular vários genes diferentes. Já ouviu aquela frase de que cada pessoa que passa por nós está travando uma batalha invisível? Cada célula do seu corpo está travando uma batalha invisível também :-P

Chegando nesse ponto, acho que já ficou claro que é difícil visualizar isso tudo, não é? Na verdade, acho que já faz algum tempo que você tenta visualizar isso na sua cabeça e não consegue. É aí que entram as redes.

Acima, nós temos uma sub-rede regulatória. Os grandes círculos preenchidos de cinza são os fatores de transcrição, proteínas que regulam os genes. Os genes são representados como os pequenos círculos em vermelho, cinza ou azul. Nessa sub-rede especificamente não existem nós cinzas, mas o que seriam eles? Quando a maiorexpressão do TF1 provocar uma maiorexpressão do GENE1, nós teremos o GENE1 como um nó vermelho, e quando tivermos uma maiorexpressão de TF1 provocando uma menorexpressão no GENE1, teremos o GENE1 como um nó azul. Como vocês podem ver, existem genes que são regulados tanto pelo TF1 quanto pelo TF2. Se os TFs estão antagonizando na regulação, nós teremos um gene representado através de um nó cinza. Um exemplo disso seria o TF1 regulando positivamente (induzindo maior expressão) e o TF2 regulando negativamente (induzindo menor expressão). Através desse tipo de visualização, aliada a outros recursos, é possível identificar alvos terapêuticos, além de produzir mais conhecimento sobre o suposto funcionamento dos processos biológicos. A literatura pode achar que o TF1 é responsável por uma determinada função quando, na verdade, essa função é de um determinado gene ou grupos de genes regulados por esse fator de transcrição. Se as coisas já não estavam complicadas o suficiente, existem outros bloquinhos nessa brincadeira que regulamexpressãogênica, mas isso é papo para um outro artigo ;-)

Ainda que se faça uso das redes, existem casos onde é impraticável realizar uma análise visual. O transcriptoma de eucariotos, como é o caso do ser humano, é bem grande. E não para aí, para plantas é ainda pior! Já para visualizar sub-redes, é um recurso bastante poderoso, o que implica em desenvolver técnicas para identificar sub-redes relevantes contidas no grafo total.

Rede de Transcrição de Câncer de Mama [6]

Caso você queira se aprofundar e fazer alguns experimentos com redes regulatórias, recomendo os pacotes RTN e RedeR, que podem ser encontrados no Bioconductor. O RTN possui um dataset incluído no pacote para que você possa experimentar a ferramenta seguindo o manual. Além disso, existem repositórios públicos com dados para se fazer análises como o Gene Expression Omnibus (GEO) e o ArrayExpress.

Happy Hacking, Happy Science :-)

Imagem de capa:

Rede de Interação Proteína-Proteína da Levedura [0]


Marcel da Câmara Ribeiro Dantas. Engenheiro de Computação e Automação (UFRN), com larga experiência em sistemas para saúde e dispositivos biomédicos, especialista em Big Data pelo IMD – UFRN, onde estudou dados de expressão de tumores. Mestrando em Bioinformática pela UFRN, onde pôde se aprofundar na rede regulatória do Sarcoma de Ewing e analisar seus mestres reguladores, e recém-aprovado no doutorado da Sorbonne Université, onde irá estudar análise de causa e efeito em dados de pacientes com câncer de mama.