Natureza: Novo estudo usa inteligência artificial para decifrar o código de regulação genética

Dec 29, 2023

Deixe um recado

Os organismos são compostos de milhares de proteínas diferentes, cada uma das quais é codificada por um gene específico. Para que um tipo de célula adquira sua identidade, forma e função únicas, os genes devem ser ativados por "potenciadores". Os cientistas há muito tentam decifrar o código de como os potenciadores funcionam. Agora, em um novo estudo, o laboratório de Alexander Stark no Instituto de Patologia Molecular do Biocentro de Viena, na Áustria, e o laboratório de Eileen Furlong no Laboratório Europeu de Biologia Molecular usaram genômica e inteligência artificial para decifrar um segundo código genético, o subjacente à regulação genética. O artigo, intitulado "Design direcionado de potenciadores sintéticos para tecidos selecionados no embrião de Drosophila", foi publicado online em 12 de dezembro de 2023, na Nature.
Cada célula saudável de um organismo complexo contém exatamente a mesma cópia do genoma, que inclui milhares de genes, os projetos para a construção de proteínas. Para formar diferentes tipos de células, tecidos e órgãos, mecanismos adicionais são necessários para ligar e desligar a expressão de genes específicos com alta precisão.
Como segmentos de DNA no genoma, os intensificadores são um elemento-chave para ativar genes, e o laboratório Stark assumiu a missão de decifrar o código que liga a sequência de DNA de um intensificador à sua função reguladora de genes. Embora os primeiros intensificadores tenham sido descobertos no início dos anos 1980, foi somente na última década que os cientistas desenvolveram maneiras de identificar experimentalmente os intensificadores.
Com base nessa fundação, o laboratório Stark e os colaboradores agora estão mirando em três tarefas que, juntas, constituem uma meta aparentemente impossível de longo prazo: prever a atividade de intensificadores com base em suas sequências de DNA; prever as consequências de mutações de intensificadores; e projetar intensificadores do zero para tecidos específicos. Em outras palavras: ler, entender e escrever um segundo código genético.
Com os recentes avanços em genômica e inteligência artificial, surgiu a oportunidade de decifrar esse código. Esses autores desenvolveram um poderoso modelo de aprendizado profundo e aprendizado de transferência e o treinaram com uma grande quantidade de dados obtidos de estudos anteriores em Drosophila melanogaster, um organismo modelo amplamente usado em biologia do desenvolvimento.
Do laboratório para a IA e vice-versa
Primeiro, tais modelos foram treinados usando sequências de DNA de todo o genoma e dados de acessibilidade de DNA correspondentes. O modelo de aprendizado profundo foi então usado para inicializar o ajuste fino do modelo de aprendizado de migração, no qual o modelo de aprendizado de migração aprende a associar diretamente sequências de DNA com atividade específica do intensificador.
Stark diz: "Você pode explicar o aprendizado de migração desta forma: imagine que você quer treinar um modelo para reconhecer gatos em fotos, mas você tem muito poucas fotos de gatos disponíveis. Mas você tem muitas fotos de cachorros. Então, você primeiro treina um modelo de IA nas fotos de cachorros, então o ajusta em uma segunda etapa, e agora você pode reconhecer gatos."

news-836-394

Imagem da Nature, 2023, doi:10.1038/s41586-023-06905-9.
Por meio da aprendizagem por transferência, o modelo foi capaz de prever a atividade intensificadora em cinco tipos de tecidos em embriões de Drosophila: sistema nervoso central, subseções cerebrais, epiderme, intestino e músculo.
Com base nessa previsão, esses autores levaram seus esforços de pesquisa do mundo abstrato de big data e inteligência artificial de volta para a bancada do laboratório. Usando ferramentas sofisticadas de biologia molecular, eles testaram 40 intensificadores sintéticos projetados computacionalmente em embriões vivos de Drosophila. Na verdade, esses intensificadores são ativos e impulsionam a expressão genética no tecido-alvo.
A capacidade de construir intensificadores sintéticos com propriedades específicas oferece oportunidades sem precedentes para controlar a expressão direcionada de genes", diz Bernardo de Almeida do Vienna Biocenter, primeiro autor do artigo. Aplicações futuras podem ser em biologia sintética ou terapia genética, onde o design preciso e a manipulação de padrões de expressão genética são um pré-requisito."
Para Stark, no entanto, fornecer novos insights sobre um fenômeno que é fundamental para a vida é o aspecto mais importante desta pesquisa: "Cerca de 60 anos atrás, cientistas aprenderam como o primeiro código genético funcionava, como o projeto molecular do DNA era traduzido em proteínas. Com o poder da genômica e da inteligência artificial, agora conseguimos decifrar o segundo código genético da vida, ou seja, como a atividade genética é controlada."
Enviar inquérito