Tags:
GigaTIME: ampliando a modelagem de microambientes tumorais usando população virtual gerada por IA multimodal
Por Hoifung Poon, Gerente Geral, Real-World Evidence; Jeya Maria Jose Valanarasu, Pesquisador Sênior; Naoto Usuyama, Pesquisador Principal; Sheng Wang, Professor Assistente
A convergência da transformação digital e da revolução da IA Generativa cria uma oportunidade sem precedentes para acelerar o progresso em saúde de precisão. A imunoterapia de precisão é o exemplo clássico dessa transformação. Tecnologias emergentes como a imunofluorescência multiplex (mIF) podem avaliar estados internos de células individuais juntamente com suas localizações espaciais, o que é fundamental para decifrar como os tumores interagem com o sistema imunológico. Os insights resultantes, frequentemente chamados de “gramática” do microambiente tumoral, podem ajudar a prever se um tumor responderá à imunoterapia. Se for improvável que responda, esses insights também podem orientar estratégias para reprogramar o tumor de “frio” para “quente”, aumentando sua suscetibilidade ao tratamento.
Isso é empolgante, mas o progresso é dificultado pelo alto custo e pela escalabilidade limitada da tecnologia atual. Por exemplo, obter dados de mIF de algumas dezenas de canais proteicos para uma amostra de tecido pode custar milhares de dólares, e mesmo os laboratórios mais avançados mal conseguem escalar isso para uma fração minúscula das amostras de tecido disponíveis.
Em nosso artigo publicado na revista científica Cell em 9 de dezembro, “IA multimodal gera população virtual para modelagem de microambientes tumorais (em inglês),” apresentamos o GigaTIME, um modelo multimodal de IA para traduzir lâminas de patologia de hematoxilina e eosina (H&E) disponíveis rotineiramente para imagens virtuais de mFI. Desenvolvido em colaboração com o Providence e a Universidade de Washington, o GigaTIME foi treinado com um conjunto de dados do Providence de 40 milhões de células com imagens pareadas de H&E e mIF em 21 canais proteicos. Aplicamos o GigaTIME a 14.256 pacientes com câncer de 51 hospitais e mais de mil clínicas dentro do sistema Providence. Esse esforço gerou uma população virtual de cerca de 300 mil imagens de mFI, abrangendo 24 tipos de câncer e 306 subtipos de câncer. Essa população virtual descobriu 1.234 associações estatisticamente significativas que ligam ativações da proteína mIF a atributos clínicos chave, como biomarcadores, estadiamento e sobrevivência do paciente. A validação externa independente em 10.200 pacientes do Atlas do Genoma do Câncer (TCGA) corroborou ainda mais nossas descobertas.
Até onde sabemos, este é o primeiro estudo em escala populacional do microambiente imune tumoral (TIME, em inglês) baseado em proteômica espacial. Tais estudos eram anteriormente inviáveis devido à escassez de dados de MFI. Ao traduzir lâminas de patologia H&E facilmente disponíveis em dados virtuais de alta resolução de mFI, o GigaTIME oferece uma nova estrutura de pesquisa para explorar a imuno-oncologia de precisão por meio da análise e descoberta de TIME em escala populacional. Disponibilizamos nosso modelo GigaTIME publicamente no Microsoft Foundry Labs e no Hugging Face para ajudar a acelerar a pesquisa clínica em oncologia de precisão.
“O GigaTIME tem o objetivo de desbloquear insights que antes estavam fora de alcance”, explicou Carlo Bifulco, MD, diretor médico do Providence Genomics e diretor médico de genômica do câncer e oncologia de precisão no Providence Cancer Institute. “Ao analisar o microambiente tumoral de milhares de pacientes, o GigaTIME tem o potencial de acelerar descobertas que moldarão o futuro da oncologia de precisão e melhorarão os resultados para os pacientes.”
O GigaTIME gera uma população virtual para modelagem de microambientes tumorais
A patologia digital transforma uma lâmina de microscopia de tecido tumoral tingido em uma imagem digital de alta resolução, revelando detalhes da morfologia celular, como núcleo e citoplasma. Esse slide custa apenas de US$5 a US$10 por imagem e se tornou rotineiramente disponível no cuidado oncológico. É bem conhecido que a morfologia celular baseada em H&E contém informações sobre os estados celulares. No ano passado, lançamos o GigaPath, o primeiro modelo de fundação digital de patologia para escalar arquiteturas de transformadores para slides H&E gigapixel. Depois, pesquisadores do Hospital Mount Sinai e do Memorial Sloan Kettering Cancer Center mostraram, em um estudo prospectivo global, que é possível prever de forma confiável um biomarcador-chave a partir de lâminas de H&E para triagem oncológica de precisão. No entanto, esses trabalhos anteriores geralmente se limitam ao status médio de biomarcador em todo o tecido. O GigaTIME representa, portanto, um grande avanço ao aprender a prever estados unicelulares espacialmente resolvidos, essenciais para a modelagem do microambiente tumoral. Isso, por sua vez, nos permite gerar uma população virtual de imagens de mIF para análise TIME em grande escala (Figura 1).

A GigaTIME aprende um modelo multimodal de IA para traduzir lâminas de patologia em imagens de proteômica espacial, fazendo a ponte entre morfologia e estados celulares

A GigaTIME aprendeu um tradutor de IA intermodal da patologia digital para a proteômica multiplex espacial treinando em 40 milhões de células com lâminas H&E pareadas e imagens mIF da Providence. Até onde sabemos, este é o primeiro estudo em grande escala explorando IA multimodal para escalar a geração virtual de mIF. Os dados pareados de alta qualidade permitiram uma tradução cruzada muito mais precisa em comparação com métodos anteriores de ponta (Figura 2).
População virtual permite a descoberta em escala populacional de associações entre estados celulares e biomarcadores-chave

Ao aplicar o GigaTIME a dados do mundo real do Providence, geramos uma população virtual de 14.256 pacientes com mIF virtual e atributos clínicos chave. Após corrigir para múltiplos testes de hipóteses, identificamos 1.234 associações estatisticamente significativas entre estados das células imunes tumorais (CD138, CD20, CD4) e biomarcadores clínicos (carga de mutações tumorais, KRAS, KMT2D), desde subtipos pan-cancerígenos até subtipos de câncer (Figura 3). Muitas dessas descobertas são apoiadas pela literatura existente. Por exemplo, o alto MSI e o alto TMB associados ao aumento das ativações de canais relacionados ao TIME, como CD138. Além disso, a população virtual também descobriu associações até então desconhecidas, como associações pan-cancerígenas entre ativações imunes e biomarcadores tumorais chave, como o supressor tumoral KMT2D e o oncogene KRAS.
População virtual possibilita a descoberta em escala populacional de assinaturas imunes tumorais para estratificação de pacientes

A população virtual também descobriu assinaturas GigaTIME para estratificação eficaz dos pacientes entre perfis de estadiamento e sobrevivência (Figura 4), desde subtipos pan-cancerígenos até câncer. Estudos anteriores exploraram a estratificação de pacientes com base em proteínas imunes individuais, como CD3 e CD8. Descobrimos que CD3 e CD8 simulados pelo GigaTIME são igualmente eficazes. Além disso, a assinatura combinada do GigaTIME em todos os 21 canais proteicos alcançou uma estratificação de pacientes ainda melhor em comparação com canais individuais.
População virtual revela interações espaciais e combinatórias interessantes

A população virtual revelou interações interessantes e não lineares entre os canais virtuais de proteínas GigaTIME, revelando associações com características espaciais como nitidez e entropia, bem como com biomarcadores clínicos chave como APC e KMT2D (Figura 6). Tais estudos combinatórios estavam anteriormente fora de alcance, dada a escassez de dados de MFI.
Validação externa independente no TCGA

Realizamos uma validação externa independente aplicando o GigaTIME a 10.200 pacientes no conjunto de dados The Cancer Genome Atlas (TCGA) e estudamos associações entre o mIF virtual simulado pelo GigaTIME e biomarcadores clínicos disponíveis no TCGA. Observamos concordância significativa entre as populações virtuais de Providence e TCGA, com uma correlação de Spearman de 0,88 para ativações virtuais de proteínas entre subtipos de câncer. As duas populações também descobriram uma sobreposição significativa de associações entre ativações proteicas simuladas por GigaTIME e biomarcadores clínicos (teste exato de Fisher p < 2 × 10−9). Por outro lado, a população virtual de Providence gerou 33% mais associações significativas do que a TCGA, destacando o valor de dados reais grandes e diversos para a descoberta clínica.
O GigaTIME é um passo promissor rumo ao sucesso do “paciente virtual”
Ao aprender a traduzir entre modalidades, o GigaTIME é um passo promissor para “aprender a linguagem dos pacientes” com o objetivo final de desenvolver um “paciente virtual”: um gêmeo digital de alta fidelidade que um dia possa prever com precisão a progressão da doença e a resposta ao tratamento contrafactual. Ao converter dados de morfologia celular rotineiramente disponíveis em sinais de estados celulares de alta resolução e que seriam escassos, o GigaTIME demonstrou o potencial de aproveitar a IA multimodal para ampliar a geração de evidências do mundo real (RWE).
Daqui para frente, as oportunidades de crescimento são abundantes. O GigaTIME pode ser estendido para lidar com mais modalidades espaciais e canais de estado celular. Ele pode ser integrado a frameworks multimodais avançados, como LLaVA-Med para facilitar a análise de imagens conversacionais por meio de “conversar com os dados.” Para facilitar pesquisas em modelagem de microambientes tumorais, nós tornamos o GigaTIME open-source ()em Foundry Labs e Hugging Face. O GigaTIME é um trabalho conjunto entre o Providence e a Paul G. Allen School of Computer Science & Engineering da Universidade de Washington. Isso reflete o compromisso maior da Microsoft com IA generativa multimodal para saúde de precisão, com outros progressos empolgantes como GigaPath, BiomedCLIP, LLaVA-Rad , BiomedJourney, BiomedParse, TrialScope, Curiosi.
Coautores do artigo: Jeya Maria Jose Valanarasu, Hanwen Xu, Naoto Usuyama, Chanwoo Kim, Cliff Wong, Peniel Argaw, Racheli Ben Shimol, Angela Crabtree, Kevin Matlock, Alexandra Q. Bartlett, Jaspreet Bagga, Yu Gu, Sheng Zhang, Tristan Naumann Bernard A. Fox, Bill Wright, Ari Robicsek, Brian Piening, Carlo Bifulco, Sheng Wang,e Hoifung Poon.
The post GigaTIME: ampliando a modelagem de microambientes tumorais usando população virtual gerada por IA multimodal appeared first on Source LATAM.






