O presente trabalho tem como objetivo analisar as diferenças entre o formato impresso e o digital, na prova de Linguagens do Exame Nacional do Ensino Médio (ENEM), dos dois últimos anos (2021 e 2022), em especial com relação às questões que têm como base os gêneros multimodais. Até então, os trabalhos que se apresentam com a análise de gêneros multimodais trazem uma preocupação em apenas quantificar a sua ocorrência no ENEM; este tem o objetivo de investigar não apenas a ocorrência de gêneros multimodais, mas o tratamento dado a esses gêneros, bem como os letramentos necessários para a compreensão e resolução das questões. A análise foi feita com base nas teorias de Halliday, com a Linguística Sistêmico Funcional (In: Bawarshi,1998) estabelecendo relações com a Gramática do Design Visual, de Kress e Van Leeuwen (1996) e suas metafunções e Dionísio (2011 e 2014). Também levou-se em consideração os estudos de Rojo (2009, 2012, 2013, 2019) sobre letramentos, entre outros. Os resultados iniciais apontaram que, apesar de ainda encontrarmos imagens apenas como ilustrações para as questões, houve uma mudança no modo de configuração das questões elaboradas, com questões que exploram não apenas a interpretação do verbal, mas também que exploram apenas a linguagem visual ou a interpretação que aborda tanto o verbal quanto o visual, ao mesmo tempo. Além disso, os diversos tipos de letramento são explorados, apesar da prova no formato digital explorar, ainda de forma tímida, os recursos que o ambiente digital oferece, limitando a orientação a aspectos da navegabilidade. A análise deixou clara a necessidade de explorar, cada vez mais, os recursos digitais como, por exemplo, o hiperlink e o hipertexto.