Este estudo objetiva analisar textos visuais multimodais no intuito de compreender a relação verbo-visual apresentada por alunos do 9º ano e, especialmente, a compreensão que esses alunos têm de layout textual. Dessa forma, mostrar as contribuições que a Linguística Sistêmico-Funcional, a Gramática do Design Visual e a Composição do Espaço Visual podem trazer para o ensino de Língua Portuguesa no que tange ao letramento visual e midiático. Diante da conjuntura tecnológica na qual a sociedade está inserida, e com o bombardeio constante de informações por meio de imagens e vídeos nas diversas mídias de massas como rádios, jornais, TVs e, principalmente, nas mídias digitais, a perspectiva mono modal de texto é, cada vez mais, deixada de lado. Assim, emerge a necessidade de tratar o texto em sua concepção multimodal, ou seja, interpretá-lo por meio não apenas de seus elementos linguístico-verbais, mas também atentar-se para os elementos visuais e códigos semióticos que compõem o texto. No entanto, a escola ainda não atribui a devida relevância ao estudo sistemático de textos não verbais. O corpus dessa pesquisa é formado por 30 (trinta) textos de alunos do 9º ano de uma escola pública rural acerca de uma web notícia que lhes foi apresentada em sala de aula, portanto, o presente trabalho é de caráter qualitativo e exploratório. Na maioria dos textos, pôde-se notar que a leitura e a análise multimodal não foram realizadas. Com efeito, ficou claro que a compreensão de layout textual apresentada pelos alunos dessa escola é muito limitada.