O CONCEITO DE PALAVRA TEM SIDO REDISCUTIDO NA LINGUÍSTICA COMO UM CONSTRUTO TEÓRICO NÃO NECESSARIAMENTE VÁLIDO, PRINCIPALMENTE EM LÍNGUAS NÃO INDOEUROPEIAS, CALCADO NUMA TRADIÇÃO GRAMATICAL QUE SE AJUSTAVA MAIS ÀS LÍNGUAS CLÁSSICAS QUE À TOTALIDADE – E INCLUSIVE MAIORIA – DAS LÍNGUAS DO MUNDO. COM O INTUITO DE EXAMINAR FENÔMENOS DE RELEVÂNCIA TIPOLÓGICA QUE NÃO DEPENDAM DO CONCEITO TRADICIONAL DE PALAVRA, BEM COMO DE TENTAR REVELAR PADRÕES TRANSLINGUÍSTICOS DE RELAÇÃO ENTRE MORFEMAS, O PRESENTE ESTUDO UTILIZA FERRAMENTAS DO APRENDIZADO DE MÁQUINA NÃO-SUPERVISIONADO PARA PROCESSAR DADOS CAPTADOS DE GRAMÁTICAS DESCRITIVAS. ORGANIZANDO OS DADOS EM MATRIZES DE ADJACÊNCIA QUE REPRESENTAM A OCORRÊNCIA OU NÃO DE BIGRAMAS – ASSOCIAÇÕES DE DOIS MORFEMAS –, AVALIAMOS COMO DIFERENTES LÍNGUAS ORGANIZAM SEU INVENTÁRIO DE MORFEMAS E ASSOCIAM ITENS DESTE. PARA TAL, ALIAMOS A TÉCNICA FATORAÇÃO DE MATRIZ NÃO-NEGATIVA (NMF) À CLUSTERIZAÇÃO POR K-MÉDIAS (K-MEANS), DE MANEIRA A AGRUPAR OS MORFEMAS DE DADA LÍNGUA EM UM NÚMERO VARIÁVEL DE CLASSES; EM SEGUIDA, AS ENTRADAS DOS MORFEMAS FORAM SUBSTITUÍDAS PELO ÍNDICE DE SUAS RESPECTIVAS CLASSES, E AS MATRIZES DE ADJACÊNCIA, REANALISADAS COM ATENÇÃO ÀS ASSOCIAÇÕES ENTRE AS CLASSES FORMADAS, APLICANDO-SE O TESTE Z PARA MEDIR A SIGNIFICÂNCIA DAS RELAÇÕES BIGRÂMICAS LÍNGUA A LÍNGUA. OS RESULTADOS DEMONSTRARAM GRANDE VARIAÇÃO NO COMPORTAMENTO DOS MORFEMAS DAS LÍNGUAS, ASSIM COMO ALGUMAS CORRELAÇÕES, DE FRACAS A MODERADAS, ENTRE UMA MAIOR PROPORÇÃO DE BIGRAMAS SIGNIFICANTES E A EXISTÊNCIA DE CLASSES DISTRIBUCIONAIS LEXICAIS.