A análise de conteúdo é uma metodologia para pesquisa qualitativa que trata do conteúdo do que foi dito ou escrito. Embora exista vasto corpo bibliográfico sobre a mesma, com enfoques variados sobre o assunto à ser abordado ou como se deve ser interpretada, em nível operacional trata-se de categorizar trechos de um texto ou fala. A organização de como foi efetuado o registro dessa categorização ou a categorização em si não é divulgada. Dificultando a reprodução/replicação da análise de tais estudos. Propomos a adaptação de um formato de arquivo de texto comumente utilizada para armazenamento de sequências de nucleotídeos e proteínas: o FASTA, para organização de dados de estudos que usem a análise de conteúdo. Esse consiste originalmente em um cabeçalho curto, começando com o caractere “>” seguido do nome da sequência. Além do nome da sequência em si, nessa mesma linha podemos encontrar outros campos que são separados pelo caractere “|”. Na linha seguinte encontra-se a própria sequência de caracteres CGTAU para DNA/RNA e pouco mais que 20 outras letras para peptídeos. Em nosso caso, esse cabeçalho armazenaria meta-informações, a sequência seria o equivalente à sequência de DNA/RNA/Peptídeos e as categorias da análise de conteúdo seriam delimitadas dentro do texto com a ajuda de “”, se modo semelhante ao usado em HTML. Como prova de conceito, foi desenvolvido um script em perl, linguagem bastante usada em processamento de texto, para implementação do algoritmo explicitado na metodologia. Esse lê todos os arquivos de texto dentro de um diretório e cria uma tabela com a contagem de categorias para o combinado dos arquivos. Foi desenvolvido originalmente para um trabalho de conclusão de Residência em Saúde da Família e adaptado aqui para atender a casos mais gerais. Pode ser encontrado em https://github.com/diegopenhanut/flf/blob/master/perl/cont.cat.pl e pode ser executado em vários sistemas operacionais.