Mini Analisador Léxico que conta palavras numa string
Publicado por Samuel Leonardo (última atualização em 23/04/2021)
[ Hits: 2.290 ]
Homepage: https://nerdki.blogspot.com.br/
Neste programa está um código bem pequeno para contar palavras numa string. Com ele, você pode inclusive adaptar e contar palavras num arquivo txt, desde que não se use pontuações ou outros caracteres como \n e \t.
Eu fiz ele bem simples para apenas alguém se interessar pelo estudo de compiladores.
Sugiro a leitura dos livros:
- compiladores princípios técnicas e ferramentas (ótimo livro, muito prático)
- linguagens formais e autômatos do autor Paulo Blauth Menezes (muito teórico este livro)
Instruções:
- modifique a string 'str' para ver como se comporta o lexer
- leia os comentários para mais instruções
/** * @file minilexer.c * @author Samuel Leonardo * @brief Mini analisador léxico de uma string * @version 0.1 * @date 2021-04-20 * * @copyright Copyleft (c) 2021 * */ #include <stdio.h> #include <stdlib.h> #include <string.h> int main ( ) { //modifique esta string para ver se o analisador funciona //observe que, só coloquei o caractere ' ' (espaço) como separador das palavras //você pode modificar facilmente para outros caracteres como o \n \t etc e tal //NOTA: também não coloquei para ignorar pontuaçlão, por isso, //algo como "aqui," é encarado como uma palavra const char * str = "String teste Com Char MAIUSCULOS!"; //estado do analisador léxico int estado = 0; //posição do caractere atual int p = 0; int tamanho = strlen(str); int qtdePalavras = 0; while (str[p]) { //estado de lendo um caractere if (estado == 0) { if (str[p] != ' ') { //vai para estado de lendo identificador (palavra sem espaço) estado = 1; } else { // move a posição do caractere atual p++; } } // lendo um identificador else if (estado == 1) { int inicio = p; int fim = p + 1; while (str[fim] && str[fim] != ' ') { fim++; } //verifica agora se o fim NÃO é o char '\0' ou um ' ' (espaço) if (str[fim] == '\0' || str[fim] == ' ') { // se estamos aqui, é de se supor que estamos lendo um caractere do alfabeto // seria mais interessante ter verificado isso no if daqui // agora, incrementa o contador de palavras qtdePalavras++; } // depois, posiciona o contador de posição na posição do fim p = fim; // volta ao estado de lendo caractere estado = 0; } } printf("Frase: %s \n\tem %d palavras\n", str, qtdePalavras); return 0; }
METODO DA FALSE POSIÇÃO E BISSEÇÃO em "C"
Servidor de Backup com Ubuntu Server 24.04 LTS, RAID e Duplicati (Dell PowerEdge T420)
Visualizar câmeras IP ONVIF no Linux sem necessidade de instalar aplicativos
Atualizar Debian Online de uma Versão para outra
Instalar driver Nvidia no Debian 13
Redimensionando, espelhando, convertendo e rotacionando imagens com script
Debian 13 Trixie para Iniciantes
Convertendo pacotes DEB que usam ZSTD (Padrão Novo) para XZ (Padrão Antigo)
Debian 13 "trixie&... lançado! (44)
Rust é o "C da nossa geração"? (3)
Gerenciador de arquivos é finalizado ao abrir pasta específica (2)