1001Ferramentas
💬 Calculadoras

Calculadora frequencia de palavras comuns em portugues

Mostra a frequencia relativa estimada de palavras muito comuns em portugues a partir de listas de corpus e indica em qual rank ela cai no top mil.

Frequência de palavras em português: lei de Zipf e curvas de cobertura

Em textos em português, as 100 palavras mais frequentes cobrem ~50% de qualquer corpus corrido, as 1.000 mais frequentes cobrem ~80% e as 5.000 mais frequentes cobrem ~95%. Os tokens mais frequentes são palavras funcionais: de, a, o, que, e, do, da, em, um, para. Essa distribuição no estilo de Zipf significa que estudantes ganham muita compreensão com um vocabulário inicial pequeno — mas a cauda longa (últimos 5% dos tipos) carrega o significado específico do tema. Referência: Corpus do Português (Mark Davies, BYU), com ~1 bilhão de palavras entre variantes brasileira e europeia. Listas lematizadas juntam fui, vou, vão sob ir; listas não lematizadas tratam cada forma à parte.

Aplicações

Desenho de currículo de português como língua estrangeira, montagem de baralhos Anki e SRS ordenados por frequência, pré-processamento de PLN (listas de stopwords para tokenização e TF-IDF), pontuação de legibilidade para editoras educacionais e priors para pós-correção de OCR.

Perguntas frequentes

Português do Brasil ou de Portugal? As listas das 1.000 mais frequentes coincidem em ~95%; diferenças aparecem em vocabulário como ônibus/autocarro, celular/telemóvel. O Corpus do Português separa as duas variantes.

Por que estudar por frequência em vez de tema? O estudo ordenado por frequência maximiza a cobertura de texto por palavra memorizada — 80% de compreensão depois de só 1.000 palavras, contra semanas de listas temáticas para o mesmo ganho.

Stopwords são inúteis? Para busca em PLN, sim — adicionam ruído. Para compreensão e gramática, são essenciais: preposições e artigos sustentam a estrutura da frase.

Quantas palavras para fluência? Falantes nativos cultos usam ativamente ~15.000–20.000 lemas; o reconhecimento passivo chega a 40.000+. Alunos C1 costumam operar com 8.000–10.000.

Ferramentas Relacionadas