Vídeo: Aprenda RegEx do Zero! #1 O que são Expressões Regulares? 2024
R suporta o conceito de expressões regulares, que permite pesquisar padrões dentro do texto. Você nunca pode ter ouvido falar de expressões regulares, mas provavelmente está familiarizado com o conceito amplo. Se você já usou um * ou um? para indicar qualquer letra em uma palavra, então você usou uma forma de busca de curinga. Expressões regulares apoiam a ideia de curingas e muito mais.
As expressões regulares permitem três maneiras de tornar um padrão de pesquisa mais geral do que uma única expressão fixa:
-
Alternativas: Você pode procurar instâncias de um padrão ou outro, indicado pelo | símbolo. Por exemplo, a praia | faia corresponde a praia e faia.
Nos teclados inglês e inglês americano, você geralmente pode encontrar o | na mesma chave como barra invertida ().
-
Agrupamento: Você agrupa padrões juntos usando parênteses (). Por exemplo, você escreve be (a | e) ch para encontrar praia e faia.
-
Quantificadores: Você especifica se um elemento no padrão deve ser repetido ou não, adicionando * (ocorre zero ou muitas vezes) ou + (ocorre uma ou várias vezes). Por exemplo, para encontrar bach ou beech (zero ou mais de a e e , mas não ambos), você usa b (e * | a *) ch.
Experimente os seguintes exemplos. Primeiro, crie uma nova variável com cinco palavras: >> rwords <- c ("bach", "back", "beech", "beach", "black")
Encontre
beach > ou faia usando correspondência alternativa:
Por fim, use a modificação do quantificador para extrair
bach < e
beech
mas não
praia:
rwords [grep ("b (e * | a *) ch", rwords)] [1] "bach" "beech" > Para encontrar mais ajuda em R sobre expressões regulares, veja a página de Ajuda? regexp. Alguns outros excelentes recursos para aprender mais sobre expressões regulares são a Wikipedia e, onde você pode encontrar um guia de início rápido e tutoriais.