Às vezes, em scripts do Linux , você deseja saber se uma sequência de texto contém uma sequência menor e específica. Existem diversas formas de fazer isto. Mostramos algumas técnicas simples e confiáveis.
Índice
Por que isso é útil?
Pesquisar uma string por uma substring menor é um requisito comum. Um exemplo seria ler texto de um arquivo ou de entrada humana e pesquisar na string uma substring específica para que seu script possa decidir o que fazer a seguir. Pode estar procurando um rótulo ou nome de dispositivo em um arquivo de configuração ou uma sequência de comandos em uma linha de entrada de um usuário.
Os usuários do Linux são abençoados com vários utilitários para manipulação de texto . Alguns são integrados ao shell Bash, outros são fornecidos como utilitários ou aplicativos independentes. Há uma razão pela qual os sistemas operacionais derivados do Unix são ricamente servidos com recursos de manipulação de strings.
Algumas coisas que parecem ser arquivos não são arquivos simples. Eles são arquivos especiais que representam coisas como dispositivos de hardware e fontes de informações do sistema. A abstração realizada pelo sistema operacional dá-lhes a aparência e as características dos arquivos. Você pode ler informações deles – como texto, naturalmente – e em alguns casos escrever para eles, mas eles não são arquivos comuns.
O texto também é usado como entrada e saída para comandos em uma janela de terminal . Isso permite o redirecionamento e canalização de entrada e saída. Essa funcionalidade sustenta a capacidade de encadear sequências de comandos do Linux, passando a saída de um comando como entrada para o próximo.
Independentemente de suas origens, pesquisar no texto que recebemos uma palavra, comando, rótulo ou algum outro indicador significativo é uma parte padrão do tratamento de dados baseados em texto. Aqui está uma coleção de técnicas simples que você pode incluir em seus próprios scripts.
Encontrando Substrings com Bash Builtins
Os colchetes duplos “
[[...]]
“O teste de comparação de strings pode ser usado em if
instruções para determinar se uma string contém outra string.
Copie este script em um editor e salve-o em um arquivo chamado “double.sh”.
#!/bin/bashif [[ "macaco" = *"chave"* ]]; então
echo "a chave está no macaco"
outro
echo "a chave não está no macaco"
fi
Você precisará tornar o script executável com o chmod
comando . Esta é uma etapa sempre necessária para tornar qualquer script executável. Você precisará fazer isso sempre que criar um arquivo de script. Substitua o nome do script apropriado em cada caso.
chmod +x duplo.sh
Vamos executar o script.
./duplo.sh
Isso funciona porque o asterisco ” *
” representa qualquer sequência de caracteres, incluindo nenhum caractere. Se a substring “chave” estiver localizada dentro da string de destino, com ou sem caracteres na frente ou atrás dela, o teste retornará verdadeiro.
Em nosso exemplo, existem caracteres na frente da substring. Eles são correspondidos pelo primeiro asterisco. Não há letras atrás da substring, mas, como um asterisco também não corresponde a nenhum caractere, o teste ainda passa.
Para maior flexibilidade, podemos modificar nosso script para lidar com variáveis em vez de strings literais. Este é o script “double2.sh”.
#!/bin/bashstring="Macaco"
substring="chave"
if [[ $string = *$substring* ]]; então
echo "$substring foi encontrado em $string"
outro
echo "$substring não foi encontrado em $string"
fi
Vamos ver como isso funciona.
./double2.sh
Isso funciona da mesma maneira, com a vantagem de podermos usar nomes de variáveis em vez de strings literais. Transformar nossa pequena solução em uma função proporcionará maior flexibilidade.
Este é o script “double3.sh”.
#!/bin/bashcomprar -s nocasematch
string="Macaco"
substring="Chave"
maiúsculo = "Londres"
verificar_substring ()
{
se [[ $1 = *$2* ]]; então
echo "$2 foram encontrados em $1"
outro
echo "$2 não foi encontrado em $1"
fi
}
check_substring "Macaco" "chave"
check_substring $string $substring
check_substring $string "banana"
check_substring "País de Gales" $capital
Chamamos nossa check_substring
função usando uma mistura de variáveis e strings literais. Usamos sua opção (set) para set , para tornar as correspondências sem distinção entre maiúsculas e minúsculas .shopt
-s
nocasematch
Veja como funciona.
./double3.sh
Também podemos usar o truque de agrupar a substring em asteriscos nas case
instruções. Este é “caso.sh”.
#!/bin/bashcomprar -s nocasematch
string="Wallaby"
substring="Parede"
caso $string em
*$substring*)
echo "$substring foi encontrado em $string"
*)
echo "Nada corresponde: $string"
esac
Usar case
instruções em vez de instruções muito longas if
pode facilitar a leitura e a depuração dos scripts. Se você precisasse verificar se uma string continha uma das muitas substrings possíveis, a case
instrução seria a melhor escolha.
./caso.sh
A substring foi encontrada.
Encontrando Substrings com grep
Além dos recursos internos do Bash, a primeira ferramenta de pesquisa de texto que você provavelmente usará é o grep
. Podemos usar grep
a capacidade inata de procurar uma string dentro de uma string para procurar nossas substrings.
Este script é denominado “subgrep.sh”.
#!/bin/bashstring="panela de mingau"
substring="cume"
if $(echo $string | grep -q $substring); então
echo "$substring foi encontrado em $string"
outro
echo "$substring não foi encontrado em $string"
fi
O script usa echo
para enviar a string para grep
, que procura a substring. Estamos usando a -q
opção (quiet) para parar grep
de escrever qualquer coisa na saída padrão.
Se o resultado dos comandos entre parênteses ” (...)
” for igual a zero, significa que foi encontrada uma correspondência. Como zero equivale a true
no Bash, a if
instrução é satisfeita e a then
cláusula é executada.
Vamos ver qual é a sua saída.
./subgrep.sh
Encontrando Substrings com sed
Também podemos usar sed
para encontrar uma substring.
Por padrão, sed
imprime todo o texto inserido nele. Usar sed -n
evita isso. As únicas linhas impressas são linhas correspondentes. Esta expressão imprimirá todas as linhas que correspondam ou contenham o valor de $substring.
"/$substring/p"
Nós alimentamos o valor do $string
uso sed
de um redirecionamento aqui, <<<
. Isso é usado para redirecionar valores para um comando no shell atual. Ele não invoca um subshell da mesma forma que um pipe faria.
O primeiro -n
é o teste. Ele retornará true
se a saída do sed
comando for diferente de zero. A única maneira de a saída de sed
ser diferente de zero é se uma linha correspondente for encontrada. Se for esse o caso, $substring
deve ter sido encontrado em $string
.
Este é “subsed.sh”.
#!/bin/bashstring="Suécia"
substring="éden"
if [ -n "$(sed -n "/$substring/p" <<< $string)" ]; então
echo "$substring foi encontrado em $string"
outro
echo "$substring não foi encontrado em $string"
fi
Obtemos a resposta esperada quando executamos o script.
./subsed.sh
Podemos testar a lógica do script editando o valor de $substring
para que a comparação falhe.
./subsed.sh
Pare de procurar, encontrei
Outras ferramentas podem encontrar substrings, como awk
e Perl
mas um caso de uso simples como encontrar uma substring não garante sua funcionalidade extra nem a complexidade adicional. Em particular, usar os recursos internos do Bash para procurar substrings é rápido, simples e não requer ferramentas externas.