Quando você digita um endereço no navegador da Web, muitas coisas acontecem nos bastidores. E a maior parte disso é determinada pelas várias partes do URL que você digitou. Vamos olhar mais de perto.
Um URL pode consistir em várias partes diferentes. Há um nome de host que mapeia para um endereço IP de um recurso específico na Internet e um monte de informações adicionais que dizem ao seu navegador e ao servidor como lidar com as coisas. Você pode pensar em um endereço IP como sendo algo como um número de telefone. Um nome de host é como o nome de uma pessoa cujo número de telefone você deseja consultar. E um padrão chamado Domain Name System (DNS) funciona em segundo plano como uma lista telefônica, traduzindo os nomes de host mais amigáveis aos humanos em endereços IP que as redes usam para rotear o tráfego.
Mantendo essa analogia em mente, vamos dar uma olhada na estrutura de uma URL e como ela funciona para levá-lo aonde deseja.
Índice
Como um URL é estruturado
A estrutura de um URL foi definida pela primeira vez por Sir Tim Berners-Lee – o cara que criou a Web e o primeiro navegador da Web – em 1994. URLs combinam essencialmente a ideia de nomes de domínio com a ideia de usar um caminho de arquivo para identificar um pasta e estrutura de arquivos. Portanto, é semelhante a usar um caminho como C: \ Documentos \ Pessoal \ meuarquivo.txt no Windows, mas com algumas coisas extras no início para ajudar a encontrar o servidor certo na internet onde esse caminho existe e o protocolo usado para acessar o em formação.
Um URL consiste em várias partes diferentes. Considere, por exemplo, um URL básico como o mostrado na imagem abaixo.
Esse URL simples é dividido em dois componentes principais: o esquema e a autoridade.
Esquema
Muitas pessoas pensam em um URL apenas como um endereço da web, mas não é tão simples assim. Um endereço da web é um URL, mas todos os URLs não são endereços da web. Outros serviços que você pode acessar na Internet – como FTP – ou mesmo localmente – como MAILTO – também são URLs. A parte do esquema de um URL (as letras seguidas de dois pontos) denotam o protocolo com o qual um aplicativo (como seu navegador da web) e o servidor devem se comunicar.
Os endereços da Web são os URLs mais comuns, mas existem outros. Então, você pode ver esquemas como:
- Protocolo de transferência de hipertexto (HTTP): este é o protocolo básico da web e determina quais ações os servidores e navegadores da web devem realizar em resposta a certos comandos.
- HTTP Seguro ( HTTPS ) : esta é uma forma de HTTP que funciona em uma camada segura e criptografada para um transporte mais seguro de informações.
- Protocolo de transferência de arquivos (FTP): este protocolo ainda é frequentemente usado para transferir arquivos pela Internet.
Em navegadores modernos, o esquema não é tecnicamente necessário como parte do URL. Se você entrar em um site como “www.howtogeek.com”, seu navegador determinará automaticamente o protocolo correto a ser usado. Ainda assim, alguns outros aplicativos (e protocolos) requerem o uso de um esquema.
Autoridade
A parte de autoridade de uma URL (que é precedida por duas barras) é dividida em várias partes. Vamos começar com um URL muito simples – o tipo que o levaria à página inicial de um site.
Neste exemplo simples, toda a parte “www.example.com” é chamada de nome de host e resolve para um endereço IP. Você também pode digitar um endereço IP na barra de endereços do navegador, em vez do nome do host, se por acaso souber disso.
Mas, ao analisar o nome do host, é útil lê-lo de trás para frente para entender o que está acontecendo, então aqui estão os componentes:
- Domínio de nível superior: no exemplo aqui, “com” é o domínio de nível superior. Estes são o nível mais alto no Sistema de Nomes de Domínio Hierarquia (DNS) usada para traduzir endereços IP em endereços de linguagem simples que são mais fáceis para nós, humanos, lembrarmos. Esses domínios de nível superior são criados e gerenciados pela Internet Corporation for Assigned Names and Numbers (ICANN). Os três domínios de nível superior mais comuns são .com, .net e .gov. A maioria dos países também tem seu próprio domínio de nível superior de duas letras, então você verá domínios como .us (Estados Unidos), .uk (Reino Unido), .ca (Canadá) e muitos outros. Existem também alguns domínios de nível superior adicionais (como .museum) que são patrocinados e gerenciados por organizações privadas. Além desses, também existem alguns domínios genéricos de nível superior (como .club, .life e .news).
- Subdomínio: Como o DNS é um sistema hierárquico, ambas as partes “www” e “exemplo” de nosso URL de exemplo são consideradas subdomínios. A parte “www” é um subdomínio do domínio de nível superior “com” e a parte “www” é um subdomínio do domínio “exemplo”. É por isso que você costuma ver uma empresa com um nome registrado como “google.com” dividido em subdomínios separados como “www.google.com,” “news.google.com,” “mail.google.com,” e em breve.
Esse é o exemplo mais básico da seção de autoridade de um URL, mas as coisas podem ficar mais complicadas. Existem dois outros componentes que a seção de autoridade pode conter:
- Informações do usuário: A seção de autoridade também pode conter um nome de usuário e senha para o site que você está acessando. É incomum ver essa estrutura em URLs hoje, mas pode acontecer. Se estiver presente, a parte das informações do usuário vem antes do nome do host e é seguida por um sinal @. Portanto, você pode ver algo como “// nome de usuário:senha@www.example.com” se incluir as informações do usuário.
- Número da porta: os dispositivos de rede usam endereços IP para obter informações para o computador certo em uma rede. Quando esse tráfego chega, um número de porta informa ao computador o aplicativo para o qual esse tráfego se destina. O número da porta é outro elemento que você não verá com frequência ao navegar na web, mas pode ser visto em aplicativos de rede (como jogos) que exigem a inserção de um URL. Se o URL incluir um número de porta, ele virá após o nome do host e será precedido por dois pontos. Seria algo como: “//www.example.com:8080.”
Então, esse é o esquema e as partes de autoridade de um URL, mas como você deve ter adivinhado depois de olhar muitos URLs enquanto navega na web, eles podem incluir ainda mais coisas.
Caminhos, consultas e fragmentos
Existem três partes adicionais de um URL que você pode ver após a parte de autoridade: caminhos, consultas e fragmentos. Veja como funcionam.
Caminho
A seção de autoridade de um URL leva seu navegador (ou qualquer aplicativo) ao servidor certo em uma rede. O caminho a seguir – que funciona exatamente como um caminho no Windows, macOS ou Linux – leva você à pasta ou arquivo certo nesse servidor. O caminho é precedido por uma barra, e há uma barra entre cada diretório e subdiretório, assim:
www.example.com/folder/subfolder/filename.html
A última parte é o nome do arquivo que é aberto quando você acessa o site. Embora você não possa vê-lo na barra de endereço, isso não significa que não esteja lá. Alguns idiomas usados para criar páginas da web ocultam o nome do arquivo e a extensão que você está visualizando. Isso torna o URL mais fácil de lembrar e digitar e dá a ele uma aparência mais limpa.
Inquerir
A parte da consulta de um URL é usada para identificar coisas que não fazem parte de uma estrutura de caminho estrita. Na maioria das vezes, você os verá sendo usados ao realizar uma pesquisa ou quando uma página da web fornece dados por meio de um formulário. A parte da consulta é precedida por um ponto de interrogação e vem após o caminho (ou após o nome do host se um caminho não estiver incluído).
Como exemplo, tome este URL apresentado quando pesquisamos na Amazon as palavras-chave “wi-fi extender”:
https://www.amazon.com/s/ref=nb_sb_noss_2?url=search-alias%3Daps&field-keywords=wi-fi+extender
O formulário de busca passou informações para o mecanismo de busca da Amazon. Após o ponto de interrogação, você pode ver que há duas partes na consulta: um URL para a pesquisa (que é a parte “url = search-alias% 3Daps & field”) e as palavras-chave que digitamos (ou seja, “keywords = wi-fi + extensor ”).
Esse é um exemplo bastante simples, e você frequentemente verá URLs com variáveis adicionais (e mais complicadas). Por exemplo, este é o URL quando pesquisamos no Google a palavra-chave “howtogeek”:
https://www.google.com/search?q=howtogeek&rlz=1C1GCEA_enUS751US751&oq=howtogeek&aqs=chrome..69i57j69i60l4j0.1839j1j4&sourceid=chrome&ie=UTF-8
Como você pode ver, existem algumas informações diferentes lá. Neste caso, você pode ver que há informações adicionais indicando o idioma de pesquisa, o navegador que usamos (Chrome) e até o número da versão do navegador.
Fragmento
O componente final de um URL que você pode ver é chamado de fragmento. O fragmento é precedido por uma marca de hash (#) e é usado para indicar um local específico em uma página da web. Ao codificar uma página da web, os designers podem criar âncoras para textos específicos, como títulos. Quando o fragmento apropriado é usado no final de uma URL, seu navegador carrega a página e então pula para aquela âncora. Âncoras e URLs com fragmentos são freqüentemente usados para criar tabelas de conteúdo em páginas da web para facilitar a navegação.
Aqui está um exemplo. A página da Wikipedia sobre o Renascimento é um documento bastante longo e está dividido em cerca de 11 seções, cada uma com várias subseções. Mas cada título da página tem uma âncora incluída e um índice no topo do artigo inclui links que permitem pular para as diferentes seções. Esses links funcionam incluindo fragmentos.
Você também pode usar esses fragmentos diretamente na barra de endereço ou como links compartilháveis. Digamos, por exemplo, que você queira mostrar a alguém a seção dessa página que cobre a Rússia. Você pode simplesmente enviar este link:
https://en.wikipedia.org/wiki/Renaissance#Russia
Essa parte “#Russia” no final da URL os leva direto para essa seção após carregar a página.
Então aí está – mais do que você provavelmente já quis saber sobre como funcionam os URLs.
Crédito da imagem: Pawel Horazy / Shutterstock