Como os motores de busca de trabalho?

Video: SITES DE BUSCA DE EMPREGO NA ALEMANHA | CANAL CASAL HEITZMANN

Para muitas pessoas, o Google É a Internet. É a página inicial padrão e o primeiro porto de escala antes de acessar qualquer site. É, sem dúvida, a invenção mais importante desde a própria Internet. Sem motores de busca, conteúdo seriam todos escolhidos a dedo - assim como jornais e revistas. E enquanto os motores de busca mudaram muito desde aqueles primeiros começos humildes - e Google certamente não é o motor de busca lá fora - os princípios subjacentes são as mesmas que eles sempre foram.

Faz você saber como os motores de busca funcionam? Existem três etapas básicas para um motor de busca: crawling - onde o conteúdo é de indexação discovered-, onde é analisada e armazenada em enormes databases- e recuperação, onde uma consulta do usuário obtém uma lista de páginas relevantes.

rastejando

O rastreamento é onde tudo começa - a aquisição de dados sobre um site. Isso envolve a digitalização do site e obter uma lista completa de tudo lá - o título da página, imagens, palavras-chave que ele contém, e quaisquer outras páginas links para - em um mínimo. crawlers modernos podem armazenar em cache uma cópia da página inteira, bem como olhar para algumas informações adicionais, como o layout da página, onde as unidades de publicidade são, onde as ligações estão na página (com destaque no texto do artigo, ou escondido no rodapé?).

Como é um site rastejou exatamente? Um bot automatizado - uma aranha - visitas cada página, assim como você ou eu, única muito rapidamente. Mesmo nos primeiros dias, o Google informou que eles estavam lendo algumas centenas de páginas por segundo. Se você gostaria de aprender a fazer o seu próprio rastreador web básico em PHP - era um dos primeiros artigos que escrevi aqui e vale a pena ter um ir para (só não espere para fazer o próximo Google).Como construir um rastreador Web básico para recuperar informações de um site (Parte 1)Como construir um rastreador Web básico para recuperar informações de um site (Parte 1)consulte Mais informação

O rastreador em seguida, adiciona todas as novas ligações que foram encontrados a uma lista de lugares para rastejar próxima - além de re-rastreamento de sites de novo para ver se alguma coisa mudou. É um processo interminável, realmente.

Video: O que é SEO? | D Loja Virtual

como os motores de busca de trabalho

Qualquer site que está ligada à de outro site já indexados, ou qualquer site que pediu manualmente para ser indexado, acabará por ser rastreado - alguns sites com mais frequência do que outros e alguns a uma maior profundidade. Se o site é enorme e conteúdo ocultado muitos cliques de distância da página inicial, os bots rastreador pode realmente desistir. Existem maneiras de pedir motores de busca não para indexar um site, embora isso raramente é usado para bloquear um site inteiro.

Houve até um momento em que grandes partes da Internet eram essencialmente invisível aos motores de busca - o chamado “rede profunda”- mas isso é raro agora. sites hospedados-TOR (O que é Onion Routing?), Por exemplo, permanecem não indexados pelo Google, e são acessíveis apenas através da ligação à rede TOR e saber o endereço.10 motores de busca para explorar a Invisible Web10 motores de busca para explorar a Invisible WebNão, não é mais recente ferramenta atirando web do Homem-Aranha, mas algo que é mais mundo real. Como a World Wide Web.consulte Mais informação

Video: Trabalho no Garimpo de Ouro - Máquinas e homens!

como é que os motores de busca de trabalho

indexação

Você seria perdoado por pensar que este é um passo fácil - indexação é o processo de tomar todos os dados que você tem a partir de um rastreamento, e colocá-lo em um grande banco de dados. Imagine tentar a fazer uma lista de todos os livros que você possui, o seu autor eo número de páginas. Passando por cada livro é o rastreamento e escrever a lista é o índice. Mas agora imagine que não é apenas uma sala cheia de livros, mas cada biblioteca do mundo. Isso é muito bonito um pequeno-versão escala do que o Google faz.

Video: Aplicativo para buscar emprego

Todos esses dados são armazenados em grande data-centers com milhares de petabytes no valor de unidades. Aqui está um pico sorrateira dentro de um Google de:

como é que os motores de busca de trabalho

posição & Recuperação

O último passo é o que você vê - você digita uma consulta de pesquisa, e o motor de busca tenta exibir os documentos mais relevantes que encontra que corresponde à sua consulta. Este é o passo mais complicado, mas também o mais relevante para você ou eu, como desenvolvedores web e usuários. Também é a área em que os motores de busca diferenciar-se (embora, houve alguma evidência de que o Bing foi realmente copiar alguns resultados do Google) .Alguns trabalho com palavras-chave, alguns permitir-lhe fazer uma pergunta, e alguns incluem recursos avançados, como a proximidade de palavras-chave ou filtrar por idade de conteúdo.10 frescos usos do Wolfram Alpha Se você ler e escrever no idioma Inglês10 frescos usos do Wolfram Alpha Se você ler e escrever no idioma InglêsLevei algum tempo para envolver minha cabeça em torno de Wolfram Alpha e as consultas utilizadas para esguichar esses resultados. Você tem que mergulhar profundamente em Wolfram Alpha para realmente explorá-la para ...consulte Mais informação



O algoritmo de classificação verifica a sua consulta de pesquisa contra bilhões de páginas para determinar o quão relevante cada um é. Esta operação é tão complexo que as empresas de perto proteger seus próprios algoritmos de classificação como segredos patenteadas da indústria. Por quê? vantagem competitiva para um começo - desde que eles estão dando os melhores resultados de pesquisa, eles podem ficar em cima do mercado. Em segundo lugar, para evitar o jogo do sistema e dando uma vantagem injusta a um local em detrimento de outro.

Uma vez que a metodologia interna de qualquer sistema é totalmente compreendido, sempre haverá aqueles que tentam “hack” é - descobrir os fatores de classificação e explorá-los para o ganho monetário.

como é que os motores de busca de trabalho

Explorando o algoritmo de classificação tem de fato sido comuns desde que os motores de busca começou, mas nos últimos 3 anos ou mais Google tem feito realmente tão difícil. Originalmente, os locais foram classificados com base em quantas vezes uma determinada palavra-chave foi mencionado. Isso levou a “palavra-chave enchimento”, onde as páginas são preenchidos com a maioria absurdo desde que inclui a palavra-chave em todos os lugares.

Em seguida, o conceito de importância com base no ligando foi introduzido - locais mais populares seria mais ligada a, obviamente - mas isso levou a uma proliferação de links de spam em todo o web. Agora cada link está determinado a ter um valor diferente, dependendo da “autoridade” do site em questão. Se um alto nível ligações agência do governo para você, vale a pena muito mais do que um link encontrado em um free-for-all “diretório da ligação”.

Confira SEOFailBlog.com para mais exemplos de SEO idos selvagens.

explicação motor de pesquisa

Hoje, a compreensão do algoritmo exato é ainda mais envolta em mistério do que nunca, e a arte escura de “Search Engine Optimization” tem sido largamente aleijado - o conselho agora é se concentrar em fornecer o melhor conteúdo, com uma grande experiência do usuário ( como louco, certo ?!). Considerando-se que quase 60% de todas as buscas acabam clicando no primeiro resultado, é fácil ver por que a classificação do seu bem página é tão importante.

O que vem por motores de busca?

Ah, agora não é uma pergunta interessante. A resposta é - semântica - o significado e tipo de conteúdo uma página contém. Para mais informações sobre isso, leia o meu artigo sobre Markup semântico e como ele vai mudar a Web para sempre.O Semantic Markup é & Como ele vai mudar a Internet para sempre [Tecnologia Explicada]O Semantic Markup é & Como ele vai mudar a Internet para sempre [Tecnologia Explicada]consulte Mais informação

Aqui está o exemplo mais fácil - agora, você pode procurar os cookies sem glúten, mas as páginas que você encontra não pode realmente ser uma receita para cookies- sem glúten eles poderiam ter um cookie regular com um pouco de texto que diz “esta receita não é sem glúten“. Em um mundo com a semântica, você pode procurar receitas de biscoitos e depois remover farinha regular a partir de sua lista de ingredientes aceitáveis. Então você pode remover qualquer com nozes, porque você não está particularmente interessado em nozes. Então você pode reduzi-lo a apenas receitas com uma pontuação de revisão de 4/5 ou superior, e um tempo total de preparação de menos de meia hora. que seria direito legal?

Bem, você pode. Apenas cabeça para Google.com (versões internacionais podem não funcionar), procurar uma receita, e usar as ferramentas de busca para reduzi-lo a apenas resultados que são receitas. Então você vai encontrar um filtro de ingredientes e muito mais!

como os motores de busca de trabalho

E isso, caros leitores, é a forma como os motores de busca de trabalho. Ainda confuso? Veja como o Google-se explicar o processo:

Se você encontrou este interessante, você também pode gostar de aprender sobre como imagem motores de busca de trabalho.


Artigos relacionados