COMO ISTO Ã‰ POSSÃVEL,NA INTERNET?

MARCOS 25/10/2015 16:16:05
#453028

Boa tarde,Colegas!
A maior parte dos colegas,já deve ter visto na televisão,comerciais sobre
Sites de pesquisa de preço (Por exemplo,Trivago que faz pesquisa de preço
de Hoteis,pousadas,etc...)Nos comerciais,estas empresas dizem que comparam
preços de [Ã”]centenas[Ã”] de hotÃ©is,pousadas,etc...

O problema:

Como um site,consegue [Ã”]consultar[Ã”] o preço de uma quantidade tão grande de hotÃ©is,
pousadas,etc... ?????

Me ocorre somente dois modos,de se poder fazer isto:

1.) O site fez um acordo,com cada uma das [Ã”]centenas[Ã”] de HotÃ©is e pousadas,e esta acessando
a Base de dados dos sistemas de gestão destes HotÃ©is e consultando os dados.
(Isto me parece impraticavel na prática )

2.) O site esta pesquisando direto na página WEB,destes hotÃ©is.Mesmo sem autorização dos hotÃ©is (O que me parece mais provavel)

Minha dÃºvida tÃ©cnica:

Qual a solução,Ã© a que os sites de consulta de preço,utilizam na pratica,para resolver o problema
Os que mencionei acima,ou uma outra alternativa??????

Agradeço qualquer orientação

ACCIOLLY 25/10/2015 21:05:32
#453045

Eu diria que as duas opções estão corretas! rsrsrsrs. Mas tem num outro fórum de PHP que tem um post relacionado a 2Âª opção:

http://forum.codigofonte.net/topic/9738-script-igual-buscape/

DS2T 25/10/2015 22:27:32
#453048

As vezes a gente pensa que algo Ã© super high tech, mas não dá pra saber. Se o cara faz tudo na munheca para cada site ou não. Com um nÃºmero mÃnimo de funcionários, isso não seria difÃcil nem muito demorado...

Mas sinceramente? Quase certeza que eles fizeram para cada site hehehe Se não o nÃºmero de sites buscados seriam muito maiores. Mas em contrapartida, eles não teriam como controlar a confiabilidade da oferta. Pesquisando em sites especÃficos sÃ©rios, dá pra confirmar a procedência (pareceu atÃ© propaganda Friboi).

Dá pra fazer usando mineração de dados tambÃ©m. Mas haveria esse problema colocado a cima.

Então respondendo sua pergunta:
Eles pegam vários sites que julgam confiáveis, analisam o html e criam um módulo de pesquisa para cada site. A partir daÃ, conseguem transformar o html de retorno de pesquisa em objetos, por exemplo, com propriedades: Descrição do serviço, preço, local, etc.
Pode parecer muito trabalhoso, mas na verdade, não Ã© tanto quanto parece...

KERPLUNK 25/10/2015 22:43:12
#453049 Resposta escolhida

Verifique isso. é um gerenciador, onde cada hotel pode trabalhar com seus dados, incluir ofertas e tudo mais. Então boa parte dos dados Ã© mantido pelos próprios hotÃ©is. Outra parte pesquisa em WebAPI[Ã´]s de serviços deste tipo. E tambÃ©m Ã© possÃvel que exista algum tipo de WebCrawler para tambÃ©m incrementar essa base de dados. O que tenho praticamente certeza que não Ã©, Ã© que ele busque em site HTML no momento da busca. Isso Ã© tarefa do crawler.

DS2T 25/10/2015 23:05:02
#453052

Não entendi Kerplunk.
AtÃ© onde eu saiba, um WebCrawler precisa ler o html para poder encontrar os links e indexá-los...

KERPLUNK 26/10/2015 00:31:03
#453055

Por isso que eu disse que [Ã”]Ã© possÃvel[Ã”]. O crawler fica fazendo a pesquisa o tempo todo, não somente no momento da reserva ou procura por parte do usuário.

MESTRE 26/10/2015 07:38:14
#453061

Não acho que possa ser webcrawler.

o site não considera como ataque um crawler rodando toda hora e baixando o .html? estou estudando um pouco sobre licitações e precisei bolar um projeto para fazer isso
utilizei webcrawler e consegui ler os dados de alguns sites, porÃ©m devo fazer isso um Ãºnica vez ao dia então cai como uma luva..

Agora um site ex trivago precisaria fazer isso a cada 1 segundo, o que eu acho que o servidor destino interpreta como um ataque e bloqueia o IP correto?

KERPLUNK 26/10/2015 18:31:27
#453117

MESTRE, em primeiro lugar isso Ã© uma configuração no servidor, de considerar como ataque o uso muito ostensivo. Como disse, o webcrawler muito provavelmente funciona não mais que uma ferramenta auxiliar, não sendo nem de perto o principal coletor de dados.

Página única

Tópico encerrado , respostas não são mais permitidas

Voltar

COMO ISTO Ã‰ POSSÃVEL,NA INTERNET?

COMO ISTO Ã‰ POSSÃVEL,NA INTERNET?