LOCALIZAR E COPIAR TEXTO EM HTML

SABRINA 30/04/2013 15:13:30
#422736
[txt-color=#FF1493]Olá !!!

Pessoal, tenho uma relação com mais de 5000 clientes em PDF. Exportei ela para HTML e preciso de vocês para conseguir extrair as informações lá para um banco de dados que estou criando.

Os campos que preciso extrair são:
- Nome do cliente (Cliente:)
- Contato:
- N. Fantasia:
- Nº CheckOut:
- Telefone (Fone:)

Vocês podem me ajudar a extrair essas informações ? Preciso dela em um arquivo Excel ou Access em tabela com campos [Ô]Cliente[Ô], [Ô]Contato[Ô], [Ô]N. Fantasia[Ô] e [Ô]Nº Checkout[Ô]


Para exemplos, segue abaixo um trecho do HTML, extraí os 3 primeiros clientes para exemplo:
[/txt-color]

Citação:

*** Editado ***
Na terceira resposta existe um .txt com os dados

PEGUDO 01/05/2013 09:17:17
#422773
SABRINA,
Precisamos que você envie o arquivo HTML, como anexo, para podermos ajudá-la.
SABRINA 02/05/2013 12:56:56
#422837
[txt-color=#FF1493]
Num posso colocar o arquivo completo porque tem dados **sigilosos**

Peguei uma parte do arquivo, exportei em HTML, mas o forum num me deixa anexar .html.
Salvei o HTML como .txt

Confio em vocês pessoal
[/txt-color]
PEGUDO 03/05/2013 09:40:13
#422880
SABRINA é o seguinte: Baixa o arquivo, em anexo, para exibir os dados do cliente.
Talvez seja até melhor você trabalhar com arquivo txt do que html.
Percebi que alguns clientes contêm mais de um Nº de Checkout, caberá a você tratar este tópico pois não sei qual é o que você usa em seu programa.
E na para inserir os dados no BD, basta você trocar a parte onde exibe a Message box pelo código para inserir os dados no seu banco de dados.
SABRINA 03/05/2013 14:01:48
#422899
[txt-color=#FF1493] Ficou incrível PEGUDO !!
Mas ainda ficou um problema

Citação:

:Percebi que alguns clientes contêm mais de um Nº de Checkout, caberá a você tratar este tópico pois não sei qual é o que você usa em seu programa.


Na verdade, não existe cliente com mais de um Checkout ... isso foi um problema do PDF ao exportar para TXT, as linhas ficaram em lugares errados ...
Estou anexando o RichText para você ver o formato original, onde cada cliente tem um único campo de Checkout [/txt-color]
PEGUDO 04/05/2013 10:45:39
#422937
Em anexo, nova versão do programa. Coloquei-o para trabalhar com HTML mesmo, visto que o arquivo .rtf está meio que desconfigurado.
Baixe, teste e faça as modificações necessárias.
Faça seu login para responder