DE HTML PARA TXT

USUARIO.EXCLUIDOS 25/05/2004 15:57:36
#26619
Primeiro eu fiz um "limpador de tags" que, apesar de eficiente, é lento, pois trabalha procurando os caracteres "" e "" e depois eliminando o que tem entre eles.

Depois disso, usei o DHTML Edit Control for IE5 (DHTMLED.OCX) pra abrir um arquivo html, copiá-lo para o clipboard e descarregá-lo num RichTextBox, limpando dessa maneira as tags e permitindo que se salve o arquivo como "Somente Texto" (txt). Funcionou muito bem até o arquivo html chegar a uns 300K. Daí por diante, o carregamento do arquivo passou a falhar, cortando pedaços de texto cada vez maiores, até dar o erro "Out of Memory".

Não posso usar OLE com Word, pois pretendo usar esse método comercialmente, e não posso exigir que o usuário tenha o Word instalado

Alguém tem alguma outra solução?
USUARIO.EXCLUIDOS 25/05/2004 17:17:51
#26631
Resposta escolhida
Max[/]b

Nà o sei se eu entendi bem mais vamos lá , vc quer tirar todas as tag do código de fonte da página html certo ?

[b] Marque na referencias

Microsoft HTML Object  Library 


e use esse código para para pegar só o corpo da página


'###############################################3

Dim webdoc As HTMLDocument
Dim texbody As HTMLBody
Dim Texob As IHTMLTxtRange
Set webdoc = web1.Document
Dim Acollection As IHTMLElementCollection
Set Acollection = webdoc.All.tags("a")
Set texbody = webdoc.body

Set Texob = texbody.createTextRange()
Text1.Text = Texob.Text



Blz ?


USUARIO.EXCLUIDOS 25/05/2004 17:36:02
#26638
Na Hora que recebe o DIM DIM , num esquece do Churrasco

Tópico encerrado , respostas não são mais permitidas