LEITURA DE PDF

ALVAROVB2009 22/10/2025 10:54:45
#505122
Pessoal bom dia, estou com um problema para poder ler PDF e estou usando a classe do C#
private void LerPDF(string CaminhoArquivo)
{
ITextExtractionStrategy Ites = new iTextSharp.text.pdf.parser.LocationTextExtractionStrategy();
using (PdfReader reader = new PdfReader(CaminhoArquivo))
{
string Pagina = "";
Pagina = PdfTextExtractor.GetTextFromPage(reader, 1, Ites);
LinhasLidasPDF = Pagina.Split('
');
.
.
.
}
Nesse classe estou criando a lista com tudo que foi lido e pelo Regex estou tentando pegar as informações, porém esse pdf que é de um lugar único, é uma contabilidade que esta enviando para o meu cliente, então no caso sempre tem os mesmos nomes, em determinadas linhas a informação esta cerca de 0,3 cm acima do "Nome do campo" e ai quando leio o pdf, ele sai em linha diferente.
Nome exemplo abaixo é como esta sendo lido o pdf e tirando o compl. que esta na parte da empresa AAA que realmente não possui informação, a parte bairro , cidade , estado tem informação lançada no pdf porém essas informações saíram na linha de baixo, por estarem ligeiramente abaixo do "nome do campo"
Assim como o NOME DO PAI DA FUNCIONÁRIA que saiu antes do Nome Pai : , pois ele esta impresso ligeiramente acima e por ai vai.

Alguém tem algum método melhor para ler um pdf, sem usar Dll paga ?
Estou tentando com a IA também e não estou tendo evolução, pois não esta conseguindo resolver a leitura dos dados que estão ligeiramente desalinhados

Esse é o texto que esta dentro da string Pagina, preparando para fazer o split
"FICHA DE REGISTRO DE EMPREGADO
Página 1/2
Nome Funcionário :NOME FUNCIONARIA
Data Admissão : 18/08/2025Nº Registro : 99980
Matrícula eSocial:AAA99980
Dados da Empresa
Razão Social :AAA BENS LTDAC.N.P.J/C.E.I :99.999.999/0001-88
Nome Fantasia :AAACod. Munic.:Cod. Atividade:
9915851
Endereço :Compl. :
Avenida Salgado Filho99
Bairro :Cidade :Estado :Cep :07010-010
CentroGuarulhosSP
Dados do Empregado
Dados Pessoais Empregado
Nome Mãe :NOME DA MÃE DA FUNCIONARIA
NOME DO PAI DA FUNCIONÁRIA
Nome Pai :
Est. Civil :Solteiro(a)Nat. :GuarulhosEstado :SPNacionalidade :Brasileira
Data de Nascimento :19/09/2008Sexo :Instrução :
FemininoEnsino médio incompleto
Endereço :R Tiago887Compl. :
Bairro :CocaiaCidade :GuarulhosEstado :SPCep :07030-010
Informações sobre deficiência
Física:NãoIntelectual:NãoPreenche Cota de Pessoas com Deficiência:Não
Mental:NãoAuditiva:NãoObservações:
Visual:NãoReabilitado:Não
Dados Funcionais
Salário Admissão :Cargo Admissão :Data exame médico :08/08/2025
R$1.069,50JO..."

Desde já agradeço a todos
Faça seu login para responder