Freeteo


Pensieri e C#dice di Matteo Raumer
Home Blogs | Home | Login | Contact | My Profile | RSS | About | Cerca

Ricercare del testo dentro ad un file PDF

Qualche volta potrebbe capitare, come oggi è capitato a me, di dover cercare del testo contenuto dentro ad un file PDF tramite codice .net. Innanzitutto mi sono affidato alla sempre ottima libreria ITextSharp con la quale mi sento sempre a mio agio, ma purtroppo questa volta non ho trovato niente di "già pronto" per questa esigenza.   Allora ho cominciato da "buon developer" a cercare su internet qualche specifica del file pdf da Adobe  e se qualche altro avess 
Leggi tutto il post...
Categoria: Tips
lunedì, 08 dic 2008 Ore. 22.53

Scrivi un commento

Nome:
Blog:
E-Mail:
(l'indirizzo e-mail non verrà pubblicato, consente di essere avvertiti quando arrivano nuovi commenti a questo Post)
Codice:
Corpo:
Cookie:

Commenti

Autore: andreaInviato il: 24 nov 2010 - 16.34
Ciao,

quale riferimento bisogna importare in un progetto per utilizzare il codice riportato?

Grazie
Autore: Matteo RaumerInviato il: 24 nov 2010 - 18.36
Ciao,
devi referenziare la dll ITextSharp e poi importare il suo namespace:
using iTextSharp.text.pdf;
...

è questo che intendi?
Casomai se hai problemi puoi postare sul forum (http://www.dotnethell.it/forum/) che ne possiamo parlare in dettaglio...

Ciao.
Matteo Raumer
Autore: DavideInviato il: 23 dic 2010 - 15.03
Ciao, ho notato malfunzionamenti ma ho trovato una soluzione che, chissà, potrebbe interessarti oppure interessare un altro googlatore come me :)

Ecco:
String tmp = "";
StringBuilder sb = new StringBuilder();
try
{
PdfReader reader = new PdfReader(FilePath);

for (int i = 1; i <= reader.NumberOfPages; i++)
{
ITextExtractionStrategy its = new iTextSharp.text.pdf.parser.SimpleTextExtractionStrategy();
String s = PdfTextExtractor.GetTextFromPage(reader, i, its);
sb.Append(s);
}
}
catch (Exception ex)
{

}
tmp = sb.ToString(); //--- ho tutto il testo del pdf in questa stringa
return tmp;

Scritto in c# con VS 2008.

Ciao!
Autore: Matteo RaumerInviato il: 26 dic 2010 - 19.35
Grazie Davide per aver postato questa tua soluzione.
Sicuramente è molto meglio della mia versione "artigianale" spiegata qui...
Forse questa funzionalità è stata aggiunta dopo il mio post :-)
Copyright © 2002-2007 - Blogs 2.0
dotNetHell.it | Home Page Blogs
ASP.NET 2.0 Windows 2003