title image


Smiley Re: Texterkennung und Integration
Hallo Karsten,



>nur als Ergänzung zu den anderen Antworten:



Immer her damit :-)



>Vermutlich erfüllt dieses Programm deine Anforderungen. Keine Frage allerdings, dass man noch bessere Ergebnisse erzielen kann, wenn man von Hand eingreift. Sonst wird z.B. leicht mal aus einem mehrspaltigen Satzspiegel eine Tabelle oder umgekehrt. Was dazu führen kann, dass nebeneinanderliegende Tabellen-Einträge im Ergebnis nicht mehr nebeneinander liegen...



Da hast Du natürlich recht, ist für meine Anforderung aber nicht schlimm. Der Text kann aussehen wie er will, da er nur für die Suchmaschine als Indexfutter benötigt wird. Ein Betrachter soll beim öffnen des Dokuments immer das ursprünglich gescannte Original sehen. Meinst Du, es ist möglich der Software bspw. beizubringen "Nimm diese hundert PDF-Dokumente, OCR're jedes einzelne davon, bette den gescannten Text im jew. Dokument ein und speichere es anschließend wieder als PDF ab" ?



>PS: Ich hoffe, die Bilder liegen in einer ausreichenden Auflösung vor? 300 dpi sollten es wohl schon sein, d.h. die längere Seite von A4 (ca. 30cm) sollte ca. 3500 Pixel messen).



Richtig: Die meisten in 300dpi s/w, eine geringere Anzahl in Grautönen oder Farbe.



Ein schönes WE
Gruß, smicat

geschrieben von

Login

E-Mail:
  

Passwort:
  

Beitrag anfügen

Symbol:
 
 
 
 
 
 
 
 
 
 
 
 
 

Überschrift: