* Τα PDFs έχουν σχεδιαστεί για φορητότητα εγγράφων, όχι επεξεργασία. Αποθηκεύουν περιεχόμενο με τρόπο που είναι δύσκολο να επεξεργαστεί άμεσα.
* OCR είναι το κλειδί για την εξαγωγή κειμένου. Όταν αντιγράφετε κείμενο από PDF, ο υπολογιστής σας χρησιμοποιεί οπτική αναγνώριση χαρακτήρων (OCR) για να μετατρέψει τις εικόνες των γραμμάτων σε επεξεργάσιμο κείμενο.
Εδώ είναι μερικοί συνήθεις λόγοι για τους οποίους το κείμενο μπορεί να φαίνεται "μη αναγνωρίσιμο" σε λέξη μετά την αντιγραφή από ένα PDF:
* Το PDF σαρώθηκε. Εάν το PDF δημιουργήθηκε με τη σάρωση ενός εγγράφου χαρτιού, η διαδικασία OCR ενδέχεται να μην είναι ακριβής, οδηγώντας σε σφάλματα στο αντιγραμμένο κείμενο.
* Συγκροτική μορφοποίηση. Τα PDF με σύνθετη μορφοποίηση, όπως στήλες, πίνακες ή εικόνες ενσωματωμένες με κείμενο, μπορούν να προκαλέσουν σφάλματα OCR.
* Μη τυποποιημένες γραμματοσειρές. Εάν το PDF χρησιμοποιεί ασυνήθιστες γραμματοσειρές ή γραμματοσειρές που δεν είναι διαθέσιμες στον υπολογιστή σας, το OCR μπορεί να παρερμηνεύσει τους χαρακτήρες.
Τι να κάνετε αντ 'αυτού:
1. Εργαλεία όπως Adobe Acrobat Pro, Nitro Pro ή online μετατροπείς μπορούν να χειριστούν το OCR και να παρέχουν μια πιο ακριβή μετατροπή.
2. Αντιγραφή και επικολλήστε απευθείας από το PDF: Εάν το PDF δημιουργήθηκε από το κείμενο, μπορείτε συνήθως να αντιγράψετε και να επικολλήσετε απευθείας στη λέξη, αν και η μορφοποίηση μπορεί να χαθεί.
3. Αποθηκεύστε το PDF ως έγγραφο λέξης: Πολλά PDF έχουν την επιλογή να αποθηκεύσουν ως έγγραφο λέξης (.DOCX) το οποίο θα διατηρήσει τη μορφοποίηση και την αναγνώριση κειμένου.
Σημαντική σημείωση: Ακόμη και με τα καλύτερα εργαλεία, ορισμένα PDFs ενδέχεται να έχουν ακόμα κείμενο που δεν αναγνωρίζεται τέλεια. Μπορεί να χρειαστεί να επεξεργαστείτε με μη αυτόματο τρόπο το αντιγραμμένο κείμενο σε λέξη.
Πνευματικά δικαιώματα © Γνώση Υπολογιστών Όλα τα δικαιώματα κατοχυρωμένα