λογισμικό

Γνώση Υπολογιστών >> λογισμικό >  >> Συμπίεση δεδομένων

Ποια τεχνική συμπίεσης κειμένου αντικαθιστά μια συχνά χρησιμοποιούμενη λέξη με ένα μόνο χαρακτήρα;

Η τεχνική συμπίεσης κειμένου που αντικαθιστά συχνά χρησιμοποιούμενες λέξεις με έναν μόνο χαρακτήρα ονομάζεται υποκατάσταση .

Δείτε πώς λειτουργεί:

1. Προσδιορίστε συχνές λέξεις: Ο αλγόριθμος αναλύει το κείμενο και προσδιορίζει τις λέξεις που εμφανίζονται συχνότερα.

2. Αντιστοιχίστε μεμονωμένους χαρακτήρες: Κάθε συχνή λέξη έχει εκχωρηθεί ένας μοναδικός μοναδικός χαρακτήρας (συνήθως δεν είναι μέρος του αρχικού αλφαβήτου).

3. Αντικαταστήστε τις λέξεις: Στη συνέχεια, το αρχικό κείμενο σαρώνεται και κάθε συχνή λέξη αντικαθίσταται με τον ενιαίο χαρακτήρα του.

4. Αποθηκεύστε τη χαρτογράφηση: Η χαρτογράφηση των χαρακτήρων σε λέξεις αποθηκεύεται ξεχωριστά, έτσι ώστε να μπορεί να χρησιμοποιηθεί για την αποσύνθεση του κειμένου αργότερα.

Παράδειγμα:

Ας πούμε ότι τα συχνές λέξεις σε ένα κείμενο είναι "το", "και," "είναι" και "σε".

* Χαρτογράφηση:

* "Το" -> "Α"

* "και" -> "Β"

* "είναι" -> "C"

* "Για" -> "D"

* συμπιεσμένο κείμενο: "Αυτή είναι μια υπέροχη μέρα B It C Sunny D να βγείτε έξω."

Σημείωση: Αυτή η τεχνική είναι απλή αλλά συχνά δεν είναι πολύ αποτελεσματική για τη συμπίεση μεγάλων ποσοτήτων κειμένου. Μπορεί να είναι πιο αποτελεσματική όταν συνδυάζεται με άλλες τεχνικές όπως η κωδικοποίηση μήκους λειτουργίας.

Συναφής σύστασή

Πνευματικά δικαιώματα © Γνώση Υπολογιστών Όλα τα δικαιώματα κατοχυρωμένα