Δείτε πώς λειτουργεί:
1. Προσδιορίστε συχνές λέξεις: Ο αλγόριθμος αναλύει το κείμενο και προσδιορίζει τις λέξεις που εμφανίζονται συχνότερα.
2. Αντιστοιχίστε μεμονωμένους χαρακτήρες: Κάθε συχνή λέξη έχει εκχωρηθεί ένας μοναδικός μοναδικός χαρακτήρας (συνήθως δεν είναι μέρος του αρχικού αλφαβήτου).
3. Αντικαταστήστε τις λέξεις: Στη συνέχεια, το αρχικό κείμενο σαρώνεται και κάθε συχνή λέξη αντικαθίσταται με τον ενιαίο χαρακτήρα του.
4. Αποθηκεύστε τη χαρτογράφηση: Η χαρτογράφηση των χαρακτήρων σε λέξεις αποθηκεύεται ξεχωριστά, έτσι ώστε να μπορεί να χρησιμοποιηθεί για την αποσύνθεση του κειμένου αργότερα.
Παράδειγμα:
Ας πούμε ότι τα συχνές λέξεις σε ένα κείμενο είναι "το", "και," "είναι" και "σε".
* Χαρτογράφηση:
* "Το" -> "Α"
* "και" -> "Β"
* "είναι" -> "C"
* "Για" -> "D"
* συμπιεσμένο κείμενο: "Αυτή είναι μια υπέροχη μέρα B It C Sunny D να βγείτε έξω."
Σημείωση: Αυτή η τεχνική είναι απλή αλλά συχνά δεν είναι πολύ αποτελεσματική για τη συμπίεση μεγάλων ποσοτήτων κειμένου. Μπορεί να είναι πιο αποτελεσματική όταν συνδυάζεται με άλλες τεχνικές όπως η κωδικοποίηση μήκους λειτουργίας.
Πνευματικά δικαιώματα © Γνώση Υπολογιστών Όλα τα δικαιώματα κατοχυρωμένα