Προγραμματισμός

* Γνώση Υπολογιστών >> Προγραμματισμός >> Perl Προγραμματισμός

Πώς να εξαναγκάσει καμία αρχείο σε ένα UTF - 8 σε Perl

Unicode Transformation Format ( UTF - 8 ) είναι μια μορφή κωδικοποίησης χαρακτήρων που χρησιμοποιεί μπλοκ οκτώ -bit αντιπροσωπεύει ένα χαρακτήρα , και χρησιμοποιείται ευρέως σε συστήματα ηλεκτρονικών υπολογιστών . Περιλαμβάνει την ίδια συμπαγή κωδικοποίηση απλό κείμενο ως μορφή ASCII , αλλά και επιτρέπει την κωδικοποίηση των ειδικών χαρακτήρων . Αυτό δίνει πρόσθετη λειτουργικότητα , αλλά θέτει προκλήσεις, όταν χρησιμοποιείται στον κώδικα του προγράμματος . Οι νεότερες εκδόσεις του Perl πλοίο με ενότητες κωδικοποίησης και λειτουργία binmode που επιτρέπουν τη γλώσσα προγραμματισμού για να χειριστεί την κωδικοποίηση και αποκωδικοποίηση του UTF - 8 αρχεία . Εισόδου και εξόδου προς /από ένα πρόγραμμα Perl μπορεί να γίνει για να χειριστούν κατάλληλα το UTF - 8 χαρακτήρες με τη χρήση ενός διακόπτη στη γραμμή εντολών . Τα πράγματα που θα χρειαστείτε
ActiveState Perl
Perl συντάκτης
Η Εμφάνιση Περισσότερες οδηγίες
Η 1

Ξεκινήστε τον επεξεργαστή Perl για να ξεκινήσει την κωδικοποίηση του προγράμματος Perl . Μπορείτε να χρησιμοποιήσετε έναν απλό επεξεργαστή κειμένου, όπως το Σημειωματάριο των Windows ή τον επεξεργαστή vi στο UNIX . Θα πρέπει να αποθηκεύσετε το αρχείο με επέκταση pl . Έτσι ώστε το σύστημα θα είναι σε θέση να το αναγνωρίσει ως ένα πρόγραμμα Perl . 2

Τοποθετήστε μια επιτακτική ανάγκη να απαιτούν την ενότητα " Κωδικοποίηση " στην κορυφή του προγράμματος Perl . Θα είστε σε θέση να χρησιμοποιήσετε τις κωδικοποίηση και αποκωδικοποίηση λειτουργίες στο σώμα του Προγράμματος Perl για την κωδικοποίηση /αποκωδικοποίηση των δεδομένων σε /από UTF - 8 μορφή , όπως απαιτείται . Πληκτρολογήστε την ακόλουθη στον επεξεργαστή Perl για να χρησιμοποιήσετε αυτήν τη μέθοδο : !

# /Usr /bin /perlrequire Κωδικοποίηση ? Εναλλακτικά , μπορείτε να καλέσετε τη μονάδα Κωδικοποίηση , ως εξής : η χρήση Encode ? Για την κωδικοποίηση των δεδομένων , θα πρέπει να πληκτρολογήσετε τα ακόλουθα στο σώμα του προγράμματός σας : $ output = κωδικοποίηση :: κωδικοποίηση ( " utf8 " , $ string)?
εικόνων 3

Καθορίστε τη μορφή κωδικοποίησης UTF - 8 , όταν ανοίγετε ένα αρχείο . Μπορείτε να το κάνετε αυτό, πληκτρολογώντας μία από τις ακόλουθες μορφές στον επεξεργαστή :

ανοικτή ΑΡΧΕΙΟ , " <: κωδικοποίηση ( iso -8859- 7)" , $ αρχείο_εισόδου ?

Ανοίξει FILE , . " <: utf8 " , $ αρχείο_εισόδου ?

Αυτό θα πει Perl για να κωδικοποιήσει το αρχείο σε μορφή UTF - 8 , ή να προετοιμαστούν για την κωδικοποίηση UTF-8
Η 4

Καθορίστε το " binmode " κατά την ανάγνωση ή την εγγραφή αρχείων , για να εξασφαλίσει ότι τα αρχεία είναι κωδικοποιημένα σε μορφή UTF - 8 .

Για να ρυθμίσετε το binmode σε UTF - 8, όταν διαβάζετε ένα αρχείο , πληκτρολογήστε την ακόλουθη στον επεξεργαστή : $ filename = " filename.txt " ? $ αρχείο_εισόδου = IO :: Αρχείο - > νέα ( $ filename , ' r' ) ? binmode ( $ αρχείο_εισόδου , ​​' : utf8 ' ) ?

για να ρυθμίσετε το binmode σε UTF - 8, όταν γράφετε σε ένα αρχείο , πληκτρολογήστε την ακόλουθη στον επεξεργαστή : $ filename = " filename.txt " ? ανοιχτό ( OUT , ​​" > $ filename" ) ? binmode ( OUT " ? : utf8 " ) ?

Μπορείτε επίσης να χρησιμοποιήσετε binmode να ορίσετε τη μορφή του προτύπου εισόδου και εξόδου σε UTF - 8 , ως εξής : binmode ( STDIN , ' : utf8 ' ) ? binmode ( STDOUT » : utf8 ' ) ?
Η
εικόνων

Συναφής σύστασή

Πνευματικά δικαιώματα © Γνώση Υπολογιστών Όλα τα δικαιώματα κατοχυρωμένα