Προγραμματισμός

* Γνώση Υπολογιστών >> Προγραμματισμός >> Python Προγραμματισμός

Τρόπος εμφάνισης URL Χρησιμοποιώντας Regular Expressions

Κανονικές Εκφράσεις παρέχουν τον προγραμματιστή με ισχυρά εργαλεία για την ανάλυση κειμένου και τις πράξεις χειραγώγησης . Βρέθηκαν παντού από την επικύρωση φόρμα e-commerce σε high-stakes της ασκήσεως της προσφυγής - όπου οι δικηγόροι αναζητήσει συνδυασμούς λέξεων σε μηνύματα ηλεκτρονικού ταχυδρομείου που προσθέτουν έως και " ένοχοι " - regexes ανήκουν στην εργαλειοθήκη κάθε προγραμματιστή . Δυστυχώς , απόκρυφες σύνταξή τους στέκεται ως εμπόδιο για πολλούς χρήστες οι οποίοι θα μπορούσαν να επωφεληθούν από αυτές . Μια πιθανή χρήση σαρώνει ένα κείμενο για το Universal Resource Locators , που είναι γνωστή κοινώς ως διευθύνσεις ιστοσελίδων . Η γλώσσα προγραμματισμού Python καταφέρνει αυτό το έργο σε λίγες γραμμές κώδικα . Τα πράγματα που θα χρειαστείτε
Python 2.6 ή υψηλότερη , με το IDLE ολοκληρωμένο περιβάλλον ανάπτυξης
αρχείο κειμένου για τη δοκιμή
Η Εμφάνιση Περισσότερες οδηγίες
Η 1

Open IDLE και να δημιουργήσει ένα δοκιμή αρχείο κειμένου με αντιγραφή και επικόλληση κάποια τυχαίο κείμενο στο αρχείο μαζί με κάποια URLs . Αποθηκεύστε το αρχείο ως TestText.txt στον κατάλογο που εμφανίζεται στο παράθυρο διαλόγου σώσει έτσι δεν έχετε να ανησυχείτε για διαδρομές μεταξύ του διερμηνέα Python και αυτό το αρχείο . 2

Πηγαίνετε στο κύριο IDLE παράθυρο και πληκτρολογήστε

>>>> εισαγωγή νέου

στη γραμμή Python . Αυτό φορτώνει κανονική μηχανή έκφραση της Python
εικόνων 3

Διαβάστε το κείμενο της δοκιμής σας σε Python και να το διατηρήσει στη μνήμη με τις παρακάτω εντολές : .

>>> TestText = ανοιχτή ( « OCB_1.txt )

>>> πρώτες TestText.read = ( )

OCB_1.txt είναι το όνομα του αρχείου δοκιμής μου - μια αντιγραφή και επικόλληση του Ambrose Bierce «Μια εμφάνιση στο Owl Creek Bridge , " με μερικά URLs επικολληθεί μέσα στις παραπάνω εντολές , το αρχείο κειμένου ανοίγει και ανατίθεται στη μεταβλητή TestText ? είναι τότε διαβάστε στη μνήμη με το ειδικό μεταβλητό πρώτες
. Φτηνές 4

Pre - συγκεντρώνουν την κανονική έκφραση , προκειμένου να επιταχυνθεί η διαδικασία ανάλυσης . Αυτό είναι ιδιαίτερα χρήσιμο όταν πρόκειται για μεγάλα αρχεία κειμένου . Πληκτρολογήστε τις ακόλουθες εντολές στη γραμμή Python : >>>

pattobj = re.compile ( « https ://( [ - \\ w \\ . ] + ) + ( : \\ D + ) ; ( /( [ \\ w /_ \\ . ] * ( \\ ; \\ S + ) ? ) ?) ; " )
5

Ενεργοποιήστε τη μέθοδο findall πληκτρολογώντας τη σχετική εντολή regex μαζί με τη μεταβλητή που το κείμενο στη μνήμη : .

findallobj = pattobj.findall ( πρώτων )

Αυτό δημιουργεί μια νέα μεταβλητή , findallobj , που περιέχει τα μοτίβα που προκύπτουν από το regex
Η 6

Εμφανίστε το URL το regex βρεθεί με την εντολή εκτύπωσης :

εκτύπωσης ( findallobj )

Η έξοδος μοιάζει κάπως έτσι :

[ ( ' www.sjca . edu ) , ( « www.cantlers.com /index.shtml ) ]
Η
εικόνων

Συναφής σύστασή

Πνευματικά δικαιώματα © Γνώση Υπολογιστών Όλα τα δικαιώματα κατοχυρωμένα