Open IDLE και να δημιουργήσει ένα δοκιμή αρχείο κειμένου με αντιγραφή και επικόλληση κάποια τυχαίο κείμενο στο αρχείο μαζί με κάποια URLs . Αποθηκεύστε το αρχείο ως TestText.txt στον κατάλογο που εμφανίζεται στο παράθυρο διαλόγου σώσει έτσι δεν έχετε να ανησυχείτε για διαδρομές μεταξύ του διερμηνέα Python και αυτό το αρχείο . 2
Πηγαίνετε στο κύριο IDLE παράθυρο και πληκτρολογήστε
>>>> εισαγωγή νέου
στη γραμμή Python . Αυτό φορτώνει κανονική μηχανή έκφραση της Python
εικόνων 3
Διαβάστε το κείμενο της δοκιμής σας σε Python και να το διατηρήσει στη μνήμη με τις παρακάτω εντολές : .
>>> TestText = ανοιχτή ( « OCB_1.txt )
>>> πρώτες TestText.read = ( )
OCB_1.txt είναι το όνομα του αρχείου δοκιμής μου - μια αντιγραφή και επικόλληση του Ambrose Bierce «Μια εμφάνιση στο Owl Creek Bridge , " με μερικά URLs επικολληθεί μέσα στις παραπάνω εντολές , το αρχείο κειμένου ανοίγει και ανατίθεται στη μεταβλητή TestText ? είναι τότε διαβάστε στη μνήμη με το ειδικό μεταβλητό πρώτες
. Φτηνές 4
Pre - συγκεντρώνουν την κανονική έκφραση , προκειμένου να επιταχυνθεί η διαδικασία ανάλυσης . Αυτό είναι ιδιαίτερα χρήσιμο όταν πρόκειται για μεγάλα αρχεία κειμένου . Πληκτρολογήστε τις ακόλουθες εντολές στη γραμμή Python : >>>
pattobj = re.compile ( « https ://( [ - \\ w \\ . ] + ) + ( : \\ D + ) ; ( /( [ \\ w /_ \\ . ] * ( \\ ; \\ S + ) ? ) ?) ; " )
5
Ενεργοποιήστε τη μέθοδο findall πληκτρολογώντας τη σχετική εντολή regex μαζί με τη μεταβλητή που το κείμενο στη μνήμη : .
findallobj = pattobj.findall ( πρώτων )
Αυτό δημιουργεί μια νέα μεταβλητή , findallobj , που περιέχει τα μοτίβα που προκύπτουν από το regex
Η 6
Εμφανίστε το URL το regex βρεθεί με την εντολή εκτύπωσης :
εκτύπωσης ( findallobj )
Η έξοδος μοιάζει κάπως έτσι :
[ ( ' www.sjca . edu ) , ( « www.cantlers.com /index.shtml ) ]
Η
εικόνων
Πνευματικά δικαιώματα © Γνώση Υπολογιστών Όλα τα δικαιώματα κατοχυρωμένα