Η διαδικασία της διάσπασης ενός κειμένου σε μέρη και του τρόπου με τον οποίο σχετίζονται τα διάφορα μέρη είναι γνωστή ως
τμηματοποίηση κειμένου . Είναι μια μέθοδος που χρησιμοποιείται στην επεξεργασία φυσικής γλώσσας (NLP) για τη διαίρεση ενός κειμένου σε σημαντικές ενότητες. Αυτές οι μονάδες μπορεί να είναι λέξεις, φράσεις, προτάσεις ή ακόμα και ολόκληρες παράγραφοι. Η τμηματοποίηση κειμένου βοηθά στον προσδιορισμό της δομής του κειμένου και διευκολύνει την ανάλυση και την κατανόηση.