Σύνταξη κανονικών εκφράσεων
- Μια κανονική έκφραση (regular expression) επιτρέπει τον ορισμό σύνθετων συμβολοσειρών με δηλωτικό τρόπο.
- Η κανονική έκφραση αποτελείται από
- γράμματα (που παριστάνουν τον εαυτό τους) και
- ειδικά σύμβολα
Τα παρακάτω σύμβολα έχουν ειδικό νόημα:
- ^
- Αρχή της γραμμής
- $
- Τέλος της γραμμής
- .
- Οποιοδήποτε γράμμα
- [abc]
- Ένα από τα γράμματα a, b, ή c
- [a-z]
- Ένα από τα γράμματα a μέχρι z
- [^abc]
- Οποιοδήποτε γράμμα εκτός από τα a, b, και c.
- Έκφραση?
- Η έκφραση μία ή καμία φορά
- Έκφραση*
- Η έκφραση μηδέν ή περισσότερες φορές
- Έκφραση+
- Η έκφραση μία ή περισσότερες φορές
- Έκφραση{n}
- Η έκφραση n φορές
- Έκφραση{n,}
- Η έκφραση τουλάχιστον n φορές
- Έκφραση{n,m}
- Η έκφραση τουλάχιστον n αλλά
όχι περισσότερες από m φορές
- Έκφραση1|Έκφραση2
- Η έκφραση1 ή η έκφραση2
- (Έκφραση)
- Το περιεχόμενο στην παρένθεση
- \1 \2 ... \n
- To περιεχόμενο της νοστής παρένθεσης
- \0nnn
- Χαρακτήρας με οκταδική τιμή nnn
- \0xnnn
- Χαρακτήρας με δεκαεξαδική τιμή nnn
- \\
- Ο χαρακτήρας \
- \t
- Ο χαρακτήρας tab
- \n
- Ο χαρακτήρας newline
- \r
- Ο χαρακτήρας carriage return
- \a
- Ο χαρακτήρας alert
- \f
- Ο χαρακτήρας form feed
- \e
- Ο χαρακτήρας escape
- \cx
- Ο χαρακτήρας control-x (a-z)
- \d
- Ψηφίο
- \D
- Μη ψηφίο
- \s
- Κενό
- \S
- Μη κενό
- \p{InGreek}
- Ελληνικό γράμμα: όνομα μπλοκ http://www.unicode.org/Public/3.0-Update/Blocks-3.txt
- \P{InGreek}
- Μη ελληνικό γράμμα