정규 표현식
위키백과에 따르면 정규 표현식
은 특정한 규칙을 가진 문자열의 집합을 표현하는 데 사용하는 형식 언어이다.
어떤 문자열을 특정 패턴에 부합한지 검사
하거나 특정 패턴에 부합한 문자열을 출력
하는데 사용된다.
대부분의 프로그래밍 언어에서 지원하며, 일부(perl, js, ruby)는 내장
되어 있고, 다른 일부(python, c, c++, java)는 표준 라이브러리
로 제공한다.
매번 공부 할만큼 했다 생각해도 가끔 사용하다보니 까먹게 되어 찾아볼 목적으로 정리 해 보았다.
공부 하는데 도움되는 사이트
RegExr 을 이용하여 아래 기호들을 적용해보며 공부
기호(표현식)와 의미
flag 옵션
사용 예
| 기호 | 의미 | | :-----------: | :----------------------------------------: | --------------------------- | | ^
x | 문자열이 문자 x로 시작된다 | | x$
| 문자열이 문자 x로 끝난다 | | .
| 모든 문자 | | x.
| 2글자 문자중 x로 시작하는 문자 | | .
x.
| 3글자 문자중 가운데 x인 문자 | | x+
| x가 1번 이상 반복된다. x{1,}
와 같은 의미 | | x*
| x가 0번 이상이다. x{0,}
와 같은 의미 | | x?
| x가 있을 수도 있고 없을 수 있다. | | abc |
qwe | 문자 abc와 문자 qwe 중 한개 | | [
abc]
| a,b,c중 한 문자 | | [^
abc]
| a,b,c가 포함되지 않은 문자 | | [
a -
z]
| a 부터 z중 한개 | | a(?=
x)
| 뒤에 x가 있는 a | | a(?!
x)
| 뒤에 x가 없는 a | | {
m}
| m번 반복 | | {
m,}
| m번 이상 반복 | | {
m,
n}
| m번 이상 n번 이하 반복 | | \1
| 첫번째 포획괄호 재사용 | | \2
| 두번째 포획괄호 재사용 |
Last updated