정규식은 문자열의 모호한 일치로 모든 언어에 공통적입니다.
1, 자
2. 문자 세트
3. 한정 기호
욕심쟁이 패턴: 항상 가능한 한 많은 문자를 일치시키려고 시도합니다.
욕심이 아니라 항상 가능한 한 적은 수의 문자를 일치시킵니다.
{0,} 은 (는) * 메타문자와 동일한 이전 문자 0 회 이상을 찾습니다.
{+,} 이전 문자 1 회 또는 무한대와 일치하며+메타문자와 같습니다.
{0, 1} 이전 문자 0 회 또는 1 번과 일치합니다. 메타문자
() 뒤에 (adc)* 와 같은 특수 메타 문자가 오는 경우 * 로 제어되는 선행 문자는 선행 문자가 아닌 () 의 전체 내용입니다.
4. 특수 그룹화 사용 테이블: 일반 함수 반환 객체에만 유용합니다.
5. 유지 관리
어설 션의 표현에서 볼 수 있듯이 그룹 기호를 사용하지만 시작 부분에 물음표가 추가됩니다. 이 물음표는 이것이 비캡처 그룹이라는 것을 나타냅니다. 이 그룹에는 번호가 없으며 역방향 참조에 사용할 수 없습니다. 단언으로만 사용할 수 있습니다.
경기
제 이해는 이렇습니다.
5. 예
(1) 이 아닙니다
(? ! 。 *200).*$, 200 만 일치.
(? ! 。 *[200|400]).*$, 200 과 400 만 일치.
[a-z] 거꾸로, a-z 문자 없음
(2) \u4e00-\u9fa5 중국어
(3) r"\b([\u4e00-\u9fa5]\s? [\u4e00-\u9fa5]+)\b" # 샤오밍은 이 단어 중간에 공백을 더한 것과 일치합니다.
Compile 함수는 정규식을 컴파일하고 match () 및 search () 함수에 사용할 정규식 (패턴) 객체를 생성하는 데 사용됩니다.
Match 는 문자열의 시작 부분에서 패턴을 일치시키려고 시도하고, 실패할 경우 none 을 반환합니다.
검색은 전체 문자열을 검색하고 성공적으로 일치하는 첫 번째 문자열을 반환합니다.
재일치와 재검색의 차이점:
일반 표현식 대체 함수
지정된 위치에서 일치에 성공한 문자열을 대체하고 대체 횟수를 반환하며 각각 두 변수에 의해 허용될 수 있습니다.
(2) 세 개 이상의 문자를 잘라서 [] (구분 기호를 예약하지 않음):
(3) () 를 사용하여 패킷 캡처 (구분 기호 유지):
문자열에서 정규 표현식과 일치하는 모든 하위 문자열을 찾아 목록을 반환합니다. 일치하는 항목이 없으면 빈 목록을 반환합니다.
참고: match 와 search 는 한 번 일치하고 findall 은 모두 일치합니다.
사용법:
주: 1: 일단 일치하면 다시 일치하고, 이전 일치 성공부터 시작되거나, 일치 성공 문자열로 인식되며 다음 일치에 참여하지 않습니다.
주 2: 일치하는 규칙, 즉 빈 규칙을 쓰지 않으면 원래 문자열보다 한 자리 더 많은 빈 문자열 목록이 반환됩니다.
주 3: 규칙이 null 문자와 일치할 때 규칙에 하나의 그룹만 있고 그룹 뒤에 * 가 오는 경우 그룹 내의 내용은 0 개 이상일 수 있으므로 그룹에는 두 가지 의미가 있습니다.
한 가지 의미는 그룹의 내용과 일치하는 것입니다.
두 번째 레이어는 그룹에서 0 의 내용 일치 (즉, 비어 있음) 를 의미합니다
따라서 * 를 사용하지 마십시오. 그렇지 않으면 빈 문자열과 일치할 수 있습니다.
표현식 객체 유형을 반환하는 정규 표현식입니다.
예를 들면 다음과 같습니다.
객체를 반환하려면 일반적인 방법으로 문자열을 가져와야 합니다.