우리는 매일 온라인에서 수만 개의 문자열을 보게 됩니다. 이러한 문자열 중에서 예를 들어, 이메일 주소처럼 원하는 문자열만 추출하려면 어떻게 해야할까요?
오늘은 프로그래밍 언어를 통해 텍스트 처리를 효과적으로 해주는 정규표현식(Regular Expressions) 에 대해 알아보겠습니다. 정규표현식(Regular Expressions)이란 쉽게 말해서, 패턴이라고 생각하면 됩니다.
문자열에서 패턴을 찾겠다는 것이죠. 그럼 파이썬에서 정규표현식을 이용하기 위해 알아야 할 2가지에 대해 언급하겠습니다. 1) 정규표현식을 만드는 방법 2) 파이썬 re 모듈(정규표현식)에 있는 메소드 패턴 만들기 먼저, 결국 정규표현식을 작성하려면 패턴을 만들 줄 알아야합니다.
정규표현식에서 문자는 2가지 종류가 있습니다. '일반문자(literal)'와 '메타문자'인데요.
일반문자는 말 그대로 평소에 사용하는 '가나라나abcd' 문자를 의미합니다. 메타문자(metacharacter)는 정규표현식에서 특별한...
#
re모듈
#
정규표현식
#
정규표현식이란
#
텍스트마이닝
#
텍스트전처리
#
파이썬데이터분석
#
파이썬텍스트
#
패턴
원문 링크 : 어떤 언어에도 쓰이는 정규표현식 이해하기