
정규표현식(regex) 정리
·
Etc.
자연어 및 텍스트 데이터를 전처리할 때 유용하게 쓸 수 있는 정규표현식에 대해 정리해둡니다.EmEditor의 문서를 바탕으로 정리하였습니다.(⚠️혹시 글자 폰트가 이상하게 깨질 경우, 새로고침하면 정상적으로 나옵니다!)1. 리터럴 (Literal)모든 문자는 기본적으로 Literal이며, 스스로 매치되는 문자임 (ex. "Hello"를 검색하면 문서에서 "Hello"와 일치한 부분들이 검색됨)단, 다음 문자들은 제외함 : ".", "*", "?", "+", "(", ")", "{", "}", "[", "]", "^", "$", "\" (ex. "\?"를 검색하면 문서에서 "?"와 일치한 부분들이 검색됨)2. 메타문자온점(dot)임의의 1개의 문자 또는 공백예시) `.e`를 검색 ➡️ `he`, `we`,..