pattern = re.compile('[^ A-Za-z0-9가-힣+]+')
# 모든 특수 기호 찾기
textData1 = pattern.findall(textData)
print(textData1)
# 모든 특수기호 제거
textData1 = pattern.sub('', textData)
print(textData1)
# 대괄호와 그안의 내용 지우기
regex = "\[.*\]|\s-\s.*"
textData = re.sub(regex, '', textData )
개인 프로젝트중에 웹 스캘핑을 해서 프린트를 찍으니 알 수 없는 공백이 생겨서 이것을 여러 방식으로 해결해보고자 했지만 가장 효과적이었던 것은 정규식으로 프린트로 쉽게 볼 수 있는 문자열을 제외해서 프린트를 찍는 방법이었다
이 방법이 항상 먹힌다는 보장을 하기에는 조금 자신이없다
왜냐하면 print를 찍으면 출력에 제외되는 문자가 혹시나 있을수있다
나는 이방식으로 알수없는 특수기호 공백을 찾아내서 replace로 데이터에서 제거했다
중괄호, 소괄호에 적용하고싶을때 대괄호를 해당괄호로 변경해주면 사용할 수 있다
'코딩 공부 > PYTHON' 카테고리의 다른 글
파이썬 공부 로드맵 메모 (0) | 2022.05.11 |
---|---|
파이썬 - 변수사용 (0) | 2022.04.18 |
파이썬 - 집합 (0) | 2022.04.18 |
파이썬 - 딕셔너리 (0) | 2022.04.15 |
파이썬 - 배열 (0) | 2022.04.14 |