이 비디오는 Python의 정규식 패키지를 사용하여 텍스트 문자열에서 구두점을 일치시키고 제거하는 방법을 보여줍니다. 텍스트 데이터에는 데이터 분석을 위해 텍스트를 구성 단어로 분할하기 전에 전처리 단계로 텍스트에서 제거할 수 있는 구두점이 있는 경우가 많습니다. Python 정규식 패키지를 사용하면 구두점을 빈 문자열로 쉽게 일치시키고 교체하여 모든 구두점을 효과적으로 제거할 수 있습니다.
이 Python 코드 클립에 사용된 코드:
다시 수입
줄 = '''
Nappa @ Vegeta: 스카우터는 자신의 파워 레벨에 대해 어떻게 말합니까?
Vegeta @ Nappga: 끝났어 (9000!)
Nappa @ Vegeta: [What 9000?] 그건 안 돼…
re.sub()로 구두점 일치 및 제거
re.sub(패턴 = [^ws],
대답 = ,
문자열 = 줄)
반응 네이티브 현지화
re.sub()를 사용하여 구두점과 공백을 일치시키고 제거합니다.
re.sub(패턴 = W,
대답 = ,
문자열 = 줄)
- 다음을 사용하여 몇 가지 일반적인 구두점 문자에 액세스할 수 있습니다.
가져오기 문자열
문자열.구두점
#파이썬
자바에서 파이썬으로 온라인 변환기
www.youtube.com
Python Regex: 구두점을 제거하는 방법
이 비디오는 Python의 정규식 패키지를 사용하여 텍스트 문자열에서 구두점을 일치시키고 제거하는 방법을 보여줍니다. 텍스트 데이터에는 데이터 분석을 위해 텍스트를 구성 단어로 분할하기 전에 전처리 단계로 텍스트에서 제거할 수 있는 구두점이 있는 경우가 많습니다. Python 정규식 패키지를 사용하면 구두점을 빈 문자열로 쉽게 일치시키고 교체하여 모든 구두점을 효과적으로 제거할 수 있습니다.