자연어 처리
[정규표현식] replace, series와 replace
주니코니
2023. 7. 28. 13:47
replace 함수란? 다음과 같다!
ex
1.포켓>포겟으로
2.텍스트 중 특수기호 제거 코드 (한글 아닌 거 제거) +공백 제거
#적용 후 모습
# 이전(아래)와 비교
+
#list를 쓰면 한번에 여러개를 replace 할 수 있다
data['v1']=data['v1'].replace(["ham", "spam"],[0,1]) #list를 쓰면 한번에 여러개를 replace 할 수 있다
+
series 와 replace ⭐
= str.replace를 써라!
왜 ? series 는 문자열 형식이 아니다.
# train_data['document'].replace("포켓","포겟") #?
# #replace =>series에 사용 불가⭐⭐
train_data['document'].str.replace("포켓","포겟")
위에 쓰인 텍스트 자료는 유명한 오픈소스라고 들었는데
혹시라도 문제가 될 시 즉시 삭제하겠습니다🙏