replace 함수란? 다음과 같다!
ex
1.포켓>포겟으로
2.텍스트 중 특수기호 제거 코드 (한글 아닌 거 제거) +공백 제거
#적용 후 모습
# 이전(아래)와 비교
+
#list를 쓰면 한번에 여러개를 replace 할 수 있다
data['v1']=data['v1'].replace(["ham", "spam"],[0,1]) #list를 쓰면 한번에 여러개를 replace 할 수 있다
+
series 와 replace ⭐
= str.replace를 써라!
왜 ? series 는 문자열 형식이 아니다.
# train_data['document'].replace("포켓","포겟") #?
# #replace =>series에 사용 불가⭐⭐
train_data['document'].str.replace("포켓","포겟")
위에 쓰인 텍스트 자료는 유명한 오픈소스라고 들었는데
혹시라도 문제가 될 시 즉시 삭제하겠습니다🙏
'자연어 처리' 카테고리의 다른 글
임베딩이란? (0) | 2023.07.28 |
---|---|
추천 시스템 만들기 팁 (0) | 2023.07.25 |
[자연어 처리] 시스템 구현 단계, 언어 모델, 신경망 (0) | 2023.07.25 |
[정규표현식] re.함수명(패턴,문자열) (0) | 2023.07.25 |
[정규표현식] 이메일 주소 검사 (0) | 2023.07.24 |