Programming/NLP
[NLP] 텍스트 Emoji(이모티콘) 제거하는 방법
armmy
2023. 3. 29. 13:59
728x90
텍스트 Emoji(이모티콘) 제거하는 방법
1. dataframe의 예시를 만들어 test 해보았습니다.
# 기본 데이터
from pandas import DataFrame
raw_data = {'user_id': [1, 2, 3, 4],
'chat': ['apple😊😇', 'grape🧡💛💚💙💜', 'banana', 'cherry']}
df = DataFrame(raw_data)
2. 이모티콘 제거 함수 생성
import emoji
from tqdm import tqdm
def remove_emoji(df):
for i in tqdm(df.index):
df.loc[i, 'chat'] = emoji.replace_emoji(df.loc[i, 'chat'], replace='')
return df