Monday, December 30, 2019

조사는 인공지능이 우리나라말을 인식하게 좋은 마크(mark)이자 레이블(label)이지 않을까?

조사는 인공지능이 우리나라말을 인식하게 좋은 마크(mark)이자 레이블(label)이지 않을까?

<~'을/를' ; ~'의' ; ~'에/로'; ~'이/가/은/는'; ~'이다' >

문득 우리나라 언어의 특징인 '조사'에 관심이 생겼습니다. 

다들 아시는 이야기지만, 우리나라 언어는 '조사'라는 것이 있습니다. 일본어도 있으나 영어나 중국어는 없는 품사입니다. 

저는 그동안 의심없이 '조사'를 독립된 품사로 이해하였는데, 외국인은 그렇지 않은 것 같습니다. 관계사인데 체언에 붙여 사용하기 때문에 '조사'를 '어미'나 '접미사'로 인식하는 경우가 많다고 합니다. 듣고 보니 말됩니다.

특별한 사정없이 조사를 빼고 말을 하면 무슨 뜻인지 정확히 전달되지 않습니다. 

"너 나 좋아" / "나 너 학교"

<너가 나를 좋아한다>는 것인지, <너를 내가 좋아한다>는 것인지, <너는 나를 좋아하니?>라고 묻는 것인지 잘 모르겠습니다. 조사를 빼고 말하면 당시 상황에 맞추어 눈치껏 이해해야 합니다. 화자가 아닌 제3자는 알 수 없습니다.

반면 조사가 없는 '영어'는 어순으로 주어인지 술어인지 목적인지 등을 특정하고 의미를 부여하는 것 같습니다.

"You like me"  /  "I school Bob"

영어는 조사가 없으므로 표기를 할 때 반드시 띄어쓰기를 하여야 합니다.

"Youlikeme" (×)  / "IschoolBob" (×)

우리나라 말은 조사를 붙여 그 단어의 품사를 결정하면서 말합니다. 표기를 할 때에도 일본어처럼  붙여써도 조사 때문에 이해하는데 큰 지장은 없습니다. 

너(는) 나(를) 좋아(해)너는나를좋아해
나(는) 너(를) 학교(에) (보내)

심지어 질문을 하고 싶을 때에도 조사만 변형시키면 됩니다.

너(는) 나(를) 좋아(하니?) /  너는나를좋아하니?

이 점을 착안하면 인공지능 언어인식 분야에서 우리나라 말이 영어보다 훨씬 더 쉽게 인식되지 않을까 생각해봅니다.

No comments:

Post a Comment

Does AI determine the outcome of patent lawsuits? Visualization strategies for patent attorneys (AI가 특허 소송의 승패를 가른다? 변리사를 위한 시각화 전략)

  변리사님, 아직도 특허 도면 수정 때문에 밤새시나요? Patent Attorneys, still pulling all-nighters over drawing modifications? 특허 문서만으로 복잡한 기술을 설명하는 데 한계를 느...