조사는 인공지능이 우리나라말을 인식하게 좋은 마크(mark)이자 레이블(label)이지 않을까?

조사는 인공지능이 우리나라말을 인식하게 좋은 마크(mark)이자 레이블(label)이지 않을까?

<~'을/를' ; ~'의' ; ~'에/로'; ~'이/가/은/는'; ~'이다' >

문득 우리나라 언어의 특징인 '조사'에 관심이 생겼습니다. 

다들 아시는 이야기지만, 우리나라 언어는 '조사'라는 것이 있습니다. 일본어도 있으나 영어나 중국어는 없는 품사입니다. 

저는 그동안 의심없이 '조사'를 독립된 품사로 이해하였는데, 외국인은 그렇지 않은 것 같습니다. 관계사인데 체언에 붙여 사용하기 때문에 '조사'를 '어미'나 '접미사'로 인식하는 경우가 많다고 합니다. 듣고 보니 말됩니다.

특별한 사정없이 조사를 빼고 말을 하면 무슨 뜻인지 정확히 전달되지 않습니다. 

"너 나 좋아" / "나 너 학교"

<너가 나를 좋아한다>는 것인지, <너를 내가 좋아한다>는 것인지, <너는 나를 좋아하니?>라고 묻는 것인지 잘 모르겠습니다. 조사를 빼고 말하면 당시 상황에 맞추어 눈치껏 이해해야 합니다. 화자가 아닌 제3자는 알 수 없습니다.

반면 조사가 없는 '영어'는 어순으로 주어인지 술어인지 목적인지 등을 특정하고 의미를 부여하는 것 같습니다.

"You like me"  /  "I school Bob"

영어는 조사가 없으므로 표기를 할 때 반드시 띄어쓰기를 하여야 합니다.

"Youlikeme" (×)  / "IschoolBob" (×)

우리나라 말은 조사를 붙여 그 단어의 품사를 결정하면서 말합니다. 표기를 할 때에도 일본어처럼  붙여써도 조사 때문에 이해하는데 큰 지장은 없습니다. 

너(는) 나(를) 좋아(해)너는나를좋아해
나(는) 너(를) 학교(에) (보내)

심지어 질문을 하고 싶을 때에도 조사만 변형시키면 됩니다.

너(는) 나(를) 좋아(하니?) /  너는나를좋아하니?

이 점을 착안하면 인공지능 언어인식 분야에서 우리나라 말이 영어보다 훨씬 더 쉽게 인식되지 않을까 생각해봅니다.

Comments

Popular posts from this blog

DeepSeek model V3와 R1의 모든 것

법률문서 A and/or B

[라이선스계약실무] ‘제조’(make)에 대한 라이선스에 위탁제작(Have-made)하게 할 권리가 포함되어 있는가?