这几天在B站上听宗成庆老师的《自然语言处理》的课程。
其中宗老师介绍了一些关于语言的定义,如下:
-
人类所特有的用来表达意思、交流思想的工具,是 一种特殊的社会现象,由语音、词汇和语法构成一定 的系统。 -商务印书馆,《现代汉语词典》, 1996 了
-
语言可以被看成一个抽象的数学系统。 -吴蔚天,1994
-
按照一定规律构成的句子和符号串的有限或无限的 集合。 - N. Chomsky
但是,我感觉这些定义,描述的也许全面。但是还是没有触及到人类语言的本质。 语言作为生物智慧发展的高级产物,具有更加复杂的结构。 而目前主流自然语言的研究方向,大多还是集中在单一模型,单一目标函数,仅仅靠海量数据,来勉强提高翻译的准确率等等。实际上,机器完全不能够理解,自己所输出的句子。
我认为,需要建立一个系统来对人类语言进行描述和理解。为了更好的表述和理清楚思路, 我姑且先对语言下一个定义(草稿版)
语言是人类思维活动过程中对外界输出的部分,是一个不断动态调整目标的过程。是人类同外界进行信息沟通和交流的工具。 ------ 张莉敏(草稿)
更具对定义的分解,我们来进行建模:
好了,这篇先写到这里。 待续
PS:要不要把我的想法和宗成庆老师沟通一下?? 发邮件他会看吗? hahaha