·语音分析 找出最小可独立的声音单元----音素。 此时的声音单元与语音信号处理如语音识别等不同。这里的最小可独立的声音单元指的是某种语言的最小发声单元,如汉语的声母、韵母等。 ·词法分析 找出词汇的各个词素(词根),从中获得语言学信息 汉语的词的概念是非常模糊和不确定的。汉语句子中没有明确的分词界限。因此,机器进行分词时就可能产生歧义现象。例如,"我们研究所有东西"这句话,不同的分词结果表示着不同的句意。 "我们-研究所-有-东西" "我们-研究-所有-东西" ·句法分析 句法分析是对句子和短语的结构进行分析,找出词、短语等的相互关系以及各自在句子中的作用等。 在语言自动处理的研究中,句法分析的研究是最为基本的,也是最成熟的一部分。这与乔姆斯基(Chomsky)的贡献是分不开的。主要方法有:短语结构语法、格语法、扩充转移网络、功能语法等。 ·语法分析 语法分析是将单词之间的线性次序变换成一个显示单词如何与其它单词相关联的结构。确定语句是否合乎语法。 在下面的句法分析中,将会常提到语法的概念。这里的"语法"与我们在学习外文中经常提到的语法不完全是一个概念。一种人类民族交流的语言的语法是对该语言的一个总结、归纳。但是任何人都不能保证所有日常生活中的每一句话都符合语法关系。同时,人类语言每天都在发生变化 ,语法,尤其是词法也将随着变化。而计算机自然语言处理中所提到的语法是人为编写的,即其中出现的每一句话必须符合该语法,不然就将被开除出局,不予理睬(无法处理)。 ·语义分析 语义分析的目的是通过分析找出词义、结构意义及其结合意义,从而确定语言所表达的真正(实际)含义或概念。 如上所述,在语言自动理解中,尤其是口语理解中,语义越来越成为一个重要的研究内容。 例:"你打我"和"我打你" 词汇完全相同,但表达的意义完全相反 ·语用分析 语用分析指的是研究语言所在的外界环境对语言使用所产生的影响。描述语言的环境知识、语言与语言使用者在某个给定语言环境中的关系。为确定真正含义,对表达的结构重新加以解释。 例:"把手放在桌上"可以理解为"把手-放在桌上",也可以理解为"把-手-放在桌上"。我们必须根据给定的语言环境来理解。
|