 |
基础技术 |
| 中文词义消歧 |
| 概况介绍 |
词义消歧是对词的处理,属于自然语言理解的底层研究,在许多高层次的研究和应用上,词义消歧都大有用武之地,甚至有的应用领域把词义消歧作为重要步骤或关键环节。因此,提高词义消歧的技术水平,提供高质量的词义消歧技术,至关重要。 |
| 体系结构 |
| 中文词义消歧技术基于依存分析改进贝叶斯模型,其体系结构图如下: |
|
| 基于依存分析改进的贝叶斯模型输入是已分词的句子,经过词义消歧系统,输出是标注了词义的句子。 |
| 系统特点 |
| 把依存文法分析同贝叶斯分类器结合起来,有效地减少了有害上下文信息对正确率的影响,达到了90%的正确率。 |
| 系统功能 |
| 能够自动识别多义词在特定的上下文环境中具体代表的语义,应用于基于语义的文本处理系统。输入为一个汉语句子,输出为带有词义标记的句子。系统的准确率达到了90%。 |
| 技术特点 |
| 使用基于依存分析的改进贝叶斯词义消歧模型,赋予句子中多义词一个正确的语义。 |
| 应用领域 |
| 作为自然语言理解的底层技术应用,中文词义消歧技术对包括机器翻译、文本分类、自动文摘、信息检索、文本挖掘、语音识别、文语转换等在内的许多自然语言处理问题都会有很大的帮助。 |
| |