 |
基础技术 |
| 单文档自动文摘 |
| 概况介绍 |
单文档自动文摘是自然语言理解领域中的一个重要的应用方向。进入20世纪90年代,随着互联网的迅猛发展,信息的爆炸式增长满足人们对信息需求的同时,也使人们快速、准确地找到真正需要的信息变得更加困难。问天自动文摘系统(WinSDS)是解决这一问题的一种非常有效的技术应用。
|
| 体系结构 |
 |
| 系统特点 |
·系统实时生成文摘,支持多线程
·适应文本类型:国标码,Unicode
·运行平台:Windows,Linux |
| 系统功能 |
| 从一篇中文文本中按任意比例或按指定的最大文摘自动生成原文的摘要。可以让读者很容易得到一篇文章的中心意思,节省读者的浏览时间。 |
| 技术特点 |
| WinAT系统运用了多项技术,包括中文分词系统,词性标注系统,命名实体识别系统,语义段划分系统。运用这些技术可以使文摘句的选取更科学,文摘的流利度更好。 |
| 性能指标 |
WinAT系统技术处于的领先地位,WinAT系统初期版本参加2003年国家863自动文摘评测,成绩为第1名
处理速度:每秒2万字(测试环境:P4 - 2.0G,256M内存机器上测试) |
| 应用领域 |
| 单文档自动文摘可被应用于大量信息的中心意思提取。应用于搜索引擎的后处理,字处理软件,及数字图书馆文本文摘的自动生成。 |
| |