加入收藏

 
 
首页 产品系统 解决方案 客户案例 新闻公告 服务支持 关于问天
 
 
基础技术
  • 中文分词技术
  • 网页去重技术
  • 中文文本分类
  • 简繁/繁简转换
  • 应用系统
  • 互动问答平台
  • 站内搜索系统
  • 双语例句检索系统
  • 网络信息监控系统
  • 线上产品
  • 爱搜车
  • 问天句典








  •  
     
    中文分词
    应用系统
    问天网络信息监控系统
      在一定的社会和网络空间内,人们对某一事件、产品和社会议题表达相关的意见,并进行一定程度的传播,网络传播的迅捷,表达的方便性及可隐藏真实身份信息等特点使得在WEB2.0时代,人们越来越喜欢和习惯于利用网络来表达自己对某一特定事件、产品、问题和现象的看法、态度、意见和情绪。一旦引发其他相关网民的公民,就会形成巨大的传播效应,网络时代使得蝴蝶效应逐步被事实证明。2008年发生的一系列社会事件,充分证明了对网络信息及时监控和做出反映的必要性,典型的像三鹿品牌毒奶粉事件,凯美瑞汽车气囊未开事件等。

    产品概述
      WTJK是问天基于智能抓取,数据分析和挖掘等技术上开发的一整套方便用户对特定的网站、论坛进行统一及时监控的系统,希望能根据企业和机构对特定类型事件的关注,对网络信息(这个可以是论坛用户发帖、新闻或者其他形式的互联网内容)进行实时监控,并对这些信息进行处理和分析,将相关的结果及时准确的传递给企业或机构,像产品的恶意差评、机构被攻击等网络信息,能够及时被发现并传递给企业机构决策者,同时做出反应。同时,此款产品也是网络广告效果监控的利器。

    产品架构

    功能特点

    可自定义关注的URL及采集时间间隔(频率)
    用户可自行设定需要关注的网站URL、关注的重要性、扫描网站的时间间隔和频度等,以便在硬件和带宽资源有限的情况下及时监控目标信息源,并以最快的速度做数据分析。

    支持多种网站页面格式
    系统既可以采集常见的静态网页,还可以采集论坛、博客、贴吧等动态页面信息。

    支持特定内容抽取识别:
    系统可对网页进行内容精准解析,识别页面的广告、版权、栏目、标题、正文、网友评论等信息,用户可自定义自己关注的信息类别。

    基于相似相同内容去重
    通过网页去重技术自动判别网络信息中重复的内容,并作出统计。

    支持多种字符集编码和语言
    采集子系统能够自动识别多种字符集编码,包括中文、英文、中文简体、中文繁体等。同时,问天特定的机器翻译技术,为多种语言的识别和监控提供了可能。

    支持整个互联网监控
    问天网络信息监控系统可根据用户需要采用自主搜索引擎和元搜索等方式对整个互联网信息进行采集和监控。

    产品特点和优势
    网络信息抓取及时和准确;
    支持情感分析;
    可配置敏感词识别模块;
    可支持全网监控;
    支持多种页面格式、编码和语言;
    支持用户自定义关注焦点和类别;
    可根据用户需要进行二次开发;

    运行环境
    Microsoft Windows XP/NT/2000/2003/
    Linux/Unix

      
     
    常见问题 | 联系我们 | 渠道合作 | 招贤纳士
    版权所有:Copyright 2005-2008 问天 (北京) 信息技术有限公司 京ICP备06025972号