泰得学院

首页 > 泰得学院 > 网站建设百科 > 专业名词百科

网站群

摘要:  网站群是由统一规划建设的若干个能够相互共享信息、按照一定的隶属关系组织在一起,既可以统一管理,也可以独立管理自成体系的网站集合。国内网站群的建设情况参差不齐,现在正处于第二代与第三代网站群初期过渡时期,第二代网站群所占比重比较大,少部分大型企业、政府或事业单位的网站群处于第三代。网站群的建设正呈现出从第一、二、三代网站群直接向第四代网站群过度的趋势。

  网站群泰得百科

  网站群是由统一规划建设的若干个能够相互共享信息、按照一定的隶属关系组织在一起,既可以统一管理,也可以独立管理自成体系的网站集合。国内网站群的建设情况参差不齐,现在正处于第二代与第三代网站群初期过渡时期,第二代网站群所占比重比较大,少部分大型企业、政府或事业单位的网站群处于第三代。网站群的建设正呈现出从第一、二、三代网站群直接向第四代网站群过度的趋势。随着动态内容管理概念的提出及相关产品的推出,将引领网站及网站群建设的新方向。

  网站群的出现

  中国企业的信息化建设自20世纪90年代开始,域名(网站)、企业邮箱、OA是企业信息化的起步点,随着拨号上网用户的增加,以及1999-2001年席卷中国的互联网泡沫,形态各异的门户网站疯狂烧钱的同时,客观上也推动了互联网在中国的普及,国内企业的大都从那时起接触互联网,进行小范围的尝试。自2003年后,基本上所有名片上都会印有网址和Email。网站正式成为企业的标准配置。最初企业只是把网站视为电子宣传册,作为平面的印刷册的补充,比较注重网站的视觉外观。网站的内容也比较单一,大都只是企业介绍、产品(服务)介绍、联系信息等。随着企业业务的不断拓展、分子公司的开设、营销活动的开展,新产品的推出,对应的分子公司网站、活动站点、产品站点、专题网站、用户俱乐部、 CSR站点等不断地逐年增加,导致某一天企业盘点网站时忽然发现:不知不觉间发现企业已经拥有了一个庞大的网站群。

  网站群的发展

  第一代:自然网站群,如某省政府建立了自己网站,随后下属单位也陆续建设各自的网站,最后在政府的网站上将每个下属单位网站链接到一起,形成了自然的网站群,此阶段的特点是未经规划,自然形成,各自独立。

  第二代:从网站的栏目、页面风格等方面进行整体规划,统一或分批实施,但各网站的关系仍然在一个平面上,没有隶属隶属关系,且各个网站相互独立,信息不能共享。此阶段的网站群的特点是外表统一,但信息孤立,无法统一管理。

  第三代:整合网站群,因业务的需要,要将分散在不同物理位置的独立网站整合在一起,实现信息的共享。此阶段的特点是,利用第三方公司的产品(BizTalk、Tong Link),整合已经存在的众多网站。但这样形成的网站群存在很大的缺陷,信息不能充分共享、不能统一管理、不能统一升级网站后台、不能做到整个网站群的联合全文检索。

  第四代:利用网站群内容管理系统(如速剑CMS等),统一规划、统一实施或分步实施,以解决第三代网站群存在缺陷。此阶段的网站群的特点是:所有的网站运行在同一个网站群内容管理平台上,可以统一管理、数据集中存储、智能化,解决了前几代网站群维护困难且成本高的缺点。

  第五代:动态内容管理概念。动态内容管理产品(以开普CMS为例)突破传统内容管理产品只能建设信息发布型网站的局限性,结合安全智能表单技术,推出新时期构建服务型政府网站的集成化内容管理平台,在解决了传统的网站采编发管理、站群管理的基础上,提供了丰富的个性化在线服务构建功能与公众交互功能,完整地满足了政府门户网站中信息发布、在线服务与政民互动的要求。

  第六代:子站独立存储。网站群发展到高级阶段,客观上要求各子站能有用有充分的独立性,并能容纳各种复杂的数据结构;于是,单一数据库存储所有子站的网站群模式受到了极大的挑战。子站独立存储这样的模式应运而生(如We7站群系统),这似乎也将网站群技术导向了一个全新的方向。

  网站群产品

  泰得利通网站群包括:

  一、网站群内容管理系统

  网站内容管理系统是一套可以综合管理网站上各种栏目的通用工具,新闻、产品、文档、下载等,通过元数据管理和模板技术,它们都在同一套系统里完成更新和维护。

  基于TurboCMS4.6优秀的内容管理引擎,TurboCMS在站点群管理、国际化支持、内容交换与共享、Web2.0特性的支持等诸多方面具有显著的改善,对中文内容管理技术必将提升一个层次。

  二、网站群互动应用平台

  泰得利通互动平台是一个专门针对政府而开发的站点群管理的应用平台。产品除了可帮助用户方便快捷的与网民进行互动交流外,它独有的开发模式提供了与其它数据库系统、电子商务系统、电子政务系统的无缝集成的接口,保持了您长期的投资效益。

  三、网站群垂直检索引擎

  泰得利通垂直检索引擎由三部分构成:采集系统、索引系统及检索系统。智能化采集系统负责网站信息的采集工作,索引系统提供海量信息的分词、存储及即时索引,检索引擎提供全文检索及多种条件的检索功能。

  (一)产品架构

  信息层:网站非结构化信息、组织内部结构化信息

  采集层:多线程智能化数据采集

  加工层:信息内容的智能加工

  数据存储中心:海量信息分布式存储

  用户层:提供全文检索及多种条件检索方式

  (二)产品功能

  1) 支持异构资源整合索引

  泰得利通垂直检索引擎不仅支持跨站索引而且还支持服务器本地硬盘文件索引及局域网文件索引,而且支持多数据源多索引、单数据源多索引、多数据源单索引,最大程度的满足在各种网络结构中实现整合索引。

  2) 支持自定义搜索字段

  可自定义搜索字段,还可根据用户的需要索引文档中特定的字段,从而满足各种特定的检索需求,如:检索政府公文的文号等特定字段。

  3) 集成先进的中文自然语言处理技术,提高查全率和查准率

  系统内置可维护的分词词典,支持多种切词方法,可根据不同行业设置不同的字典,提高切词的正确性和可扩展性。

  4) 支持分布式多线程采集技术

  泰得利通采集机器人采用多线程并发采集技术,可以根据实际情况动态调节线程数目,实现多线程并发采集,从而提高采集效率,缩短采集时间。

  5) 满足各种个性化配置需求

  泰得利通索引系统允许用户进行多种配置,具体包括:采集时间配置(任务开始时间,监控周期等)、信息采集的资源类型配置、信息采集的网址范围配置(在限定的站点,限定的域或目录)、信息采集的数量配置(每个站点采集的资源数目,层次数)等,从而满足不同用户的不同需求。

  6) 自动化信息加工与过滤

  泰得利通索引系统可对网页进行内容分析和过滤,自动去除广告、版权、栏目等无用信息,精确获取目标网站的主体信息内容。

  7) 强大的非结构化数据检索功能

  系统支持包括TEXT、HTML、RTF、MS OFFICE、PDF等多种格式文件的存储、索引和检索。

  8) 完善的信息检索方式

  泰得利通全文检索服务除了支持通用搜索引擎所提供的全文检索之外,还支持多种条件检索,比如按发布日期检索、按关键词检索、按标题检索等智能功能。

展开