网康网页过滤库突破2000万 优势突显不容超越
发表日期:2012-05-27 12:54:00
日前,先进的网络应用管理设备提供商网康科技发布消息,截至2011年2月,其上网行为管理产品的核心技术“网页预分类过滤数据库”已经突破2000万条URL,继续保持了其“全球中文网页过滤数据库”的领先地位,并且在内容覆盖范围、分类精准度和过滤速度等方面远远超出同类产品,倍受业界厂商和用户的关注。
自2005年网康科技第一次发布“网页过滤数据库”以来,通过“网页预分类数据库”技术进行网页访问过滤就成为了上网行为管理产品必不可少的重要功能之一。而在早期,这种数据库的URL条目积累主要依靠“网络爬虫”+“智能分类”+“人工校验”的方式进行,存在积累速度慢,更新不及时的缺憾。随着互联网技术的发展,网康科技不断引入分布式计算、云分析、语义分析等新技术,使得“网页预分类过滤数据库”技术飞速发展,目前每日更新URL数量已经达到300万条,最终在2011年年初突破了2000万大关。
与时俱进 迎接网页应用挑战
“网页预分类过滤数据库”技术的发展和应用,大大提升了上网行为管理类产品的部署价值,从最初帮助用户屏蔽“内容不健康”的不良网站,到封堵“偷菜、炒股、游戏”等Web 2.0网页应用提高工作效率,以及过滤“论坛、博客”类网站保护机密信息外泄,“网页预分类过滤数据库”技术已经发展成为上网行为管理产品的核心技术。
网康科技“互联网应用及内容研究实验室”网页预分类研究小组组长张永臣介绍说:“随着互联网应用的日趋丰富和复杂,尤其是Web 2.0之后,网页已经不仅仅是一个HTML文档,典型的示例就是‘开心网’的‘偷菜’。”而随着这种网页应用的流行,上网行为管理产品的网页过滤功能也需要与时俱进,“网康科技的网页预分类过滤数据库技术可以实现对开心网分项控制,例如允许登录开心网,但是不能进入“停车、偷菜”等子应用,这就是网康科技给用户带来的精细化管理价值。”
启用云分析 实现分钟级实时过滤
在Web 2.0时代网页内容的变化更为频繁,而要满足用户精准、有效的网页访问控制要求,就必须加快网页的抓取、分析、分类过程,为了实现这个目标,网康科技适时启用“云分析”技术。一方面,网康科技利用“云计算”技术在全国部署了大量云服务器,同时进行网页内容抓取、分析、分类工作,加快了对网页内容的实时跟踪,达到“分钟级”的分类更新,即当网页内容发生变化后的1分钟内,网康网页预分类网页过滤数据库就能完成对其内容变化的分析,并根据变化重新进行分类。
另一方面,在开启云分析模式下,当用户访问网页时如果遇到未分类网页或者网页分类不精准的情况,可以立即向网康云服务器发送请求,云服务器接到请求后将实时进行智能分析和分类,并将结果反馈给用户,之后再更新到总过滤数据库中供其他用户使用。
目前,网康科技的上网行为管理用户可以在设备中设置每天更新“网页预分类过滤数据库”,以获得网页分类结果。
定位中文网页 优势不容超越
网康科技是网络应用管理领域的的领导厂商,是上网行为管理理念的开创者和领军品牌,多年来坚持自主研发和技术创新,深厚的技术积累让网康更了解中国用户的上网习惯,结合中国的法律、道德、文化环境,最终形成了国外同类产品无法逾越的、具有中国特色的“全球中文网页过滤数据库”。在分类准确度、中文内容分析、网页应用识别等方面,网康科技的技术实力已经达到国际顶尖水平。
在国内,网康2000万条URL的数据库更是远超行业平均水平。网页过滤数据库的形成是一个不断积累的过程,并且要随着互联网发展带来的挑战而不断进行技术创新,以应对新形势下用户对上网行为管理的更高要求。网康科技作为“网页预分类过滤数据库”技术的创始者,经过6年多不断探索和积累,并引入了“网络爬虫系统”“网页智能分类系统”“分布式计算”“语义分析”“云分析”等高精尖技术,不仅提高了产品的核心竞争力,也使用户能够获得更高的应用价值。