在全球的所有网站中,12%是色情网站,搜索引擎是浏览色情网站的主要入口之一。 由于青少年群体易受色情网站的危害,教育行业对色情内容的过滤十分关注。 由于色情网站数量十分庞大,不可能通过维护一份自定义规则列表的方式过滤色情站点。当前最有效的过滤色情网站方法是使用 URL 分类库,通过阻断色情分类实现过滤色情站点。但是使用 URL 分类库过滤色情网站功能存在一些不足。 首先,URL 分类库的生成存在时效性,新出现的色情网站或变换域名的色情网站不 能立刻收录到 URL 分类库中。其次,URL 分类库还存在因语言、地域等因素引起的分 类准确性问题。最后,当前 URL 过滤在阻止用户访问色情内容时,还存在机制上的问题。由于搜索引擎分类通常是允许访问的分类,因此在放行对搜索引擎网站访问是,会导致无法阻止搜索引擎网站在搜索结果中展示色情网站快照,用户仍然可以访问搜索引擎的搜索缓存中的色情内容。