自由软件基金会欧洲分部(FSFE)宣布澳门新葡萄京官网注册,了去中心化的自由软件搜索引擎YaCy。
YaCy是一种点对点搜索引擎,与传统的集中式搜索引擎不同,它没有一个中央服务器,运行在一个点对点的分布式网络上,所有用户都是平等的,网络不会储存
搜索结果,任何人都不可能审查索引内容。

  一:网站高级搜索
   逻辑”与”的组合搜索,用空格、”+”、”and”组合,例如,计算机
病毒,计算机+病毒,计算机and病毒;
逻辑”或”的组合搜索,用”or”组合,比如计算机or电脑;
  多条件逻辑组合,比如计算机or电脑and病毒;
中英文数字混检,比如mp3歌曲。
  二: 网页高级搜索 请参考
  15.使用双引号进行精确搜索
  简单搜索往往会反馈回大量不需要的信息,如果查找的是一个词组或多个汉字,最好的办法就是将它们用双引号括起来(即在英文输入状态下的双引号),这样得到的结果最少、最精确。例如在搜索引擎的查询框中输入”电脑技术”,就等于告诉搜索引擎只反馈回网页中有“电脑技术”这几个关键字的网址,这会比输入电脑技术得到更少、更好的结果。
  16.使用加减号限定查找
  很多搜索引擎都支持在搜索词前冠以加号(+)限定搜索结果中必须包含的词汇,用减号(-)
限定搜索结果不能包含的词汇。
例如:希望搜出得网页中同时包括“盐城、信息、网络”3个关键词时,就可用“盐城+信息+网络”来搜索;再例如:要查找包含“电脑”的网页,但不希望网页中包含“技术”,就可以用“电脑
-技术”来搜索。
  17.不要使用停用词
  一些搜索引擎会忽略这些词,当你把停用词输入搜索框时,不管网上有多少数量的相关文件,它们一个都不会找回来给你。这些被叫做“停用词”(stop
words),因为停用词可能太常见了以至于无法搜索出有意义的结果,或者是语言中的副词、连词、介词,或者是”be”
的变体如is、are、were、been等无意义的词,除非它们在一个短语中且有重要的名词和动词相伴。
  18.大写字母
  如果你在搜索关键词中使用大写字母,那么搜索引擎返回的结果将只有一种,其网页中含有大小写跟你的搜索关键词完全相同的单词。象人名和地名之类关键词使用大写字母是个好选择,但是其它对大小写没那么敏感的单词,如果也使用大写字母,可能使你错过很多有用的网页。
  19.词组搜索
  如果只给出一个单词进行搜索,那么将发现数以千计甚至以百万计的匹配网页。然而如果再加上一个单词,那么搜索结果会更加切题。在搜索时,给出两个关键词,并将两个词用AND(与逻辑)结合起来,或者在每个词前面加上加号,这种与逻辑技术大大地缩小了命中范围,从而加快了搜索。幸运的是,所有主要的搜索引擎都使用同样有语法。一个带引号的词组意味着只有完全匹配该词组(包括空格)的网页才是要搜索的网页。例如在搜索说明中,有“this
exact phrase(这个确切词组)”这个词组,那么搜索引擎只搜索包含“this exact
phrase(这个确切词组)”的网页。
  20.根据要求选择查询方法
  如果需要快速找到一些相关性比较大的信息,可以使用目录式搜索引擎的查找功能。如果想得到某一方面比较系统的资源信息,可以使用目录一级一级地进行查找。如果要找的信息比较冷门,应该用比较大的全文搜索引擎查找。
  21. 搜索行为分析
  搜索行为分析技术的核心是跟踪分析用户的搜索行为,充分地利用这些信息来提高用户的搜索效率。提高搜索行为分析效率的途径主要有两种:“群体行为分析”和“个性化搜索”。现在许多搜索引擎推出的“热门关键词”服务就是一个群体行为分析的典型例子。“热门关键词”随时提供用户使用最多的关键词,用户可以直接点击这些关键词连接。由于人们的从众心理,“热门关键词”往往也是你想查询的关键词。个性化搜索则是搜索行为分析技术最有前途的方向。通过积累用户的搜索个性化数据,将使用户的搜索更加精确,更符合每个用户的需求。
  22.如何缩小搜索范围
  有时查询会得到过多的结果。为得到最实用的资料,您需要进一步缩小查询。这就是”缩小搜索”或”在结果中搜索”。您只要输入更多的关键词筛选查询出来的资料,或者在您想删除的内容前加上减号”-“(切记要在减号前留一个空格位。),即可缩小搜索范围。
  23.最常见的搜索失败(一)
  搜索引擎没有帮你找到草堆中的那根针,而是给了你整个草堆。通常,这种搜索失败有两个原因,这两个原因其实都很容易解决。第一,你用来搜索的关键词太短了,可能只有一两个字。第二,你要搜索的内容太常见了,以至网上有巨大数量的相关内容。
  24.最常见的搜索失败(二)
  网站已搬走;转向地址未知
搜索到的网站已搬走,地址未知。网站就象人,有时会被迫迁移。学生毕业了;网页从免费社区搬到有独立域名的大网站了;人们改变ISP了。当遇上这种事时,你最好赌一下运气,搜索你在寻找的文件的标题或者作者的名字。搜索标题很简单,只要用双引号括起来进行短语搜索就行。
  25.最常见的搜索失败(三)
  上次能搜到的内容,这次却搜不到了。你做了所有努力,可是,上星期还带给你很好搜索结果的搜索请求,这次无论你怎么努力,都只搜索到一堆无用的结果,你想要找的网页已经
不见了。发生了什么事?有关搜索引擎的一个肮脏的小秘密是:搜索引擎永不停息的从它们的索引库中抛弃已索引的网页。有时是成千上万的网页。有时这些被遗弃的网页会重新出现在索引库中,有时不会。
  26常见错误1:错别字
  经常发生的一种错误是,你输入的关键词含有错别字。统计表明,常有大量的错误搜索,光一个谢霆锋就有“谢霆锋”、“谢庭锋”、“谢霆峰”、“谢廷锋”、“谢庭峰”、“谢廷峰”6种查法,还有什么“星际争吧”、“以德制国”之类的,这样的关键词能搜索到什么有用资料吗?所以每当你觉得某种内容网上应该有不少、却搜索不到结果时,你应该先查一下是否有错别字。
  27.常见错误2:关键词太常见
  搜索引擎对常见词的搜索存在缺陷,因为这些词曝光率太高了,以至于出现在成百万网页中,使得它们事实上不能被用来帮你找到什么有用的内容。比如,搜索
“电话”,
有无数网站提供跟“电话”相关的信息,从网上黄页到电话零售商到个人电话号码都有。所以当搜索结果太多太乱的时候,你应该尝试使用更多的关键词或者减号来搜索,不使用过于通用的词汇来搜索,设计一个类似“上海
常用电话”这样特殊的搜索关键词,会给你真正有用的结果。当然,如果你想找的是一串汽车网站或一串MP3网站,那么用“汽车”、“MP3”搜索就是正确的。
  28.常见错误3:多义词
  要小心使用多义词,比如搜索“Java”,你要找的信息究竟是太平洋上的一个岛、一种著名的咖啡、还是一种计算机语言?搜索引擎是不能理解辨别多义词的。最好的解决办法是,在搜索之前先问自己这个问题,然后用短语、用多个关键词或者用其他的词语来代替多义词作为搜索关键词。比如用“爪哇
印尼”、“爪哇 咖啡”、“Java 语言”分别搜索可以满足不同的需求。
  29.常见错误4:不会输关键词,想要什么输什么
  搜索失败的另一个常见原因是类似这样的搜索:“现代爱情故事歌词”、“信息早报在济南发行情况”、“铃羊车的各种图案”、“上海到成都列车时刻表”。网友错把搜索引擎当成是听话的服务员了,其实搜索引擎是很机械的,当你用关键词搜索的时候,它只会把含有这个关键词的网页找出来,根本不管网页上的内容是什么。
  30.常见错误5:在错误的地方搜索
  2001年7月23日这一天,正逢高考发榜,各大搜索引擎竟有超过100万次以上的搜索跟高考查分有关。考生们不知道,搜索引擎从抓取网页、解析、索引到提供搜索是有一个周期的,各搜索引擎的信息滞后周期从一周到一月不等,所以找最新内容应该去看新闻,用搜索引擎是找不到最新内容,只能找到一个星期或一个月以前的内容。另外,搜索引擎对动态内容,如:论坛、数据库内容,以及带frame结构的网页搜索能力较弱,所以这类信息也不适合用搜索引擎搜索,而是应该去相关的网站寻找,当然,寻找相关网站的任务搜索引擎是当仁不让的。

互联网的发展明显地促进了信息检索技术的发展和应用,一大批搜索引擎产品诞生,为网络用户提供了很好的快速信息获取和网络信息导航工具,搜索引擎技术目前普遍采用了全文信息检索技术。

用户需要下载软件,目前YaCy发布了1.0版,支持Windows,Linux和OS
X。搜索引擎将运行在用户电脑上,查询词进入共享网络前将经过加密。用户的电脑将创造一个单独的搜索索引和排名,随着时间的推移,搜索结果将越来越匹配用
户寻找的目标。YaCy项目负责人Michael
Christen说,搜索是用户和所寻找信息之间的重要纽带,这样的功能不能依靠少数大公司,不能以隐私为代价。

澳门新葡萄京官网注册 1

(文/solidot)    

对每个使用网络搜索引擎的用户而言,信息太多,我们搜索的范围太广,准确性和排序就显得特别重要。著名的Google等搜索引擎主要采用网页链接分析技术,其核心就是根据互联网上网页被连接访问的次数作为重要评判的依据,同时,搜索引擎的索引生成和检索服务是分开的,进行周期性更新和同步数据。现在互联网搜索引擎都基于文件系统,搜索引擎受数据和客户规模的限制,相关反馈、知识检索、知识挖掘等计算密集的智能技术很难应用。

澳门新葡萄京官网注册 2

在浩如烟海的信息世界寻找和检索重要信息是互联网用户期望的,信息越丰富,伴随的问题是用户越来越难以获得其最需要的信息。早期为了解决此问题,尽可能地帮助用户实现自动检索。网络搜索引擎主要由网络机器人、索引数据库和查询服务三个部分组成。

澳门新葡萄京官网注册 3

其中,网络机器人主要负责对互联网丰富的资源进行遍历,尽可能多地发现并采集新的信息,构建完整的信息资源库;索引数据库采用全文检索技术对采集到的信息建立索引并存到索引数据库中,以便极大地提高信息检索的速度;查询服务模块以交互方式负责接收并分析用户的查询要求,通过一定的匹配策略,将达到一定的匹配程度的结果(包括标题项,简单文摘和链接地址)集合返回给用户。

澳门新葡萄京官网注册 4

由于人工智能研究还未达到实用化水平,目前网络机器人还无法实现信息的准确分类,使得检索的结果不尽如人意。Google搜索在搜索关键字时可以看到的匹配效果,是以单词进行的匹配检索。以匹配的规则进行检索,搜索结果的确不尽如人意。为了实现个性化的主动信息服务,网络信息挖掘技术成为近年来的一个新的研究课题,它是数据挖掘技术在网络信息处理中的应用。