首页互联网北大ftp(北大ftp是什么)

北大ftp(北大ftp是什么)

编程之家2024-05-24109次浏览

一、中国最早的搜索引擎是什么

1、在中文搜索引擎领域,1996年8月成立的搜狐公司是最早参与作网络信息分类导航的网站,曾一度有“出门找地图,上网找搜狐的”美誉。

北大ftp(北大ftp是什么)

由于其人工分类提交的局限性,随着网络信息的暴增,逐渐被自动抓取智能分类的新一代信息技术取代。sohu于2004年8月创建独立域名的搜索网站“搜狗”,自称“第三代搜索引擎”。

2、台湾中正大学吴升教授所领导的GAIS实验室1998年1月创立的Openfind中文搜索引擎,是最早开发的中文智能搜索引擎。

扩展资料:

目前国内著名的中文搜索引擎有以下:

1、百度搜索:2000年1月,百度(Baidu)公司成立。2001年10月22日正式发布Baidu搜索引擎,专注于中文搜索。

2、360搜索:2012年8月16日,奇虎360推出综合搜索,提供一站式的实用工具综合查询入口

北大ftp(北大ftp是什么)

3、中搜搜索:2002年正式在国内首推大型中文检索引擎,2003年推出全球第一款中文新闻搜索引擎。

4、搜狗搜索:sohu于2004年8月创建独立域名的搜索网站“搜狗”,自称“第三代搜索引擎”。

5、谷歌搜索:2000年9月12日,谷歌开发其主站.com的中文界面。2006年4月12日,Google公司北京宣布该公司的全球中文名字为“谷歌”正式进入中国。

参考资料来源:百度百科—中文搜索引擎

二、信息检索题的答案是什么

31、springlink系统可以对于符合预期的检索结果进行标记。标记过的记录,可以暂时保存在系统中,也可以通过个性化服务功能,进行永久保存。写出检索结果的几种输出方式

PDF格式,文本格式

北大ftp(北大ftp是什么)

32、EBSCO提供的个性化服务包括哪些?读者在使用个性化服务前需要什么操作程序

1)、最热门文章推荐

站内外快速链接

收藏喜欢的期刊

保存重要的检索

设置E-mail提示

检索提示:同一个检索式有了新的检索结果

引文提示:某一篇文章又被新的文章所引用

期刊提示:关注的期刊出版了新的一期

主题提示:关注的主题有新的文章发表

历史追踪(检索历史与操作历史)

2)、读者在使用EBSCOHOST功能前应先注册申请,获得一组属于个人的用户名和口令、找回口令时的问题以及找回口令时的问题答案,点击“Submit”按钮返回最初登陆的界面,此时若在My EBSCOhost的my出现黄色图样即表示登陆完成。

33、网络资源的特点和种类;搜索引擎的功能

特点:数量庞大、增长迅速;内容丰富、形式多样;变化频繁、价值不一;结构复杂、分布广泛;信息分散、无序等

种类:1、按人类信息交流的方式分类可分为非正式出版信息、半非正式出版物、正式出版物

2)、从网络信息检索角度,按信息查询方式对网络信息进行分类可分为互联网信息、FTP信息、TELNET信息、USENET信息资源、USTSERV信息、JOPHER信息

3)、按信息存取方式分,可分为邮件型、揭示板型、广播型、图书馆型以及书目型

4)、按组织形式分可分为文件型、数据库型、超媒体型

5)、按时效性分,可分为动态信息、电子报纸、电子期刊、电子图书、联机馆藏目录、联机数据库等

6)、按信息的媒体形式分为,文本信息、超文本信息、多媒体信息、

7)、按网络信息服务方式分为,网站信息、新闻信息、论坛信息、文件服务信息

8)、按信息的格式分为,HTTML TXT DOC PDF RM MP3

功能:网页搜索、图片搜索、视频搜索、地图搜索、新闻搜索、音乐搜索、论坛搜索等等

34、试对百度、中文搜狐、北大天网、一搜四种搜索引擎的功能进行比较

百度的功能特点:1.基于字词结合的信息处理方式。

2.支持主流的中文编码标准。

3.智能相关度算法。

4.检索结果能标示丰富的网页属性(如标题、网址、时间、大小、编码、摘要等),并突出用户的查询串,便于用户判断是否阅读原文。

5.百度搜索支持二次检索(又称渐进检索或逼进检索)。

6.相关检索词智能推荐技术。

7.运用多线程技术、高效的搜索算法、稳定的UNIX平台、和本地化的服务器,保证了最快的响应速度。

8.可以提供一周、二周、四周等多种服务方式。

9.检索结果输出支持内容类聚、网站类聚、内容类聚+网站类聚等多种方式。

10.智能性、可扩展的搜索技术保证最快最多的收集互联网信息。

11.分布式结构、精心设计的优化算法、容错设计保证系统在大访问量下的高可用性、高扩展性、高性能和高稳定性。

12.高可配置性使得搜索服务能够满足不同用户的需求。

13.先进的网页动态摘要显示技术。

14.独有百度快照,巧妙解决了搜索用户经常遇到的死链接问题。

15.支持多种高级检索语法,使用户查询效率更高、结果更准。

一搜的功能特点:1、MP3功能 2、娱乐功能 3、投票功能 4、翻译功能 5、视频功能 6、部落功能

北大天网的功能特点:北京大学开发,简体中文、繁体中文和英文三个版本。提供全文检索、新闻组检索、FTP检索(北京大学、中科院等FTP站点)。目前大约收集了100万个 WWW页面(国内)和14万篇Newsgroup(新闻组)文章。支持简体中文、繁体中文、英文关键词搜索,不支持数字关键词和URL名检索。

搜狐的功能特点:搜狐于1998年推出中国首家大型分类查询搜索引擎,到现在已经发展成为中国影响力最大的分类搜索引擎。每日页面浏览量超过800万,可以查找网站、网页、新闻、网址、软件、黄页等信息。

35、文献信息的先进性、可靠性、适用性判断方法

文献的分析通常是一个应用查核法、比较法和分析法等方法来辩析材料的针对性、适用性、真实性、可靠性、先进性和典型性的过程。

36、查阅有关文献,写出“标准文献、专利文献、学位论文、研究报告”作为参考文献时的标注格式

(1)专利文献:序号专利申请者.专利国别,专利文献种类,专利号.出版日期

(2)技术标准:序号起草责任者.标准代号标准序号-发布年标准名称.出版地:出版者,出版年

(3)学位论文:序号作者.题名:[学位论文].保存地:保存着,年份

(4)会议论文:序号作者.题名.会议名称,会址,会议年份

37、学术论文一般由哪几部分构成?各部分的写作规范分别是什么

1、准确、精炼的技术术语表达的创新点名称

2、单位和作者:只写作者和实际参与了论文写作的人名,按对论文而不是工作的贡献排序。

3、摘要:是论文不加注释和评论的精炼缩写,是一篇独立的短文。

4、关键词:关键词是表达论文所属门类的主题词。列出能通过模糊检索查到这篇文章的3~8个主题词。关键词要反映研究范围,但不一定是文中的高频词,排列最好按范围,先大后小。关键词忌生僻,最好出自《中文主题词表》。

5、引言:引言可以作为论文的一节(符号可以是0、可以是1),也可以是正文前的一段无标题文字。应鲜明简洁,不要图表、公式。

6、正文:正文要分节,合理分节并拟定小标题可以突出重点,有助于理解。要尽量多用图表直观地表达,图表要有自明性,使用中文表头、坐标,无需解释就能看懂。

7、结论:全文而不仅是试验或仿真的总结。①归纳研究中发现的规律、优点;②应用或应用方向;③局限或不足,今后努力方向。结论应相对独立,提到创新点时不应使用“该方法”之类代用词。不十分肯定时可用“讨论”代替“结论”,但不得使用“结束语”、“小结”之类标题。结论中不应有图表、公式。

8、参考文献:列出作者在研究范围内所看过的国内外文献。参考文献与引言呼应,反映作者跟踪技术发展的眼界和敏锐性,反映作者知识的广度和深度,反映作者有资格说自己是创新。数量不可过少,例如中国科协期刊优秀论文评选要求研究性学术论文参考文献不少于20篇。参考文献不限于中文但,教科书不可多,不宜过陈旧。

38、什么是学术造假与剽窃?一般而言,剽窃的形式有哪些?司法实践中对剽窃

剽窃的定义:剽窃是指把他人的作品当成自己的作品。

剽窃形式:(1)内容编改:对主要内容、结构、数据、图表、研究结论等往往不加尊重,于是,内容概括、内容改写便成为剽窃者稍加高明的手法。(2)创意搬套:搬套整体创意、构思、框架等就成为这类剽窃者所青睐‘高层次’、新型的剽窃手法。

司法实践剽窃:《著作权法》第四十六条规定在列举侵权行为时第五项为“剽窃他人作品的”,这是本法唯一一次出现“剽窃”,是指将他人作品的全部或者一部分直接或者略加修改后以自己的名义发表的行为。

事实上,通常所说的“剽窃”语义还包括法律中侵犯署名权的行为,即第三项“没有参加创作,为谋取个人名利,在他人作品上署名的”。此两项规定均为严重的剽窃行为。同时,从广义上讲,违反《著作权法》第二十二条、《中华人民共和国著作权法实施条例》第十九条规定的作品使用者的法定义务,即在法定的、可以不经著作权人许可而使用其作品的情况下,应当指明作者姓名、作品名称,否则,也被称为剽窃行为。此条文在《高等学校哲学社会科学研究学术规范(试行)》中体现为第三部分学术引文规范第七款的规定:“引文应以原始文献和第一手资料为原则。凡引用他人观点、方案、资料、数据等,无论曾否发表,无论是纸质或电子版,均应详加注释。凡转引文献资料,应如实说明。”

39、简要回答:三大检索工具SCI,EI和ISTP的内涵

1、SCI,即《科学引文索引》,是自然科学领域基础理论学科方面的重要期刊文摘索引数据库。

它创建于1961年,创始人为美国科学情报研究所所长 Eugene Garfield(1925.9.15).利用它,可以检索数学、物理学、化学、天文学、生物学、医学、农业科学以及计算机科学、材料科学等学科方面自 1945年以来重要的学术成果信息;SCI还被国内外学术界当做制定学科发展规划和进行学术排名的重要依据。

2、Ei,即《工程索引》,创刊于 1884年,由 Elsevier Engineering Information Inc.编辑出版。主要收录工程技术领域的论文(主要为科技期刊和会议录论文),数据覆盖了核技术、生物工程、交通运输、化学和工艺工程、照明和光学技术、农业工程和食品技术、计算机和数据处理、应用物理、电子和通信、控制工程、土木工程、机械工程、材料工程、石油、宇航、汽车工程等学科领域。

3、ISTP,即《科学技术会议录索引》,创刊于 1978年,由美国科学情报研究所编制,主要收录国际上著名的科技会议文献。它所收录的数据包括农业、环境科学、生物化学、分子生物学、生物技术、医学、工程、计算机科学、化学、物理学等学科。从 1990-2003年间, ISTP和 ISSHP(后文将要讲到 ISSHP)共收录了 60, 000个会议的近 300万篇论文的信息

题型二

假设检索与某一主题相关的文献,系统中的文献总量为 1000篇,与该主题相关的文献总量为 200篇,系统检索出文献 100篇,其中与该主题相关的文献为 80篇,请计算该系统的查全率和查准率(要求写出计算式)

查准率=(检索出的相关信息数/检索出的信息总数)x100%

(80/100)*100%=80%

查全率=(检索出的相关信息数/信息库中相关信息总数)x100%

(80/200)*100%=40%

三、搜索 是什么意思

[汉语]搜索

拼音:sousuo

解释:仔细查找;搜寻:搜索前进|搜索残敌。

[互联网]搜索又叫搜索引擎。搜索引擎(search engines)是对互联网上的信息资源进行搜集整理,然后供你查询的系统,它包括信息搜集、信息整理和用户查询三部分。

搜索引擎是一个为你提供信息“检索”服务的网站,它使用某些程序把因特网上的所有信息归类以帮助人们在茫茫网海中搜寻到所需要的信息。

早期的搜索引擎是把因特网中的资源服务器的地址收集起来,由其提供的资源的类型不同而分成不同的目录,再一层层地进行分类。人们要找自己想要的信息可按他们的分类一层层进入,就能最后到达目的地,找到自己想要的信息。这其实是最原始的方式,只适用于因特网信息并不多的时候。随着因特网信息按几何式增长,出现了真正意义上的搜索引擎,这些搜索引擎知道网站上每一页的开始,随后搜索因特网上的所有超级链接,把代表超级链接的所有词汇放入一个数据库。这就是现在搜索引擎的原型。

随着yahoo!的出现,搜索引擎的发展也进入了黄金时代,相比以前其性能更加优越。现在的搜索引擎已经不只是单纯的搜索网页的信息了,它们已经变得更加综合化,完美化了。以搜索引擎权威yahoo!为例,从1995年3月由美籍华裔杨致远等人创办yahoo!开始,到现在,他们从一个单一的搜索引擎发展到现在有电子商务、新闻信息服务、个人免费电子信箱服务等多种网络服务,充分说明了搜索引擎的发展从单一到综合的过程。

然而由于搜索引擎的工作方式和因特网的快速发展,使其搜索的结果让人越来越不满意。例如,搜索“电脑”这个词汇,就可能有数百万页的结果。这是由于搜索引擎通过对网站的相关性来优化搜索结果,这种相关性又是由关键字在网站的位置、网站的名称、标签等公式来决定的。这就是使搜索引擎搜索结果多而杂的原因。而搜索引擎中的数据库因为因特网的发展变化也必然包含了死链接。

在百度、Google、雅虎等主流搜索引擎愈发发展成熟以外,各类不同的搜索大全也在今日的互联网逐渐兴起。如:『搜索大全』()等即为集各种不同类型搜索引擎,涵盖多语言于一身的搜索集合。该类搜索引擎大全的兴起,让搜索变得更加简单。几乎所有的内容都能在“一页之间”完成。

搜索

Wikipedia,自由的百科全书

DoNews.com:搜索

Google谈“中国政策”以及个人隐私

帕瑟希女士指出,不管什么样的法律,都不能保护存储在美国的服务器上的用户个人数据不被美国政府索取查看,也就是说,争取更多数据保护的斗争已经失败了,死守还有什么意义呢。

树大招风 Google频频挨告

目前有作家和出版社组成的团体,控诉Google扫描仍受著作财产权保护的书籍;加州一家网站也控告Google把他们从Google搜索结果中剔除;还有欧洲的媒体社控告Google擅自转载他们的新闻及照片到 Google新闻区。

树大招风Google官司缠身业务运转模式受挑战

随著Google成为全球最有影响力的搜索引擎及互联网公司,一连串法律诉讼案件也跑上门来,这些诉讼包括侵犯版权,商标以及Google对网站排序方式等等的控告。

分析师预计百度市值将达130亿美元

如果百度未来两年继续保持100%以上的营收年度增幅,该公司的市值同销售额之比也许会更高。Google目前的市值同销售额之比为13倍,百度为24倍,取其中间值18倍,百度2008年第三季度的市值将达到130亿美元。

2006年你Tube了吗

“你能想象吗?”尼尔兴奋地说,“有上百人看我们的录像,我们还收到了来自新西兰和欧洲的评论。”尼尔已经决定将来上大学从事电影创作,而YouTube将是他实现梦想的最有力的平台。

Web2.0遭遇生死劫创业浪潮迟早泡沫破灭

Web2.0正面临着生死考验。短短两年间它走过了草根创业、融资扩张、拉风叫板三个阶段,接下来等待它们的是否就是灰飞烟灭?

Google手持现金104亿美元将再行收购

一些分析师认为雅虎将成为Google最大的竞争对手,雅虎公司已经推出其备受期待的被称之为为“巴拿马”的新广告平台。

华尔街日报:YouTube成为人们日常用语

当世界上发生某些事件,人们想观看电视那样的视频画面时,YouTube就成为必不可少的第一站。它也成为了一个形容词;美国中期选举被称为首届“YouTube选举”

谷歌天价收购YouTube幕后力压宿敌雅虎微软

收购格局完成后,在搜索和网上社区力压宿敌雅虎;在电子邮件和网上文字处理上超越微软,甚至以网络操作系统代替微软的Windows

手机“撒谎软件”挑战诚信

他说:“比如你给自己发了条短信,说某某欠了你100万元,又将这条短信设定为他发给你的,如果因此造成严重后果,你就可能犯了敲诈罪。”

成都百家草根网站抱团迎风投

联盟负责人告诉记者,他们希望通过联盟这种形式聚集成都庞大的网站创业者,促进成都互联网经济的发展。据悉,这是西部地区首个网站联盟。

核心:让人更幸福李开复谈创造奇迹的理由

李开复:随着工程师的逐步到位,以及新产品的逐步应用,你会发现Google更好用了———我相信,明显改观会出现在春节前。

尼尔森最新统计显示Google仍居搜索霸主地位

Google仍占搜索市场霸主地位,有一半的搜索依赖于Google的搜索技术。雅虎以13亿次的搜索量居第二位,与去年同期相比增长了12%。微软的MSN/Windows Live居第三位,搜索量为5.19亿次,尽管其搜索量同比下降了12%。

微软与Kirtas打造图书搜索引擎挑战Google

制作高速扫描仪的Kirtas技术公司表示,它将为微软的“Live Book Search”图书搜索引擎做图书数字化工作,其速度可达每小时2400页,大约一本书需要8分钟时间

Mozilla加速合作伙伴结盟亚洲市场投更多资源

“Mozilla将得力于我们和搜索服务之间合作联盟,反之,这些搜索引擎也因为Firefox带来的客户而获益,”金井玄说。

中国经营报:谢文重新触网雅虎如何再造

马云同样希望雅虎中国能够迅速接受阿里巴巴的“激情”和“客户第一”、“拥抱变化”等文化,而这些与典型工程师文化的雅虎中国产生了巨大的冲突。

经济观察报:雅虎中国换帅求变

阿里巴巴集团CEO马云在官方新闻中充分肯定了田健一年来的工作,并表示,换帅意味着阿里巴巴集团对雅虎中国整合的第一阶段已经完成,即将进入第二阶段。

新版浏览器开战微软火狐Opera较量再升温

作为老牌浏览器,Opera也不甘落后,推出了最新的9.2版本,再次体现了其浏览速度方面的优势,另外增加了插件小程序功能,并支持BT直接下载通过自动升级。

谢文挑起雅虎中国马云迎接新一轮挑战

雅虎中国的整合任务将分为三个步骤,第一个步骤是让公司活下来,第二步是健康发展,第三步才是恢复强大

Google公布第三季度报表:盈利翻倍

Google公布第三季度报表显示:在至9月30日为止的第三季度净收入到达7.33亿美元,是去年同期的近两倍

Google第3季多赚92%胜预期

网络搜索企业Google公布,第3季纯利增长92%至7.33亿美元,营业额亦增加70%,主要受惠於海外业务以及公司旗下网站的业绩,因该公司对网络搜索市场的控制增强

李彦宏:百度未来发展方向是搜索社区化

我个人觉得,搜索引擎在未来若干年当中,它的社区化趋势会越来越明显。人们信息需求的满足,需要越来越多地依靠其他用户的力量来满足

奇虎:搜索Google搜不到的草根内容

在新一波兴起的互联网中,大部分被人们称为web2.0。对这样的称呼,很多网站不以为是,但齐向东却很喜欢这个概念。奇虎网也打着搜索引擎的旗号,对web2.0典型的社区进行内容搜索。

财富:解密Google收购YouTube的原因

颇具讽刺意味的是,Google公司一方面对在线视频网站兴趣浓厚,一方面又认为传统广播电视和有线电视仍是主要的广告媒介。

微软在华辟在线广告疆土抗衡Yahoo与Google

不满足于在华卖出大量windows产品,同时也为与Yahoo、Goolge竞争的战略需要,微软已经把眼光投向飞速发展的中国网络广告业

1990年以前,没有任何人能搜索互联网。

所有搜索引擎的祖先,是1990年由Montreal的McGill University学生Alan Emtage、Peter Deutsch、Bill Wheelan发明的Archie(Archie FAQ)。当时World Wide Web还未出现。Archie是第一个自动索引互联网上匿名FTP网站文件的程序,但它还不是真正的搜索引擎。Archie是一个可搜索的FTP文件名列表,用户必须输入精确的文件名搜索,然后Archie会告诉用户哪一个FTP地址可以下载该文件。

由于Archie深受欢迎,受其启发,Nevada System Computing Services大学于1993年开发了一个Gopher(Gopher FAQ)搜索工具Veronica(Veronica FAQ)。Jughead是后来另一个Gopher搜索工具。

由于专门用于检索信息的Robot程序象蜘蛛(spider)一样在网络间爬来爬去,因此,搜索引擎的Robot程序被称为spider(Spider FAQ)程序。世界上第一个Spider程序,是MIT Matthew Gray的World wide Web Wanderer,用于追踪互联网发展规模。刚开始它只用来统计互联网上的服务器数量,后来则发展为也能够捕获网址(URL)。

与Wanderer相对应,1993年10月Martijn Koster创建了ALIWEB(Martijn Koster Annouces the Availability of Aliweb),它相当于Archie的HTTP版本。ALIWEB不使用网络搜寻Robot,如果网站主管们希望自己的网页被ALIWEB收录,需要自己提交每一个网页的简介索引信息,类似于后来大家熟知的Yahoo。

1993年底,一些基于此原理的搜索引擎开始纷纷涌现,其中最负盛名的三个是:Scotland的JumpStation、Colorado大学Oliver McBryan的The World Wide Web Worm(First Mention of McBryan’s World Wide Web Worm)、NASA的Repository-Based Software Engineering(RBSE) spider。

1993年2月,6个Stanford(斯坦福)大学生的想法是分析字词关系,以对互联网上的大量信息作更有效的检索。这就是Excite。后来曾以概念搜索闻名,2002年5月,被Infospace收购的Excite停止自己的搜索引擎,改用元搜索引擎Dogpile

1994年1月,第一个既可搜索又可浏览的分类目录EINet Galaxy(Tradewave Galaxy)上线。除了网站搜索,它还支持Gopher和Telnet搜索。

1994年4月,Stanford两名博士生,美籍华人Jerry Yang(杨致远)和David Filo共同创办了Yahoo。随着访问量和收录链接数的增长,Yahoo目录开始支持简单的数据库搜索。因为Yahoo!的数据是手工输入的,所以不能真正被归为搜索引擎,事实上只是一个可搜索的目录。搜索效率明显提高。(Yahoo以后陆续使用Altavista、Inktomi、Google提供搜索引擎服务)

1994年初,Washington大学CS学生Brian Pinkerton开始了他的小项目WebCrawler(Brian Pinkerton Announces the Availability of Webcrawler)。1994年4月20日,WebCrawler正式亮相时仅包含来自6000个服务器的内容。WebCrawler是互联网上第一个支持搜索文件全部文字的全文搜索引擎,在它之前,用户只能通过URL和摘要搜索,摘要一般来自人工评论或程序自动取正文的前100个字。(后来webcrawler陆续被AOL和Excite收购,现在和excite一样改用元搜索引擎Dogpile)

Lycos(Carnegie Mellon University Center for Machine Translation Announces Lycos)是搜索引擎史上又一个重要的进步。Carnegie Mellon University的Michael Mauldin将John Leavitt的spider程序接入到其索引程序中,创建了Lycos。1994年7月20日,数据量为54,000的Lycos正式发布。除了相关性排序外,Lycos还提供了前缀匹配和字符相近限制,Lycos第一个在搜索结果中使用了网页自动摘要,而最大的优势还是它远胜过其它搜索引擎的数据量:1994年8月--394,000 documents;1995年1月--1.5 million documents;1996年11月--over 60 million documents。(注:1999年4月,Lycos停止自己的Spider,改由Fast提供搜索引擎服务)

Infoseek(Steve Kirsch Announces Free Demos Of the Infoseek Search Engine)是另一个重要的搜索引擎,虽然公司声称1994年1月已创立,但直到年底它的搜索引擎才与公众见面。起初,Infoseek只是一个不起眼的搜索引擎,它沿袭Yahoo!和Lycos的概念,并没有什么独特的革新。但是它的发展史和后来受到的众口称赞证明,起初第一个登台并不总是很重要。Infoseek友善的用户界面、大量附加服务(such as UPS tracking, News, a directory, and the like)使它声望日隆。而1995年12月与Netscape的战略性协议,使它成为一个强势搜索引擎:当用户点击Netscape浏览器上的搜索按钮时,弹出Infoseek的搜索服务,而此前由Yahoo!提供该服务。(注:Infoseek后来曾以相关性闻名,2001年2月,Infoseek停止了自己的搜索引擎,开始改用Overture的搜索结果)

1995年,一种新的搜索引擎形式出现了——元搜索引擎(A Meta Search Engine Roundup)。用户只需提交一次搜索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将从各独立搜索引擎返回的所有查询结果,集中起来处理后再返回给用户。第一个元搜索引擎,是Washington大学硕士生 Eric Selberg和 Oren Etzioni的 Metacrawler。元搜索引擎概念上好听,但搜索效果始终不理想,所以没有哪个元搜索引擎有过强势地位。

DEC的AltaVista(2001年夏季起部分网友需通过p-roxy访问,无p-roxy可用qbseach单选altavista搜索,只能显示第一页搜索结果)是一个迟到者,1995年12月才登场亮相(AltaVista Public Beta Press Release)。但是,大量的创新功能使它迅速到达当时搜索引擎的顶峰。Altavista最突出的优势是它的速度(搜索引擎9238:比较搞笑,设计altavista的目的,据说只是为了展示DEC Alpha芯片的强大运算能力)。而Altavista的另一些新功能,则永远改变了搜索引擎的定义。AltaVista是第一个支持自然语言搜索的搜索引擎,AltaVista是第一个实现高级搜索语法的搜索引擎(如AND, OR, NOT等)。用户可以用AltaVista搜索Newsgroups(新闻组)的内容并从互联网上获得文章,还可以搜索图片名称中的文字、搜索Titles、搜索Java applets、搜索ActiveX objects。AltaVista也声称是第一个支持用户自己向网页索引库提交或删除URL的搜索引擎,并能在24小时内上线。AltaVista最有趣的新功能之一,是搜索有链接指向某个URL的所有网站。在面向用户的界面上,AltaVista也作了大量革新。它在搜索框区域下放了“tips”以帮助用户更好的表达搜索式,这些小tip经常更新,这样,在搜索过几次以后,用户会看到很多他们可能从来不知道的的有趣功能。这系列功能,逐渐被其它搜索引擎广泛采用。1997年,AltaVista发布了一个图形演示系统LiveTopics,帮助用户从成千上万的搜索结果中找到想要的。

然后到来的是HotBot。1995年9月26日,加州伯克利分校CS助教Eric Brewer、博士生Paul Gauthier创立了Inktomi(UC Berkeley Announces Inktomi),1996年5月20日,Inktomi公司成立,强大的HotBot出现在世人面前。声称每天能抓取索引1千万页以上,所以有远超过其它搜索引擎的新内容。HotBot也大量运用cookie储存用户的个人搜索喜好设置。(Hotbot曾是随后几年最受欢迎的搜索引擎之一,后被Lycos收购)

Northernlight公司于1995年9月成立于马萨诸塞州剑桥,1997年8月,Northernlight搜索引擎正式现身。它曾是拥有最大数据库的搜索引擎之一,它没有Stop Words,它有出色的Current News、7,100多出版物组成的Special Collection、良好的高级搜索语法,第一个支持对搜索结果进行简单的自动分类。(2002年1月16日,Northernlight公共搜索引擎关闭,随后被divine收购,但在Nlresearch,选中"World Wide Web only",仍可使用Northernlight搜索引擎)

1998年10月之前,Google只是Stanford大学的一个小项目BackRub。1995年博士生Larry Page开始学习搜索引擎设计,于1997年9月15日注册了google.com的域名,1997年底,在Sergey Brin和Scott Hassan、Alan Steremberg的共同参与下,BachRub开始提供Demo。1999年2月,Google完成了从Alpha版到Beta版的蜕变。Google公司则把1998年9月27日认作自己的生日。

Google在Pagerank、动态摘要、网页快照、DailyRefresh、多文档格式支持、地图股票词典寻人等集成搜索、多语言支持、用户界面等功能上的革新,象Altavista一样,再一次永远改变了搜索引擎的定义。

在2000年中以前,Google虽然以搜索准确性备受赞誉,但因为数据库不如其它搜索引擎大,缺乏高级搜索语法,所以使用价值不是很高,推广并不快。直到2000年中数据库升级后,又借被Yahoo选作搜索引擎的东风,才一飞冲天。

Fast(Alltheweb)公司创立于1997年,是挪威科技大学(NTNU)学术研究的副产品。1999年5月,发布了自己的搜索引擎AllTheWeb。Fast创立的目标是做世界上最大和最快的搜索引擎,几年来庶几近之。Fast(Alltheweb)的网页搜索可利用ODP自动分类,支持Flash和pdf搜索,支持多语言搜索,还提供新闻搜索、图像搜索、视频、MP3、和FTP搜索,拥有极其强大的高级搜索功能。

Teoma起源于1998年Rutgers大学的一个项目。Apostolos Gerasoulis教授带领华裔Tao Yang教授等人创立Teoma于新泽西Piscataway,2001年春初次登场,2001年9月被提问式搜索引擎Ask Jeeves收购,2002年4月再次发布。Teoma的数据库目前仍偏小,但有两个出彩的功能:支持类似自动分类的Refine;同时提供专业链接目录的Resources。

Wisenut由韩裔Yeogirl Yun创立。2001年春季发布Beta版,2001年9月5日发布正式版,2002年4月被分类目录提供商looksmart收购。wisenut也有两个出彩的功能:包含类似自动分类和相关检索词的WiseGuide;预览搜索结果的Sneak-a-Peek。

Gigablast由前Infoseek工程师Matt Wells创立,2002年3月展示pre-beta版,2002年7月21日发布Beta版。Gigablast的数据库目前仍偏小,但也提供网页快照,一个特色功能是即时索引网页,你的网页刚提交它就能搜索(注:这个spammers的肉包子功能暂已关闭)。

Openfind创立于1998年1月,其技术源自台湾中正大学吴升教授所领导的GAIS实验室。Openfind起先只做中文搜索引擎,曾经是最好的中文搜索引擎,鼎盛时期同时为三大著名门户新浪、奇摩、雅虎提供中文搜索引擎,但2000年后市场逐渐被Baidu和Google瓜分。2002年6月,Openfind重新发布基于GAIS30 Project的Openfind搜索引擎Beta版,推出多元排序(PolyRankTM),宣布累计抓取网页35亿,开始进入英文搜索领域,此后技术升级明显加快。

北大天网是国家"九五"重点科技攻关项目"中文编码和分布式中英文信息发现"的研究成果,由北大计算机系网络与分布式系统研究室开发,于1997年10月29日正式在CERNET上提供服务。2000年初成立天网搜索引擎新课题组,由国家973重点基础研究发展规划项目基金资助开发,收录网页约6000万,利用教育网优势,有强大的ftp搜索功能。

Baidu 2000年1月,超链分析专利发明人、前Infoseek资深工程师李彦宏与好友徐勇(加州伯克利分校博士)在北京中关村创立了百度(Baidu)公司。2001年8月发布Baidu.com搜索引擎Beta版(此前Baidu只为其它门户网站搜狐新浪Tom等提供搜索引擎),2001年10月22日正式发布Baidu搜索引擎。Baidu虽然只提供中文搜索,但目前收录中文网页超过9000万,可能是最大的的中文数据库。Baidu搜索引擎的其它特色包括:网页快照、网页预览/预览全部网页、相关搜索词、错别字纠正提示、新闻搜索、Flash搜索、信息快递搜索。2002年3月闪电计划(Blitzen Project)开始后,技术升级明显加快。

搜索引擎的原理,可以看做三步:从互联网上抓取网页→建立索引数据库→在索引数据库中搜索排序。从互联网上抓取网页——利用能够从互联网上自动收集网页的Spider系统程序,自动访问互联网,并沿着任何网页中的所有URL爬到其它网页,重复这过程,并把爬过的所有网页收集回来。建立索引数据库——由分析索引系统程序对收集回来的网页进行分析,提取相关网页信息(包括网页所在URL、编码类型、页面内容包含的关键词、关键词位置、生成时间、大小、与其它网页的链接关系等),根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面内容中及超链中每一个关键词的相关度(或重要性),然后用这些相关信息建立网页索引数据库。在索引数据库中搜索排序——当用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页。因为所有相关网页针对该关键词的相关度早已算好,所以只需按照现成的相关度数值排序,相关度越高,排名越靠前。最后,由页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给用户。

[编辑]全球搜索引擎市场近期大事记

2002年12月24日,雅虎称公司同意以大约2.35亿美元的价格收购搜索软件公司Inktomi。

2003年1月18日,Google收购博客网站Blogger.com开发团队——网上出版软件开发商Pyra Labs。

2003年2月19日,Overture服务公司表示,计划以1.4亿美元现金加股票从CMGI公司手中收购门户网站AtaVista。

2003年2月26日, Overture同意以1亿美元收购位于挪威的Fast Search and Transfer公司的网络搜索部门。

2003年4月15日,新浪与中国搜索联盟结成战略同盟,至此,中国已有数百家网站结成搜索联盟,以迎接国际巨头Google挺进国内市场后的巨大压力。

2003年4月21日,第二大互联网搜索引擎提供商Ask Jeeves公司宣布对其Ask.com网站进行升级。Ask Jeeves是仅次于Google的第二大搜索引擎,也是互联网上第五大搜索基地(Google、雅虎、微软、AOL、Askjeeves)。

2003年6月18日,微软公司表示其正在加大研发新型互联网搜索引擎技术的力度,包括对一款功能更先进的技术原型进行测试。

2003年7月12日,从加利福里亚传来消息,Google即将把总部从Bayshore Parkway搬迁至半里之遥的一个有四栋楼房的复式结构建筑中去,而这个建筑是由鼎鼎大名但目前却陷入困境的硅谷图象(Silicon Graphics)公司腾出来的。大卫.奎恩(David Krane)证实了这个消息,并解释说,这样能让公司现有的800多员工更好的分工合作和管理。

2003年7月13日,百度推出图象搜索,新闻搜索两大搜索功能,以此来带动搜索流量。同时,辅以百度的搜索风云榜,使得百度的信息搜索及信息评估的作用更加突出

2003年7月15日,全球最大的互联网公司雅虎宣布,以16.3亿美元收购在网络搜索服务上的竞争对手—Overture公司,以期在同Google的竞争中取得优势。

[编辑]各大搜索引擎

[google: www.google.com]

[iAsk: iask.sina.com.cn]

yahoo: www.yahoo.com

baidu: www.baidu.com

[醒火: www.thinkhoe.com]*成人论坛

取自""

页面分类:搜索|技术

Views条目讨论编辑历史用户用户登录导航

首页

社区动态

新闻聚合

最近更改

随机页面

入门教程

IT书签

搜索

工具

链入页面

链出更改

上载文件

特殊页面

可打印版

最后更改01:02 2006年10月21日.本页面已经被浏览6,726次。关于DoNews wiki免责条款

cgcs2000,cgcs2000的发布时间轮胎规格参数(轮胎规格参数解释图片 对照表)