Web音乐搜索软件的设计与实现
来源:wenku163.com 资料编号:WK1631846 资料等级:★★★★★ %E8%B5%84%E6%96%99%E7%BC%96%E5%8F%B7%EF%BC%9AWK1631846
资料介绍
摘 要 当前,面对浩瀚的网络资源,搜索引擎为所有网上冲浪的用户提供了一个入口,毫不夸张的说,所有的用户都可以借助于搜索引擎到达自己想去的网上任何一个地方。因此它也成为除了电子邮件以外人们使用最多的网上服务。随着Internet的快速发展,海量信息和人们获取所需信息能力之间的矛盾日益明显,在信息海洋里查找信息,如同大海捞针一样,搜索引擎恰好解决了这一难题。 Web音乐搜索软件是采用Java语言开发的简易的互联网音乐搜索引擎,它是集网络爬虫(采用JAVA内置的多线程及Socket技术)和基于B/S结构的Web查询(Struts框架)为一体的搜索软件。该系统能完成对互联网的音乐信息的采集、分析、分类、保存和查询等功能;经过测试与分析,说明本系统运行稳定、可靠,具有一定的实用价值。 关键字:音乐;搜索软件;网络爬虫;Socket技术;Struts框架;多线程 Design and Implementation of Web Music Search Software Abstract At present, in the vast network resource, search engine for all Internet surfing users provides the one entrance. No exaggeration to say that all users can be reached any one place on the Internet by the aid of search engines. So it has become the most using online services for people except E-mail. However, with the rapid development of the Internet, the contradictions between massive information and obtaining the capacity of required information is obvious day by day. Searching for information in vast network resources is like looking for needles in a haystack, but search engine just solves this problem. The software is about web music search. It uses java to develop a simple Internet music search engine, and also gathers the net-reptile (intra-builder JAVA multi-thread and socket technology) and web search based on B/S construction (struts framework) as a whole search software. It can achieve the collection, analysis, classification, storage and search of Internet music information. Through the test and analysis, it shows this system is stable, reliable, and has some practical values. Key words: Music; Search Software; Crawl; Socket Technology; Struts Structure; Multi-thread 随着因特网的迅猛发展、WEB信息的增加,用户要在信息海洋里查找信息,就像大海捞针一样,搜索引擎恰好解决了这一难题(它可以为用户提供信息检索服务)。但是随着Internet的发展,搜索引擎也面临着海量信息和人们获取所需信息能力的矛盾。 一个好的搜索引擎不再仅凭借数据库大小、更新频率、检索速度、对多语言的支持这几个基本特性来衡量,如何从庞大的资料库中精确地找到正确的资料,被公认为是下一代搜索技术的竞争要点,智能化、个性化特色的新型引擎成为未来搜索引擎的发展趋势。 搜索引擎需要实现互联网信息的快速查询,要实现以下功能。 2.1 搜集信息 搜索引擎的信息搜集基本都是自动的。搜索引擎利用称为网络蜘蛛(spider)的自动搜索机器人程序来连上每一个网页上的超连结。机器人程序根据网页链到其它网页中的超链接,就像日常生活中所说的“一传十,十传百……”一样,从少数几个网页开始,连到数据库上所有到其他网页的链接。理论上,若网页上有适当的超链接器人便可以遍历绝大部分网页。 2.2 整理信息 搜索引擎整理信息的过程称为“建立索引”。搜索引擎不仅要保存搜集起来的信息,还要将它们按照一定的规则进行编排。这样,搜索引擎根本不用重新翻查它所有保存的信息而迅速找到所要的资料。想象一下,如果信息是不按任何规则地随意堆放在搜索引擎的数据库中,那么它每次找资料都得把整个资料库完全翻查一遍,如此一来再快的计算机系统也没有用。 2.3 接受查询 用户向搜索引擎发出查询,搜索引擎接受查询并向用户返回资料。搜索引擎每时每刻都要接到来自大量用户的几乎是同时发出的查询,它按照每个用户的要求检查自己的索引,在极短时间内找到用户需要的资料,并返回给用户。目前,搜索引擎返回主要是以网页链接的形式提供的,这些通过这些链接,用户便能到达含有自己所需资料的网页。通常搜索引擎会在这些链接下提供一小段来自这些网页的摘要信息,以帮助用户判断此网页是否含有自己需要的内容。 |