一、Web搜索引擎技术及应用(论文文献综述)
林茹[1](2021)在《面向博客的分布式垂直搜索引擎的设计与实现》文中研究指明判断一个搜索引擎的成功与否,用户对搜索结果的满意度起了关键作用。由于通用搜索引擎搜索到的内容数量过多,且相关率低、重复率高、内容复杂,用户如果想要在通用搜索引擎中查询某一领域或专业的相关网页,检索过程还需花费大量精力去排除无用信息。垂直搜索引擎的出现正是为了解决这一问题。传统搜索引擎在博客网页信息数据的搜索上效率不高,不能满足想搜索特定博客用户的需求。本文重点研究了搜索引擎中网页相关性排序算法的改进和新词发现算法的改进实现,在此基础上提出了一种面向博客的分布式垂直搜索引擎,对博客网页信息进行获取分析,建立网页索引,并结合用户历史搜索记录,进行了面向博客网页的分布式垂直搜索引擎的设计与实现,提高检索效率和检索准确率。本文主要的创新点及工作如下:(1)针对目前搜索引擎搜索结果排序算法存在的准确率低,排序质量低的问题,改进网页相关性排序算法,结合博客网页的特点,提出了基于BM25相关度的网页排序算法,通过基于锚文本的PageRank算法对网页链接权重进行重分配,同时利用博客网页自身相关属性对搜索结果进行综合排序,提高对新网页的重视;(2)针对目前基于互信息和邻接墒的新词发现算法存在的误分、效率低等问题,使用Trie构建索引树提高搜索效率,同时加入N-Gram模型对分词后的碎片进行拼接,增加长词语的识别;对基于N-Gram模型的拼接词通过内部凝固度和左右邻接墒的计算得到新词;(3)进行搜索引擎系统的详细设计与具体实现。本系统实现的模块包括网页爬虫模块、数据索引模块,以及用户搜索模块,通过对互联网上的网页进行爬取分析,建立数据索引,实现关键词提示、网页搜索结果排序以及网页个性化推荐功能。系统设计与实现过程中主要使用到的相关技术包括网页去重算法、Elasticsearch框架、新词发现算法、网页排序算法、网页推荐算法等。(4)在进行了搜索引擎系统设计与实现后,通过多方面的测试与分析,验证了本系统的实用性、有效性以及实时性。通过对搜索结果的重排序,返回给用户更满意的结果,改善用户体验。
陈秋瑾[2](2021)在《基于微服务架构与知识图谱技术构建无人机知识库系统》文中认为近年来,随着无人机技术的飞速发展以及逐年上涨的市场需求,无人机在各领域得到广泛应用且发挥着重要作用。随着“互联网+”时代的到来以及大数据技术的迅速发展,互联网中信息数据呈现指数增长趋势,如何在信息爆炸的时代获取所需的有效信息成为亟待解决的问题。本文采用B/S服务器模式,以分布式微服务架构为基础,基于分布式及增量式爬虫技术获取互联网中与无人机等应用领域相关的海量数据,采用自然语言处理、知识图谱、机器学习等算法从海量的非结构化文本数据中提取挖掘隐含及潜在价值知识,并利用Echarts组件及知识图谱等算法进行可视化分析,最后形成定制化的无人机知识库。主要研究内容如下:(1)知识获取及存储技术。系统以Scrapy为爬虫框架,采用分布式结合增量式爬虫技术从互联网中高效地获取无人机行业相关的海量数据;采用Redis高速缓存数据库存储爬取的URL网址,结合My SQL关系型数据库稳定地存储最终得到的结构化数据。(2)系统构建流程及架构设计。利用云计算技术的大数据管理平台,基于分布式服务器与大数据技术搭建系统,采用自底向上为主、自顶向下为辅的方式构建知识库;由于系统爬取任务量的增加及分布式服务器的需求,系统的架构也由最初的SMM单体式架构优化升级为Spring Cloud分布式微服务架构,以提高系统的扩展性及移植性。(3)数据提取及知识抽取技术。采用类机器学习机制半自动化地提取非结构化文本数据,通过构建自定义的规则库训练样本数据,提取出标签以匹配提取出的结构化数据;并利用自然语言处理等算法从获取的文本数据中提取关键句并生成文章的摘要信息;通过知识图谱等算法实现对获取的文本数据的知识抽取,最终抽取出结构化的知识元加入进知识库中,以实现知识库的知识发现与知识挖掘功能。(4)知识表示及数据可视化分析。采用知识树形式进行知识表示,并采用Echarts技术、知识图谱等可视化技术对获取及处理后的数据进行数据可视化分析,并以各类统计图表、关键字云图、机构同现及作者同现图等形式展现,直观清晰地展示无人机等行业领域的研究现状与发展趋势。
张琳,于欣越[3](2021)在《Web挖掘及其在网络搜索引擎中的应用》文中研究说明针对当前网络信息的发展需求呈现爆炸式增长,对网络搜索引擎提出了更高要求。采用理论结合实践的方法,首先Web信息检索挖掘技术做了简要概念,其次对基于Web挖掘的网络搜索引擎技术的应用进行了分析,提出了一种给予Web挖掘的个性化搜索引擎,并对各系统模块的功能及实现方式进行研究,分析结果表明,此种系统具有很强的检索灵活性,而且还能实现个性化查询结果,能够满足信息时代,信息数据挖掘和检索的需求,值得大范围推广应用。
张擎天[4](2021)在《网络文件下载信息搜索及追踪系统》文中研究说明互联网兴起至今不过30年,已经发展成为一个庞然大物,互联网提供的服务从最初的文本浏览到今天的各种纷繁的功能业务,其核心都避不开文件的传输即下载,文件下载在为用户带来便利的同时也带来了在线盗版文件下载。而且近年来随着我国网络基础设施的快速发展,网速出现了飞跃性的进步,盗版文件的传播也变得更加快速,盗版文件的下载出现了传播量大、有效时间短的特点。基于以上因素,本文提出了一种主要面向盗版下载文件的下载信息搜索和下载来源追踪的系统(ISTS-NDF Information Searching and Tracking System of Network Downloading File)。针对盗版文件相关问题,本文将系统功能拆分,实现了三个不同功能的子系统。本文中:1.实现了一系列爬虫,将网页爬取的过程拆分成不同阶段和功能,分别实现了遍历、解析、登录、回复等功能的爬虫,解决了人机验证保护下的深层网页的信息收集问题。2.本文针对网页正文提取的多种特征,分离了爬虫与爬虫分析网页的代码,实现了基于平均采样的爬虫代码与网站的动态匹配算法和动态代码加载,可对同类型的网站进行爬虫代码匹配,减少人工编写代码的工作量。3.为了收集大量的盗版文件信息,本文在单机爬虫基础上设计了一种分布式爬虫系统方案。该方案实现了一种基于爬虫历史爬取性能数据的权重轮询任务规划算法,解决分布式系统中节点任务规划问题。实现了基于布隆过滤器算法的大规模网页去重与增量爬取功能,使用Docker虚拟化技术实现了节点的自动部署、自动代码更新,基于Scrapyd技术实现了节点的状态监控,冗余备份,节点失效的自愈功能,完成了一个工业化的分布式爬虫系统,为大规模的网络信息收集提供了可能性。4.在收集下载文件信息的基础上,本文设计实现了一种下载文件的追踪子系统,可对直接下载、网盘分享、P2P下载的三种文件分享形式进行不同程度上的有效性的确认和来源追踪,可以为执法者和相关研究者提供数据上的支持。5.本文设计实现了一个简洁的系统数据展示和系统功能管理的子系统,使用流行的前后端技术实现该子系统,做到了前后端分离。
叶云波[5](2021)在《基于元搜索引擎的排序算法研究》文中研究指明在大数据时代,大量信息涌现在用户面前,人们大多通过网络获取信息。而搜索引擎的出现则是在互联网与用户之间搭起了一座桥梁,帮助用户获取信息。但是,单一的搜索引擎因为低精度、低召回率等原因导致用户的满意度较低。因此,调用多个成员搜索引擎的元搜索引擎被提出,有助于扩大信息检索的覆盖面,提升召回率。元搜索引擎最关键的技术在于对结果的合成和重新排序,排序结果的好坏将直接影响整个元搜索引擎的性能。现在的元搜索引擎很少关注网页信息的质量以及网页正文的内容和信息量。本文通过对网页信息质量进行评估,进一步考虑网页正文关键词信息对搜索结果进行重新排序,本文的主要工作有:(1)本文提出了一种基于网页信息质量评价模型的排序算法。针对现有搜索引擎很少关注网页信息质量的问题,本文基于网页的标题、网页的摘要、网页的来源计算出网页信息质量的评分。根据网页信息质量的评分对网页进行重新排序。本文通过实验,验证了基于网页信息质量评价算法的元搜索引擎提升了搜索精度,并且用户的满意度也明显优于现有的搜索引擎。(2)本文在第一个工作的基础上进一步提出了融合网页正文关键词信息评价模型的排序算法。针对现有搜索引擎只返回大量相关主题页面,并不评价网页正文内容的问题,对于信息类查询本文首先通过网页正文抽取算法抓取网页正文部分内容。再通过正文关键词提取算法获得网页正文的关键词以及权重。最后通过网页正文关键词信息评价算法计算出网页正文内容评价得分。根据得分进一步优化元搜索引擎的排序。经过实验验证,该方法对于尖端网页的排序更加合理,平均查准率高达94%。(3)本文基于提出的元搜索引擎的重排序算法设计并实现了原型系统。对元搜索引擎系统的流程和整体框架进行了说明,对系统界面进行了展示。本系统通过一个友好简洁的界面与用户进行交互,帮助用户在更短的时间获取更多有效的信息,并且提供相关搜索与当下搜索热点推荐,以提升用户的满意度。
吴进发[6](2021)在《电子病历搜索引擎中的新词发现和排序技术研究》文中进行了进一步梳理电子病历(Electronic Medical Record,EMR)贯穿患者的整个医疗活动,包含患者的诊疗信息,对医生的诊断和决策起着关键作用。然而早期积累的大量非结构化中文电子病历文档(Xml格式)却给医生的病历检索和科研带来阻碍,如何快速准确地从电子病历中检索有用信息已经变得越来越迫切。因此本文研究了使用Elasticsearch(实时搜索引擎,ES)搜索引擎工具来构建电子病历全文检索系统,从而提高电子病历的检索效率。本文的研究主要包括以下三个方面:(1)本文提出了一种基于互信息与左右信息熵的中文新词发现改进算法用于电子病历搜索引擎。本文基于中文电子病历的文本特征和医学术语的词法,主要对预处理和算法结构两点进行改进。预处理上,本文基于中文医学主题词表和ICD-10疾病编码构建了医学词典,还参照电子病历文本中的医学词汇特点选取了部分停用词用于更新前置分词器的停用词表,用于提高中文新词发现算法中的前置分词效果,从而发现更多的新词。结构上,将算法中点互信息计算的改为点互信息均值,将左右信息熵的计算进行拆分,最终将两个分支的结果合并取交集。实验结果表明,本文提出的改进算法的新词发现效果优于改进前的新词发现效果。(2)本文提出了一种基于Ada Rank的电子病历搜索引擎搜索结果排序算法。传统的检索模型需要依靠人工设置排序公式,并在迭代过程中不断优化排序参数,手动调试参数工作量较大。近年来使用机器学习排序模型的排序学习算法开始在各领域大规模应用。在电子病历领域,使用排序学习的研究非常少,因此,本文将排序学习中的Ada Rank算法应用于电子病历,来对搜索引擎排序结果进行优化。本文通过人工标注心血管疾病电子病历文档,选取关键词对每个文档进行文档-查询词对标注,最后使用传统检索模型BM25,学习排序Rank Net、Lambda Rank、List Net、Lambda MART来进行对比实验,实验表明,本文提出的电子病历搜索算法对比传统的BM25算法和其他四种排序学习算法对电子病历的搜索结果排序优化效果更佳。(3)电子病历搜索引擎系统的设计与实现。基于(1)和(2)的研究,本文构建的病历搜索系统除了具有电子病历全文检索功能,还提供了用户管理功能,新词发现功能,电子病历查看功能。电子病历全文检索功能的应用使得电子病历的全文检索变得更加简便快速。
王梅嘉[7](2020)在《基于整子多智能体的社会化搜索引擎模型及关键技术》文中提出Web 2.0时代的到来,在线社交网络应用迅速普及,大量用户涌入在线社交网络平台发表见解、分享生活,产生了大量用户生成内容。这些数据对于提高搜索服务的质量与体验具有重要意义。在此背景下,旨在利用社交网络数据优化搜索结果,提升搜索服务用户满意度的社会化搜索引擎应运而生。然而,已有社会化搜索引擎研究仍然存在4个问题:(1)检索资源大都集中于特定的在线社交网络平台,导致信息检索查全率不高;(2)被动响应用户搜索请求,仅通过用户兴趣、亲密度等知识,研究具体结果排序算法的分析设计,个性化程度并不能令用户满意;(3)忽略了社交网络数据实时变化的特点,无法保证社交网络知识的新鲜度;(4)研究内容局限于算法分析与社会化搜索模式、机理的探讨,缺乏系统模型的设计。因此,针对社会化搜索引擎面临的“检索范围局限、知识应用不足、缺乏社交网络知识的主动更新机制,以及研究碎片化、缺乏模型设计”问题,本文提出了一个面向全网检索资源、支持任务自适应调度、基于整子多智能体的社会化搜索引擎模型,能够利用多种在线社交网络知识优化全网搜索引擎的检索结果,向用户提供个性化的检索结果列表,主动推荐感兴趣的多样化信息。本文的创新性成果主要包含4个方面:(1)提出了一个支持任务自适应调度、面向全网检索资源、基于整子多智能体的社会化搜索引擎模型。本文从任务角度出发,设计了整子多智能体系统符号化模型,在设计Holon结构、建模任务相关信息的基础上,探讨了系统的自适应机制以及任务分配方法。实验结果表明,本文提出的自适应机制能通过对执行单元的竞争力调整以及结构调整,帮助系统适应新的环境需求。该方法尤其适用于解决因部分计算节点失效引起的环境异常,通过调用处于空闲状态或正常状态的执行单元,以协助异常执行单元完成任务,保证任务执行的成功率,提高系统的鲁棒性。(2)设计了一种社交网络数据变化主动感知策略以及社交网络知识主动更新机制。通过分析用户在社交网络平台的行为习惯,设计相应感知规则,主动感知用户社交网络数据变化,考虑到用户行为存在不稳定性,提出的社交网络数据变化感知策略,能够根据用户行为不断学习新的感知规则。在此基础上,为了降低不必要的知识更新引起的系统开销,采用基于阈值的方法判断社交网络数据的变化是否引起知识变化,适时更新相关知识,以保证社交网络知识的新鲜度。实验结果表明,本文提出的方法对于社交网络数据变化的更新率达到了92.6%,社交网络知识的更新率达到了72.5%,能够满足用户的个性化搜索需求。(3)提出了一种基于查询分类的多特征融合结果排序方法。该方法将用户提交的查询词分类处理,针对非导航类查询词,融合用户与网页文档之间的主题相似度,用户兴趣关键词与网页关键词相似度,文档在搜索引擎中返回的位置,成员搜索引擎返回结果的数量等多个特征,为用户提供个性化的检索结果列表。扩展查询词时,在考虑了成员搜索引擎对于文档相关度评分的基础上,融合用户兴趣社团成员的点击记录,以及社团成员在用户兴趣领域的影响力,确定查询伪相关文档,扩展用户提交的查询词,帮助用户更好的表达查询意图。实验结果表明,提出的结果排序方法对于信息类查询词的NDCG均值达到了0.677,对于事务类查询词的NDCG均值带到了0.706,与参照方法相比,具有较高的查准率。(4)提出了一种基于社交网络知识的多样化信息推荐机制。通过为用户提供个性化的结果推荐、热点推荐以及用户推荐服务,建立知识与知识之间的连接,以及知识与人之间的连接。结果推荐方法通过用户的兴趣社团、交互社团、社交社团成员的查询记录,以及社团成员与当前用户的最短路径,为当前用户推荐可能感兴趣的网页文档。热点推荐方法根据用户兴趣的主题分布、用户的兴趣社团成员以及交互社团成员的点击记录向当前用户推荐可能感兴趣的热点。除此之外,提出的信息推荐机制,能够根据用户提交查询的所属领域,帮助用户找到该领域内影响力用户以及非领域用户。实验结果表明,本文提出的结果推荐方法关于信息类查询的MAP值达到了0.743,事务类查询的MAP值达到了0.731;提出的用户推荐方法的相关性分值达到了0.709;提出的热点推荐方法,MAP值达到了0.750。与参照方法相比,本文提出的推荐机制准确率更高,能够主动帮助用户发现所需资源。本文围绕现有社会化搜索引擎存在问题,开展了社会化搜索引擎模型的整体设计及算法、机制、策略等关键技术的研究。所提出的面向全网社会化搜索引擎模型,社交网络知识的主动感知与更新机制,以及基于社交网络知识的结果排序方法与多样化信息推荐机制,能在一定程度上提高社会化搜索引擎的查准率。
李春婕[8](2020)在《网络媒体舆情检测与分析系统设计与实现》文中进行了进一步梳理网络舆情是互联网与社会发展相结合后而生成的特殊现象,公众针对公共问题及社会管理者形成的信念及价值观、社会的政治态度等都属于网络舆情的范畴。文章中主要研究的是针对网络媒体进行舆情的检测以及分析研究的系统,针对当前的舆论发展以及规范处理的问题所推出的。在这个系统中,能够明确的了解到不同的网站门户出现的网络新闻舆情消息,其中门户网站包括凤凰、腾讯、新华以及新浪等等,将针对一个问题的报道进行汇总,而且能够对此类的舆情信息进行进一步的跟踪报道,以此对此话题进行分析,对其发展的趋向进行研究,最终研究各种事件针对网络舆情中的发展以及变化的机制,最后给予决策人员准确的数据,以此能够掌握网络舆论的主动权,可以对网上的舆论进行明确的引导。在本次研究中对网络爬虫进行了有效整合,首先对舆情监测的实际情况做了介绍,阐述了研究现状,并介绍了目前市场上的相关商品。在网络爬虫技术的基础上,将信息过滤和抓取功能相结合,利用搜索引擎实现网页数据的采集;通过网页去噪技术、网页排重技术和特征选取技术完成对网页和信息的预处理,以信息检索算法为基础,结合话题追踪和情感挖掘两种方法对网络舆情进行分析,了解其需求以及发展的趋向,对当前商业产品的不足之处进行把握,以此推出事件情感追踪、话题追踪的舆情监测系统;对于网页中的舆情以及热点的分布和来源进行深层次挖掘,和用户做出进一步的交互,按照客户的反馈形成对应的用户舆情模型库。然后针对舆情监测的系统原型进行进一步的分解,确定技术重点;以上述理论和技术重点为基础框架,设计了一款网络舆情监测系统,该系统包括舆情采集、网页预处理、话题追踪、舆情分析几个模块,针对网页爬虫的性能和舆情文本的数据做了分析以及测定,最终结果表明,本文所设计的网络媒体舆情检测与分析系统精准性和实用性良好。
于焕焕[9](2020)在《基于机器学习的暗网威胁情报分析》文中研究说明互联网以前所未有的广度和便利性促进了全世界人类之间的互动,但是,暗网的出现以及日趋成熟,严重威胁了我们的社会和公共安全。因此,研究如何探索暗网的网络空间具有重要的意义。暗网的域名不同于明网域名,具有不公开,存在时间较短,更新换代快的特点,因此暗网域名以及暗网市场识别较为困难,很难获取威胁情报以及复杂的内容分布情况,暗网的分析构成不明确。因此本文基于以上这些问题,对暗网进行数据收集以及内容分析。所设计的系统包括以下几个部分:(1)针对暗网数据问题,本文首先对隐藏服务内容进行爬取,其次对爬取到的内容进行分类,利用一些暗网爬虫策略,采用了Scrapy框架进行爬取,最后对暗网数据爬取进行了设计与实现。(2)针对识别暗网市场内卖方困难的问题,本文设计了暗网市场分析模型。首先进行数据源识别,采用了关键字、雪球以及Deep Weep隐藏服务方法;然后进行数据收集,通过收集的数据进行资产分析,从而能实现主动获取网络威胁情报。(3)针对域名地址收集困难的问题,本文设计了暗网域名聚合系统,使用了暗网目录聚合、Tor2Web域名关键字聚合以及社交网站聚合三种方式进行收集。首先暗网目录聚合收集是暗网域名收集的主要来源,其次提出了发现特定关键字算法,通过Tor2web进行,最后利用Scrapy爬虫框架从Reddit的社交网站的发布内容中获取域名地址。本章最后对暗网域名聚合性进行了测试,测试主要采用关键字搜索方法,搜索关键词使用了Torch、Duckduckgo、Ahmia三大搜索引擎。(4)针对KNN分类效果准确率不高,对KNN算法进行了改进。目前,在暗网数据分类采用的算法中,大部分只提取文本的单个特征值,而没有考虑文本之间关联关系,针对这个情况,提出了基于关联规则的KNN算法改进。首先对Apriori算法进行改进,然后对改进的Apriori算法进行关联规则,提取了频繁项集,确定了K近邻,最后结合KNN算法进行暗网数据分类。在本文的最后,本文所设计的系统扩大了暗网域名的收集数量,并且通过实验验证了基于关联规则的KNN算法,提高了暗网数据分类准确率,证明改进的关联规则Apriori算法,再结合KNN算法对暗网分类更有效。
澹台栋良[10](2020)在《面向网络空间安全的搜索引擎研究与实现》文中提出近些年,得益于互联网的高普及率,现在接入互联网的设备的种类越来越多。除了个人电脑和服务器,还有路由器、物联网家电、平板电脑以及手机等,甚至还有监控探头、工业控制中的SCADA系统等比较敏感的网络设备,共同组成了我们所处的网络空间(Cyberspace)。而网络空间是由这些网络设备共同组成的,一旦其中任意一个网络设备发生故障,将很有可能会引发整个网络空间的安全问题。因此,如何了解网络空间中网络设备信息显得迫在眉睫,并且随着人们对搜索引擎使用需求的日益增多,那么用户如何快速准确地获取到网络空间中网络设备的信息也就变得十分重要,因此,面向网络空间安全的搜索引擎应运而生。本文所实现的网络空间安全的搜索引擎主要完成了对网络空间中网络设备数据进行收集,通过监听消息队列来获取扫描与识别的任务,主要收集的数据包括了IP、端口号以及开闭信息、操作系统和其版本号、服务和其版本号、组件和其版本号以及Banner数据等,然后对这些数据进行处理并放到消息队列中,然后Mongo DB数据库通过监听这个消息队列来读取数据并将其存到数据库中,以供服务器调用和搜索引擎建立索引,从而使用户通过前端页面来使用系统所提供的功能。系统主要通过使用网络扫描工具Nmap、Zmap以及第三方工具ipstack来完成对网络设备数据的收集。首先,本文介绍了面向网络空间安全的搜索引擎的研究背景以及意义,并对其国内外研究现状进行了分析,然后给出了论文的主要研究内容。然后,对相关理论与技术进行了深入的研究,主要研究了搜索引擎的组成部分以及常用扫描技术与常用扫描工具。其次,对面向网络空间安全的搜索引擎进行了需求分析和总体设计,并给出了系统的总体框架图,以此为基础设计出了系统的框架流程图,并参照该系统的框架流程图,对系统的模块进行划分。然后,对系统的各个模块进行了详细的设计与实现。并且,通过UI实现过程对该系统进行了功能性测试,还进行了性能上的测试,验证了面向网络空间安全的搜索引擎符合设计原则和要求。最后,本文总结了面向网络空间安全搜索引擎的工作与不足,并且指出未来的工作方向。
二、Web搜索引擎技术及应用(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、Web搜索引擎技术及应用(论文提纲范文)
(1)面向博客的分布式垂直搜索引擎的设计与实现(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景与意义 |
1.2 国内外发展现状 |
1.3 论文研究内容 |
1.4 论文组织结构 |
第二章 搜索引擎相关技术研究 |
2.1 搜索引擎架构 |
2.1.1 搜索引擎工作原理 |
2.1.2 Elasticsearch搜索引擎框架 |
2.1.3 中文分词算法 |
2.1.4 倒排索引 |
2.2 网页去重算法研究 |
2.2.1 布隆过滤器 |
2.2.2 SimHash算法 |
2.3 协同过滤推荐模型 |
2.3.1 基于用户的协同过滤 |
2.3.2 基于项目的协同过滤 |
2.4 WORD2VEC模型 |
2.5 本章小结 |
第三章 垂直搜索引擎方案设计 |
3.1 搜索引擎总体方案设计 |
3.2 基于BM25相关度的网页排序算法 |
3.2.1 计算关键词与网页的相关度 |
3.2.2 PageRank算法对网页链接权重重分配 |
3.2.3 计算博客网页自身影响力调整网页排名 |
3.3 基于改进的互信息和邻接墒的新词发现算法 |
3.3.1 新词发现算法整体设计 |
3.3.2 基于N-Gram模型对分词碎片拼接 |
3.3.3 内部凝固度和邻接墒计算 |
3.4 算法实验测试 |
3.4.1 网页排序算法实验测试 |
3.4.2 新词发现算法实验测试 |
3.5 本章小结 |
第四章 垂直搜索引擎的设计与实现 |
4.1 搜索引擎系统需求分析 |
4.1.1 系统业务需求与设计目标分析 |
4.1.2 系统功能性需求分析 |
4.1.3 系统非功能性需求分析 |
4.2 搜索引擎模块方案设计 |
4.3 网络爬虫模块详细设计与实现 |
4.3.1 网页爬虫模块总体设计 |
4.3.2 网络爬虫模块具体实现 |
4.3.3 改进的PageRank算法实现 |
4.4 数据索引模块详细设计与实现 |
4.4.1 新词发现算法实现 |
4.4.2 中文分词 |
4.4.3 索引构建 |
4.5 用户检索模块详细设计与实现 |
4.5.1 搜索结果排序 |
4.5.2 搜索词提示 |
4.5.3 网页个性化推荐 |
4.6 本章小结 |
第五章 系统测试与性能分析 |
5.1 系统测试环境 |
5.2 系统功能测试 |
5.2.1 爬虫模块测试 |
5.2.2 索引模块测试 |
5.2.3 搜索模块测试 |
5.3 系统性能测试 |
5.4 本章小结 |
第六章 总结与展望 |
6.1 工作总结 |
6.2 不足和展望 |
参考文献 |
致谢 |
(2)基于微服务架构与知识图谱技术构建无人机知识库系统(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景及意义 |
1.1.1 研究背景 |
1.1.2 研究意义与价值 |
1.2 国内外研究现状 |
1.2.1 专家系统及知识库研究现状 |
1.2.2 知识图谱技术研究现状 |
1.2.3 Web文本挖掘技术研究现状 |
1.2.4 无人机技术发展及应用现状 |
1.3 研究目标与研究内容 |
1.3.1 研究目标 |
1.3.2 研究内容 |
1.4 论文研究技术路线 |
1.5 论文组织结构安排 |
第二章 理论基础及关键技术 |
2.1 相关理论基础 |
2.2.1 知识库 |
2.2.2 知识发现 |
2.2.3 知识图谱 |
2.2 知识获取技术 |
2.2.1 数据获取技术 |
2.2.2 数据去重技术 |
2.2.3 数据提取技术 |
2.2.4 数据存储技术 |
2.3 知识抽取技术 |
2.3.1 实体抽取技术 |
2.3.2 关系抽取技术 |
2.3.3 事件抽取技术 |
2.3.4 实体链接与消岐 |
2.4 知识表示技术 |
2.5 自动文摘技术 |
2.5.1 自动文摘生成原理 |
2.5.2 TextRank算法 |
2.6 本章小结 |
第三章 知识库系统的设计与构建 |
3.1 系统非功能需求 |
3.2 系统性能设计 |
3.2.1 系统可靠性设计 |
3.2.2 系统安全性设计 |
3.3 系统架构设计 |
3.3.1 整体架构设计 |
3.3.2 技术架构设计 |
3.3.3 分布式微服务架构 |
3.3.4 Scrapy爬虫框架 |
3.3.5 基于Swagger框架管理API |
3.4 技术路线与实施方案 |
3.4.1 知识库的构建方式 |
3.4.2 系统的技术路线 |
3.4.3 系统的实施方案 |
3.4.4 开发环境与开发语言 |
3.5 本章小结 |
第四章 知识图谱的实现与应用 |
4.1 知识获取 |
4.1.1 定制化设置关键字 |
4.1.2 定制化爬取专业网站 |
4.2 数据提取 |
4.2.1 半自动化提取数据 |
4.2.2 自动文摘的提取 |
4.3 知识抽取 |
4.3.1 实体抽取(命名实体识别) |
4.3.2 实体关系抽取 |
4.3.3 元事件抽取 |
4.3.4 实体发现与链接 |
4.4 知识表示 |
4.5 文本数据可视化 |
4.5.1 数据可视化 |
4.5.2 关键字云图 |
4.6 本章小结 |
第五章 系统的功能与实现 |
5.1 系统整体功能结构 |
5.2 系统前端功能实现 |
5.2.1 查询信息模块 |
5.2.2 台风实况模块 |
5.2.3 数据可视化模块 |
5.2.4 热门推送模块 |
5.2.5 关键期刊模块 |
5.3 系统后台功能实现 |
5.3.1 用户管理模块 |
5.3.2 菜单管理模块 |
5.3.3 采集设置模块 |
5.3.4 任务管理模块 |
5.3.5 专家知识模块 |
5.3.6 外部系统模块 |
5.3.7 期刊大全模块 |
5.4 本章小结 |
第六章 结论与展望 |
6.1 总结 |
6.2 创新点 |
6.3 不足与展望 |
参考文献 |
致谢 |
在学期间主要研究成果 |
附录 |
附录1 Swagger在微服务架构上的部署与集成 |
附录2 Echarts组件实现折线图/柱状图形式的数据可视化 |
附录3 BiLSTM+CRF模型构建过程 |
附录4 利用TF-IDF进行实体链接关键代码 |
(3)Web挖掘及其在网络搜索引擎中的应用(论文提纲范文)
0 引言 |
1 Web信息检索挖掘技术 |
2 基于Web挖掘技术的网络搜索引擎系统 |
2.1 系统的总体结构及主要流程 |
2.2 系统中的主要技术 |
3 结束语 |
(4)网络文件下载信息搜索及追踪系统(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 本文的研究工作概述 |
1.3 搜索引擎相关技术的国内外研究历史与现状 |
1.4 本文的主要贡献与技术特色 |
1.5 本论文的结构安排 |
1.6 本章小结 |
第二章 关键技术研究及相关技术介绍 |
2.1 关键技术研究 |
2.2 相关技术介绍 |
2.2.1 Scrapy爬虫框架 |
2.2.2 Redis数据库 |
2.2.3 Solr全文检索引擎 |
2.2.4 Bootstrap前端框架 |
2.3 本章小结 |
第三章 ISTS-NDF系统需求分析与系统划分 |
3.1 ISTS-NDF系统整体目标分析 |
3.2 系统业务功能需求分析 |
3.2.1 信息采集子系统需求分析 |
3.2.2 文件追踪子系统需求分析 |
3.2.3 服务与展示子系统需求分析 |
3.3 分布式爬虫需求分析 |
3.4 本章小结 |
第四章 ISTS-NDF系统详细设计 |
4.1 系统架构分析 |
4.2 信息采集子系统中的爬虫设计 |
4.2.1 基于网页特征的目录树式网页遍历与网页解析 |
4.2.2 基于布隆过滤器算法的网页去重与增量更新 |
4.2.3 基于平均采样的爬虫代码匹配算法模块设计 |
4.2.4 分布式爬虫设计 |
4.3 系统其他业务功能设计 |
4.3.1 信息采集子系统 |
4.3.2 文件追踪子系统设计 |
4.3.3 服务与展示子系统设计 |
4.4 本章小结 |
第五章 ISTS-NDF系统功能实现 |
5.1 系统技术架构 |
5.2 信息采集子系统实现 |
5.2.1 爬虫模块 |
5.2.2 人机验证模块 |
5.2.3 代码匹配算法模块 |
5.2.4 分布式爬虫实现 |
5.3 文件追踪子系统实现 |
5.4 服务与展示子系统实现 |
5.5 本章小结 |
第六章 系统测试 |
6.1 系统单元模块测试 |
6.2 系统集成功能测试 |
6.3 系统性能测试 |
6.4 本章小结 |
第七章 总结与展望 |
7.1 论文工作总结 |
7.2 问题与展望 |
致谢 |
参考文献 |
(5)基于元搜索引擎的排序算法研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 研究现状 |
1.3 本文研究内容 |
1.4 本文组织结构 |
第二章 元搜索引擎相关理论技术研究 |
2.1 搜索引擎概述 |
2.1.1 搜索引擎的发展 |
2.1.2 搜索引擎的技术架构 |
2.1.3 搜索引擎存在的问题 |
2.2 元搜索引擎概述 |
2.2.1 元搜索引擎的原理 |
2.2.2 元搜索引擎的分类 |
2.2.3 元搜索引擎和搜索引擎的区别 |
2.3 搜索质量评价技术 |
2.3.1 Cranfield评价体系 |
2.3.2 评价指标 |
2.4 本章小结 |
第三章 基于网页信息质量评价模型的排序算法 |
3.1 网页信息质量评价模型 |
3.1.1 相关定义 |
3.1.2 网页信息质量评价框架 |
3.2 基于网页信息质量评价模型的排序算法 |
3.2.1 数据清洗预处理 |
3.2.2 指标计算方法 |
3.2.3 网页信息质量评价算法 |
3.3 实验和分析 |
3.3.1 实验数据和评价标准 |
3.3.2 权重确定 |
3.3.3 实验设计与实验结果 |
3.3.4 实验分析 |
3.4 本章小结 |
第四章 融合网页正文关键词信息评价模型的排序算法 |
4.1 网页正文关键词信息评价模型 |
4.1.1 相关定义 |
4.1.2 方法框架 |
4.2 融合网页正文关键词信息评价模型的排序算法 |
4.2.1 网页正文的获取方法 |
4.2.2 动态页面正文抽取 |
4.2.3 正文关键词提取算法 |
4.2.4 网页正文关键词信息评价算法 |
4.3 实验和分析 |
4.3.1 实验数据和评价标准 |
4.3.2 实验设计与实验结果 |
4.3.3 实验分析 |
4.4 本章小结 |
第五章 原型系统设计与实现 |
5.1 系统开发环境 |
5.2 系统流程 |
5.3 相关技术 |
5.3.1 网络爬虫技术 |
5.3.2 分词技术 |
5.3.3 服务器端动态网页开发技术 |
5.4 系统整体框架 |
5.4.1 用户接口模块 |
5.4.2 检索请求模块 |
5.4.3 成员搜索引擎调度模块 |
5.4.4 结果处理模块 |
5.5 系统功能与展示 |
5.5.1 数据集成功能 |
5.5.2 信息查询与推荐功能 |
5.5.3 系统界面 |
5.5.4 查询结果展示 |
5.6 本章小结 |
第六章 工作总结与展望 |
6.1 研究成果总结 |
6.2 未来工作展望 |
参考文献 |
在学期间取得的科研成果和科研情况说明 |
致谢 |
(6)电子病历搜索引擎中的新词发现和排序技术研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究的背景及意义 |
1.2 国内外研究历史与现状 |
1.2.1 搜索引擎技术在电子病历中的应用 |
1.2.2 现有研究工作的不足之处 |
1.3 论文的主要研究内容 |
1.4 论文的结构安排 |
第二章 基于词语互信息和左右熵的新词发现改进算法研究 |
2.1 引言 |
2.2 背景技术及解决问题分析 |
2.2.1 相关技术介绍 |
2.2.2 传统中文新词发现算法的缺点 |
2.2.3 基于词语互信息和左右熵的新词发现算法原理介绍 |
2.3 基于词语互信息和左右熵的新词发现改进算法研究 |
2.3.1 预处理改进 |
2.3.2 算法结构改进 |
2.4 实验设计及结果分析 |
2.4.1 实验环境 |
2.4.2 数据集以及预处理 |
2.4.3 实验设计及实验过程 |
2.4.4 实验结果及分析 |
2.5 本章小结 |
第三章 基于AdaRank的电子病历搜索引擎排序算法研究 |
3.1 引言 |
3.2 排序算法问题分析 |
3.2.1 TF-IDF算法 |
3.2.2 BM25 算法 |
3.3 本文用于电子病历搜索的AdaRank算法及实现 |
3.3.1 AdaRank算法原理及优势 |
3.3.2 AdaRank算法在Elasticsearch中的实现 |
3.4 实验设计与结果分析 |
3.4.1 数据集 |
3.4.2 数据标注 |
3.4.3 评估指标 |
3.4.4 对比实验 |
3.4.5 实验结果分析 |
3.5 本章小节 |
第四章 电子病历搜索引擎系统设计与实现 |
4.1 系统需求分析 |
4.2 系统逻辑架构设计 |
4.3 系统设计 |
4.3.1 系统架构设计 |
4.3.2 系统数据库设计 |
4.3.3 Web接口设计 |
4.3.4 算法服务器设计 |
4.4 系统实现 |
4.4.1 硬件环境 |
4.4.2 软件环境 |
4.4.3 Elasticsearch环境的搭建 |
4.4.4 Elasticsearch中插件的安装 |
4.4.5 电子病历部分字段的结构化 |
4.5 系统测试 |
4.6 本章小结 |
第五章 总结与展望 |
5.1 总结 |
5.2 展望 |
致谢 |
参考文献 |
(7)基于整子多智能体的社会化搜索引擎模型及关键技术(论文提纲范文)
摘要 |
ABSTRACT |
符号对照表 |
缩略语对照表 |
第一章 绪论 |
1.1 研究背景与意义 |
1.2 现有研究存在问题分析 |
1.3 研究内容与研究目标 |
1.3.1 研究内容 |
1.3.2 研究目标 |
1.4 论文结构 |
第二章 相关工作 |
2.1 社会化搜索引擎 |
2.1.1 社会化搜索引擎概念与特点 |
2.1.2 社会化搜索引擎研究现状 |
2.2 整子多智能体系统 |
2.2.1 整子多智能体系统概念与特点 |
2.2.2 整子多智能体系统研究现状 |
2.3 Agent在社会化搜索、社会化推荐中的应用 |
2.4 本章小结 |
第三章 基于HMAS的社会化搜索引擎模型 |
3.1 基于任务角度的HMAS组织结构模型 |
3.2 HMAS自适应机制 |
3.2.1 竞争力调整机制 |
3.2.2 结构调整机制 |
3.3 基于竞争力的任务分配策略 |
3.4 基于HMAS的社会化搜索引擎体系结构 |
3.5 本章小结 |
第四章 数据获取与感知策略 |
4.1 在线社交网络数据获取方法 |
4.2 搜索数据获取方法 |
4.2.1 搜索引擎数据获取方法 |
4.2.2 结果处理方法 |
4.2.3 查询记录获取方法 |
4.3 数据主动感知策略 |
4.4 本章小结 |
第五章 在线社交网络知识获取与更新机制 |
5.1 社交网络知识获取方法 |
5.1.1 用户兴趣知识获取 |
5.1.2 用户影响力知识获取 |
5.1.3 用户社团知识获取 |
5.2 社交网络知识更新机制 |
5.2.1 知识感知方法 |
5.2.2 知识更新机制 |
5.3 本章小结 |
第六章 基于社交网络知识的搜索优化策略 |
6.1 结果排序机制 |
6.1.1 查询扩展方法 |
6.1.2 结果排序方法 |
6.2 信息推荐机制 |
6.2.1 结果推荐方法 |
6.2.2 热点推荐方法 |
6.2.3 用户推荐方法 |
6.3 本章小结 |
第七章 实验设计与结果分析 |
7.1 结果排序机制 |
7.2 查询扩展方法 |
7.3 信息推荐机制 |
7.3.1 结果推荐方法 |
7.3.2 用户推荐方法 |
7.3.3 热点推荐方法 |
7.4 社交网络知识的主动更新机制 |
7.5 自适应机制 |
7.5.1 竞争力调整机制 |
7.5.2 结构调整机制 |
7.6 系统性能 |
7.7 参数选择 |
7.7.1 结果排序参数α设置 |
7.7.2 社交社团划分参数θ的确定 |
7.7.3 结果推荐参数μ_1、μ_2的确定 |
7.7.4 知识感知方法阈值T_1、T_2、T_3、T_4的确定 |
7.8 本章小结 |
第八章 总结与展望 |
8.1 研究工作总结 |
8.2 下一步工作 |
参考文献 |
致谢 |
作者简介 |
(8)网络媒体舆情检测与分析系统设计与实现(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景 |
1.2 国内外研究现状 |
1.2.1 国外研究现状 |
1.2.2 国内研究现状 |
1.3 研究内容 |
1.4 论文组织结构 |
第二章 网页数据采集及信息预处理 |
2.1 搜索引擎 |
2.1.1 搜索引擎的发展及原理分析 |
2.1.2 垂直搜索引擎 |
2.2 通用网络爬虫技术 |
2.2.1 网络爬虫工作原理 |
2.2.2 爬虫爬行策略 |
2.3 垂直元搜索采集技术 |
2.3.1 元搜索引擎 |
2.3.2 元搜索工作流程 |
2.4 网页去噪技术 |
2.4.1 编写网页的常用语言 |
2.4.2 HTML/XML文件树型逻辑结构 |
2.4.3 数据路径描述方法 |
2.5 网页排重技术 |
2.5.1 网页重复特点分析 |
2.5.2 网页文本特征的提取方式 |
2.5.3 网页去重的方法研究 |
2.6 文本形式化表示与特征选取技术 |
2.6.1 特征降维方法 |
2.6.2 权重计算方法 |
2.7 本章小结 |
第三章 舆情分析 |
3.1 信息检索模型 |
3.2 信息检索算法 |
3.2.1 基于内容的检索算法 |
3.2.2 基于超链分析的检索算法 |
3.2.3 k-means聚类算法的改进 |
3.3 话题追踪方法 |
3.3.1 Rocchio方法 |
3.3.2 朴素贝叶斯 |
3.3.3 最近邻算法 |
3.3.4 支持向量机(SVM) |
3.4 情感挖掘方法 |
3.4.1 情感倾向性计算 |
3.4.2 情感挖掘流程 |
3.5 本章小结 |
第四章 网络舆情信息系统应用 |
4.1 系统整体设计 |
4.1.1 系统体系结构设计 |
4.1.2 系统功能设计 |
4.1.3 系统功能用例分析 |
4.1.4 子系统功能用例分析 |
4.1.5 系统数据库设计 |
4.1.6 系统模块划分 |
4.1.7 系统部署图 |
4.2 舆情采集模块 |
4.3 网页预处理模块 |
4.3.1 网页去噪模块 |
4.3.2 网页排重模块 |
4.3.3 特征抽取模块 |
4.4 话题追踪模块 |
4.5 舆情分析模块 |
4.6 本章小结 |
第五章 系统测试结果分析 |
5.1 系统测试结果 |
5.2 本章小结 |
第六章 总结和展望 |
参考文献 |
(9)基于机器学习的暗网威胁情报分析(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 研究背景 |
1.2 研究目的和意义 |
1.3 国内外研究现状 |
1.4 本文工作重点 |
1.5 论文组织结构 |
第2章 相关技术与理论 |
2.1 暗网相关概念 |
2.2 匿名通信网络 |
2.2.1 匿名通信原理 |
2.2.2 匿名通信网络的基本工作流程 |
2.2.3 匿名通信隐藏服务协议 |
2.3 文本分类相关理论 |
2.4 流行性分类算法 |
2.4.1 朴素贝叶斯算法 |
2.4.2 决策树算法 |
2.5 本章小结 |
第3章 暗网市场分析模型设计 |
3.1 市场分析内容 |
3.1.1 非法和犯罪内容 |
3.1.2 暗网市场 |
3.2 暗网市场模型设计 |
3.2.1 数据源识别 |
3.2.2 数据收集 |
3.2.3 资产分析 |
3.3 暗网市场分析模型功能 |
3.3.0 模型描述及概述 |
3.3.1 搜索功能 |
3.3.2 分类浏览功能 |
3.4 本章小结 |
第4章 暗网域名数据聚合系统设计 |
4.1 暗网目录聚合收集 |
4.2 Tor2web域名聚合收集 |
4.3 社交网站匿名聚合收集 |
4.4 暗网域名聚合性能测试 |
4.4.1 三种搜索引擎聚合测试过程 |
4.4.2 三种搜索引擎聚合测试结果 |
4.5 本章小结 |
第5章 基于关联规则的KNN分类算法改进 |
5.1 暗网数据集抽取 |
5.1.1 基于Scrapy数据集抽取原理 |
5.1.2 基于Scrapy数据集抽取实现 |
5.2 KNN算法基本原理 |
5.3 基于关联规则的KNN改进算法 |
5.3.1 评价指标 |
5.3.2 改进后的Apriori算法 |
5.4 本章小结 |
第6章 实验性能分析与结果 |
6.1 实验环境配置 |
6.2 Tor域名来源分析 |
6.3 页面内容爬取结果 |
6.4 隐藏服务内容分类结果 |
6.5 本章小结 |
第7章 总结与展望 |
7.1 全文总结 |
7.2 未来展望 |
参考文献 |
致谢 |
在学期间的主要科研成果 |
一、发表学术论文 |
二、获奖情况 |
(10)面向网络空间安全的搜索引擎研究与实现(论文提纲范文)
摘要 |
ABSTRACT |
符号对照表 |
缩略语对照表 |
第一章 绪论 |
1.1 研究背景与意义 |
1.2 研究现状 |
1.2.1 国外研究现状 |
1.2.2 国内研究现状 |
1.3 主要研究内容 |
1.4 论文结构安排 |
1.5 本章小结 |
第二章 相关理论与技术研究 |
2.1 网络空间安全 |
2.1.1 网络空间 |
2.1.2 网络空间安全 |
2.2 网络扫描技术综述 |
2.2.1 端口扫描技术 |
2.2.2 操作系统和其版本号识别技术 |
2.2.3 服务和其版本号识别技术 |
2.2.4 常用网络扫描工具 |
2.3 搜索引擎概述 |
2.3.1 搜索引擎工作原理 |
2.3.2 搜索引擎组成部分 |
2.4 开源搜索引擎Elastic Search |
2.4.1 Elastic Search简介 |
2.4.2 Elastic Search的工作原理 |
2.5 Mongo DB |
2.6 Django |
2.7 本章小结 |
第三章 系统需求分析及设计 |
3.1 系统需求概述 |
3.1.1 系统概述 |
3.1.2 系统功能性需求分析 |
3.1.3 系统非功能性需求分析 |
3.2 系统总体架构 |
3.3 系统模块划分 |
3.3.1 UI模块 |
3.3.2 Web服务器模块 |
3.3.3 数据通信模块 |
3.3.4 扫描与识别模块 |
3.3.5 数据存储模块 |
3.3.6 搜索引擎模块 |
3.4 本章小结 |
第四章 面向网络空间安全的搜索引擎的系统详细设计 |
4.1 扫描与识别模块详细设计 |
4.1.1 面向网络设备IP的扫描与识别模块 |
4.1.2 面向网络设备端口的扫描与识别模块 |
4.2 数据存储模块详细设计 |
4.3 Web服务器模块详细设计 |
4.4 数据通信模块详细设计 |
4.5 搜索引擎模块详细设计 |
4.6 UI模块详细设计 |
4.6.1 用户搜索页面 |
4.6.2 查看资源统计页面 |
4.7 本章小结 |
第五章 系统实现与测试 |
5.1 系统开发环境 |
5.2 扫描与识别模块实现 |
5.2.1 面向网络设备IP的扫描与识别模块实现 |
5.2.2 面向网络设备端口的扫描与识别模块实现 |
5.3 数据存储模块实现 |
5.4 数据通信模块实现 |
5.5 搜索引擎模块实现 |
5.6 Web服务器模块实现 |
5.7 系统功能测试 |
5.8 系统性能测试 |
5.8.1 稳定性测试 |
5.8.2 准确性测试 |
5.8.3 扫描的速度对比 |
5.8.4 实时性测试 |
5.9 本章小结 |
第六章 总结与展望 |
6.1 全文总结 |
6.2 问题与展望 |
参考文献 |
致谢 |
作者简介 |
四、Web搜索引擎技术及应用(论文参考文献)
- [1]面向博客的分布式垂直搜索引擎的设计与实现[D]. 林茹. 北京邮电大学, 2021(01)
- [2]基于微服务架构与知识图谱技术构建无人机知识库系统[D]. 陈秋瑾. 厦门理工学院, 2021(08)
- [3]Web挖掘及其在网络搜索引擎中的应用[J]. 张琳,于欣越. 信息技术与信息化, 2021(04)
- [4]网络文件下载信息搜索及追踪系统[D]. 张擎天. 电子科技大学, 2021(01)
- [5]基于元搜索引擎的排序算法研究[D]. 叶云波. 天津理工大学, 2021(08)
- [6]电子病历搜索引擎中的新词发现和排序技术研究[D]. 吴进发. 电子科技大学, 2021(01)
- [7]基于整子多智能体的社会化搜索引擎模型及关键技术[D]. 王梅嘉. 西安电子科技大学, 2020(02)
- [8]网络媒体舆情检测与分析系统设计与实现[D]. 李春婕. 内蒙古大学, 2020(04)
- [9]基于机器学习的暗网威胁情报分析[D]. 于焕焕. 齐鲁工业大学, 2020(02)
- [10]面向网络空间安全的搜索引擎研究与实现[D]. 澹台栋良. 西安电子科技大学, 2020(05)
标签:搜索引擎论文; 搜索引擎基本工作原理论文; 排序算法论文; 推荐算法论文; 搜索引擎原理论文;