期刊文献+
共找到27篇文章
< 1 2 >
每页显示 20 50 100
面向云环境的多关键词密文排序检索研究综述 预览
1
作者 戴华 李啸 +2 位作者 朱向洋 杨庚 易训 《计算机科学》 CSCD 北大核心 2019年第1期6-12,共7页
随着云计算的广泛应用,面向数据或计算的外包服务模式越来越被业界所接受。为了保护数据拥有者外包数据的私密性,具备隐私保护能力的高效密文排序检索技术逐渐成为目前备受关注的一个研究热点。文中以面向云环境的多关键词:密文排序检... 随着云计算的广泛应用,面向数据或计算的外包服务模式越来越被业界所接受。为了保护数据拥有者外包数据的私密性,具备隐私保护能力的高效密文排序检索技术逐渐成为目前备受关注的一个研究热点。文中以面向云环境的多关键词:密文排序检索技术为关注重点,介绍了现有研究工作的系统模型和威胁模型,并描述了模型中关于隐私保护、检索效率与准确率、检索结果完整性等的问题;全面分析了现有工作中典型的多关键词:密文排序检索方法及相关扩展研究,讨论并梳理了这些方法的核心思想;最后,对现有研究工作进行了总结,并给出了该研究领域中待解决的关键性问题和未来的研究方向。 展开更多
关键词 云外包 数据隐私 多关键词检索 密文检索 排序检索
在线阅读 免费下载
基于聚类索引的多关键字排序密文检索方案 预览
2
作者 杜瑞忠 李明月 田俊峰 《计算机研究与发展》 EI CSCD 北大核心 2019年第3期555-565,共11页
了提高密文检索的效率和精度,提出基于聚类索引的多关键字排序密文检索方案.首先利用改进的Chameleon算法对文件向量聚类,聚类过程中通过记录关键字位置对文件向量进行降维处理.其次,提出适合聚类索引的检索算法,使得在查询过程中可以... 了提高密文检索的效率和精度,提出基于聚类索引的多关键字排序密文检索方案.首先利用改进的Chameleon算法对文件向量聚类,聚类过程中通过记录关键字位置对文件向量进行降维处理.其次,提出适合聚类索引的检索算法,使得在查询过程中可以排除大量与查询向量无关的文件向量,减少了不必要的计算消耗.再次,在聚类过程中引入杰卡德相似系数来计算文件向量之间的相似度以及设定合适的阈值提高聚类质量.在真实数据集上进行了实验,理论分析和实验结果表明:在保障数据隐私安全的前提下,该方案较传统的密文检索方案有效地提高了密文检索的效率与精度. 展开更多
关键词 云安全 密文检索 排序检索 聚类索引 CHAMELEON算法
在线阅读 下载PDF
基于Simhash的安全密文排序检索方案 预览
3
作者 李珍 姚寒冰 穆逸诚 《计算机应用》 CSCD 北大核心 2019年第9期2623-2628,共6页
针对密文检索中存在的计算量大、检索效率不高的问题,提出一种基于Simhash的安全密文排序检索方案。该方案基于Simhash的降维思想构建安全多关键词密文排序检索索引(SMRI),将文档处理成指纹和向量,利用分段指纹和加密向量构建B+树,并采... 针对密文检索中存在的计算量大、检索效率不高的问题,提出一种基于Simhash的安全密文排序检索方案。该方案基于Simhash的降维思想构建安全多关键词密文排序检索索引(SMRI),将文档处理成指纹和向量,利用分段指纹和加密向量构建B+树,并采用“过滤精化”策略进行检索和排序,首先通过分段指纹的匹配进行快速检索,得到候选结果集;然后通过计算候选结果集与查询陷门的汉明距离和向量内积进行排序,带密钥的Simhash算法和安全k近邻(S k NN)算法保证了检索过程的安全性。实验结果表明,与基于向量空间模型(VSM)的方案相比,基于SMRI的排序检索方案计算量小,能节约时间和空间成本,检索效率高,适用于海量加密数据的快速安全检索。 展开更多
关键词 密文检索 排序检索 Simhash 隐私保护 安全k近邻
在线阅读 下载PDF
加密云数据上支持可验证的关键词排序搜索方案 预览
4
作者 葛新瑞 崔巍 +1 位作者 郝蓉 于佳 《信息网络安全》 CSCD 北大核心 2019年第7期82-89,共8页
随着云计算的日益普及,越来越多的用户通过云来存储数据,从而降低本地数据存储和管理的成本。为了保护隐私性,敏感数据在上传到云之前需要进行加密处理,这势必降低数据的利用率,使得数据搜索变得困难。执行搜索操作时,还要根据查询关键... 随着云计算的日益普及,越来越多的用户通过云来存储数据,从而降低本地数据存储和管理的成本。为了保护隐私性,敏感数据在上传到云之前需要进行加密处理,这势必降低数据的利用率,使得数据搜索变得困难。执行搜索操作时,还要根据查询关键词与文件之间的相关度,返回相关度较高的文件。此外,为了防止云服务器返回错误的搜索结果,需要支持对搜索结果的可验证。针对以上问题,文章提出一种支持可验证的关键词排序搜索方案。该方案基于向量空间模型和TF×IDF模型构造索引向量和查询向量。采用基于树的索引结构,利用深度优先搜索算法和剪枝策略实现关键词排序搜索。文章设计了基于MAC的可验证机制来验证返回文件的正确性。安全性分析和性能分析表明提出的方案是安全高效的。 展开更多
关键词 云计算 可验证 排序搜索
在线阅读 下载PDF
支持动态更新的多关键词密文排序检索 预览 被引量:1
5
作者 严小龙 庞晓琼 任孟琦 《计算机工程与设计》 北大核心 2018年第4期901-906,共6页
针对云存储中加密数据的检索和安全问题,研究现有基于密文的对称可搜索加密方案,提出一种安全且高效的多关键词密文排序检索方案,同时支持动态更新和并行检索。利用向量空间模型实现多关键词排序检索,采用平衡二叉树作为索引结构,支持... 针对云存储中加密数据的检索和安全问题,研究现有基于密文的对称可搜索加密方案,提出一种安全且高效的多关键词密文排序检索方案,同时支持动态更新和并行检索。利用向量空间模型实现多关键词排序检索,采用平衡二叉树作为索引结构,支持数据的动态更新和检索的并行执行。为保护数据的隐私性,利用安全=近邻(securek-nearestneighbor,secure KNN)算法加密索引和查询向量。安全性和效率分析结果表明,与同样实现前向安全和后向安全的方案相比,该方法具有更高的检索效率。 展开更多
关键词 对称可搜索加密 多关键词检索 排序检索 动态更新 并行检索
在线阅读 下载PDF
一种基于相似搜索平衡二叉树的多关键词排序密文检索方案
6
作者 陈兰香 陈振朝 《密码学报》 CSCD 2018年第3期271-285,共15页
云存储使用户可以将其敏感数据外包存储到云服务器上,从而方便数据管理.然而数据存储在第三方服务器后,用户对其不再完全可控,从而对其数据隐私的保护则显得极其重要.所以,用户通常会先对其数据进行加密处理,再存储到云服务器上,从而保... 云存储使用户可以将其敏感数据外包存储到云服务器上,从而方便数据管理.然而数据存储在第三方服务器后,用户对其不再完全可控,从而对其数据隐私的保护则显得极其重要.所以,用户通常会先对其数据进行加密处理,再存储到云服务器上,从而保证数据的私密性.但是数据加密后,用户需要查询相关文件时,对密文数据的检索就是一个迫切需要解决的问题.因此,本文提出一个密文云存储环境下的基于相似搜索平衡二叉树的支持排序的多关键词检索方案(similar multi-keyword ranked searchable scheme,SMRSS).其核心思想是在构建索引时,对文档集中的每一个文档进行预处理,将每个文档相似度最高的Top-k个文档进行汇集处理,构造出对应的相似搜索平衡二叉树,从而在进行搜索时可以以最快的速度获取Top-k个相似度最高的文档.同时,本文方案利用向量空间模型、TF-IDF加权统计方法来构建索引,并利用欧式距离来确定相似文档以提高对平衡二叉树的搜索效率.由于本文方案的索引结构是基于平衡二叉树,所以可以实现亚线性的搜索时间复杂度.从理论分析及实验结果可以得知,与EDMRS方案相比,SMRSS方案在保证检索准确度和安全性的前提下,极大地提高了检索效率. 展开更多
关键词 云存储 密文检索 可搜索加密 平衡二叉树 排序检索
支持结果排序的安全密文检索方法研究 预览
7
作者 姚寒冰 邢娜娜 +1 位作者 周俊伟 李勇华 《计算机科学》 CSCD 北大核心 2018年第5期123-130,共8页
越来越多的企业和个人用户将数据部署到低成本、高质量的云存储中。为了保护敏感数据,用户在部署前会对其进行加密处理,但海量的加密数据给检索工作带来很大挑战。文中将传统的倒排索引结构改造成密文倒排索引,并在密文倒排索引上构建... 越来越多的企业和个人用户将数据部署到低成本、高质量的云存储中。为了保护敏感数据,用户在部署前会对其进行加密处理,但海量的加密数据给检索工作带来很大挑战。文中将传统的倒排索引结构改造成密文倒排索引,并在密文倒排索引上构建计数布隆过滤器,进而提出了基于计数布隆过滤器的密文安全索引(SICBF),其在保证隐私安全的前提下实现了对密文的快速检索。为减少SICBF索引中的数据冗余,设计了计数布隆过滤器的剪枝算法。为保护密文倒排索引中相关分的隐私安全,采用一对多保序加密机制(OPME)对相关分进行加密,并在密文相关分上对检索结果直接进行排序,将最相关检索结果top-k返回给授权用户。安全分析表明,不同于原始数据分布,OPME算法加密后的相关分分布隐藏了数据的峰值,能防止针对相关分的统计攻击。实验结果表明,SICBF的检索效率高,计算量小,适用于海量加密数据文件的快速安全检索。 展开更多
关键词 倒排索引 相关分 计数布隆过滤器 数据隐私 排序搜索
在线阅读 免费下载
云存储中一种动态模糊多关键字检索方案 预览
8
作者 刘正皓 董晓梅 +1 位作者 冯健飞 张昊岩 《计算机工程与应用》 CSCD 北大核心 2017年第10期68-72,123共6页
随着云计算技术的迅速发展,云存储的数据安全和隐私保护问题受到了人们密切关注。为了保护用户的隐私数据,云端一般是以密文形式存储文件,给检索带来了不便。为了解决云环境中使用关键字查找密文文件的问题,有必要构建支持隐私保护... 随着云计算技术的迅速发展,云存储的数据安全和隐私保护问题受到了人们密切关注。为了保护用户的隐私数据,云端一般是以密文形式存储文件,给检索带来了不便。为了解决云环境中使用关键字查找密文文件的问题,有必要构建支持隐私保护的安全云存储系统。基于MRSE方案并引入了TF-IDF规则,给出了云环境下动态模糊多关键字排行搜索方案。并将第三方审计机制加入到系统当中,进行文件可持有性验证和密钥管理。 展开更多
关键词 云存储 隐私 安全 排行搜索 第三方审计
在线阅读 下载PDF
Secure Multi-keyword Search Supporting Dynamic Update and Ranked Retrieval 预览
9
作者 Jingbo Yan Yuqing Zhang Xuefeng Liu 《中国通信:英文版》 SCIE CSCD 2016年第10期209-221,共13页
As cloud computing is becoming prevalent, data owners are motivated to delegate complex data managements to the commercial cloud for economic savings. Sensitive data is usually encrypted before being uploaded to the c... As cloud computing is becoming prevalent, data owners are motivated to delegate complex data managements to the commercial cloud for economic savings. Sensitive data is usually encrypted before being uploaded to the cloud, which unfortunately makes the frequently-used search function a challenging problem. In this paper, we present a new multi-keyword dynamic search scheme with result ranking to make search over encrypted data more secure and practical. In the scheme, we employ a powerful function-hiding inner product encryption to enhance the security by preventing the leakage of search pattern. For the concern of efficiency, we adopt a tree-based index structure to facilitate the searching process and updating operations. A comprehensive security analysis is provided and experiments over the real world data show that our scheme is efficient. 展开更多
在线阅读 下载PDF
云上多数据所有者的安全密文搜索技术 预览
10
作者 张珍珍 孙洪祥 张华 《软件》 2015年第1期135-140,共6页
随着网络储存服务的发展,越来越多的企业和个人选择把本地复杂的数据管理事物外包给第三方服务器。这种情况下,为了保护信息的隐私性,企业和个人会在外包之前先对数据进行加密。研究怎样利用已经趋于成熟的明文检索技术,设计适用于密文... 随着网络储存服务的发展,越来越多的企业和个人选择把本地复杂的数据管理事物外包给第三方服务器。这种情况下,为了保护信息的隐私性,企业和个人会在外包之前先对数据进行加密。研究怎样利用已经趋于成熟的明文检索技术,设计适用于密文的检索技术,是现在可搜索加密技术研究的热点。本文采用"坐标匹配"的方法度量搜索请求和数据文件相关关系,利用安全内积计算技术,定义和解决了云上多数据所有者多、关键词的安全排序搜索问题。并且,通过仿真实验,分析了不同参数变化对效率的影响。 展开更多
关键词 云计算 多数据拥有者 可搜索加密 隐私安全 多关键词搜索 排序搜索
在线阅读 下载PDF
支持语义扩展的动态多关键词密文排序检索 预览
11
作者 庞晓琼 严小龙 +2 位作者 陈文俊 余本国 聂梦飞 《计算机应用》 CSCD 北大核心 2019年第4期1059-1065,共7页
针对云存储环境下已有的动态多关键词密文排序检索方案不支持关键词语义扩展、不具备前向安全和后向安全的问题,提出一种支持语义检索且具备前向安全和后向安全的动态多关键词密文排序检索方案。该方案通过构建语义关系图实现查询关键... 针对云存储环境下已有的动态多关键词密文排序检索方案不支持关键词语义扩展、不具备前向安全和后向安全的问题,提出一种支持语义检索且具备前向安全和后向安全的动态多关键词密文排序检索方案。该方案通过构建语义关系图实现查询关键词的语义扩展;使用树索引结构实现数据的检索和动态更新;利用向量空间模型实现多关键词排序搜索;基于安全K近邻算法对维度扩展后的索引和查询向量进行加密。安全性分析表明,该方案在已知密文模型下是安全的且具有动态更新时的前向安全和后向安全。效率分析及仿真实验结果表明,该方案在服务器检索效率方面优于目前同类型具有相同安全性或相同功能的方案。 展开更多
关键词 对称可搜索加密 多关键词排序检索 动态更新 语义扩展
在线阅读 下载PDF
基于相似查询树的快速密文检索方法 预览 被引量:5
12
作者 田雪 朱晓杰 +2 位作者 申培松 陈驰 邹洪 《软件学报》 EI CSCD 北大核心 2016年第6期1566-1576,共11页
随着云计算的广泛应用,数据中心的数据量急速增加;同时,用户文档通常包含隐私敏感信息,需要先加密然后上传到云服务器.面对如此大量的密文数据,现有技术在大数据量的密文数据上的检索效率很低.针对这一问题,提出在大数据下的基于相似查... 随着云计算的广泛应用,数据中心的数据量急速增加;同时,用户文档通常包含隐私敏感信息,需要先加密然后上传到云服务器.面对如此大量的密文数据,现有技术在大数据量的密文数据上的检索效率很低.针对这一问题,提出在大数据下的基于相似查询树的密文检索方法(MRSE-SS).该方法通过设置聚类中心和成员之间的最大距离对文档向量进行聚类,并把中心向量看成n维超球体的球心,最大距离作为半径,再逐步将小聚类聚合成大聚类.使用该方法构建的密文文档集合,在查询阶段,仅需检索查询向量相邻的聚类即可获得理想的查询结果集合,从而提高了密文检索的效率.以《软件学报》最近10年的论文作为样本进行了实验,数据集中选取2 900篇文档和4 800个关键词.实验结果显示:当文档集个数呈指数增长时,检索时间仅呈线性增长,并且检索结果的关联性比传统检索方法更强. 展开更多
关键词 云计算 密文检索 多关键字排序检索 相似查询树 云安全
在线阅读 下载PDF
支持多关键字分级的可搜索同态加密方案 预览 被引量:2
13
作者 李宏霞 庞晓琼 《计算机工程与应用》 CSCD 北大核心 2016年第22期93-98,共6页
为满足加密文件的多关键字检索需求并解决云存储下用户的隐私与数据安全的问题,提出改进的分级的多关键字可搜索加密方案。该方案保障数据与查询机密性的同时,利用向量空间模型构建可搜索索引,使用同态加密算法进行加解密,支持查询... 为满足加密文件的多关键字检索需求并解决云存储下用户的隐私与数据安全的问题,提出改进的分级的多关键字可搜索加密方案。该方案保障数据与查询机密性的同时,利用向量空间模型构建可搜索索引,使用同态加密算法进行加解密,支持查询结果的分级检索,有效避免了服务器端返回相关度不大的文件。进一步的安全分析和性能评估表明,该方案在安全性上满足CCA2安全,降低了通信开销,也消除了不必要的流量开销。 展开更多
关键词 多关键字分级检索 同态加密 向量空间模型 云计算
在线阅读 下载PDF
基于贝叶斯信念网络的多案例库检索方法 预览 被引量:1
14
作者 李明 刘鲁 +1 位作者 苗蕊 朱延秋 《北京工业大学学报》 CAS CSCD 北大核心 2012年第1期 81-85,共5页
为了克服在基于案例推理中单一案例库检索的局限性,提出了基于贝叶斯信念网络的多案例库检索方法.该方法仅要求用户采用关键词对目标案例进行描述,通过贝叶斯信念网络计算关键词与各案例库的特征属性的匹配概率,以获得适应各案例库的完... 为了克服在基于案例推理中单一案例库检索的局限性,提出了基于贝叶斯信念网络的多案例库检索方法.该方法仅要求用户采用关键词对目标案例进行描述,通过贝叶斯信念网络计算关键词与各案例库的特征属性的匹配概率,以获得适应各案例库的完整的目标案例描述,然后对相应的案例库进行案例检索;将从多案例库中检索到的案例通过相似度线性归一处理后,结合目标案例描述的匹配概率获得与目标案例的最终相似度,统一排序后返回检索结果.最后通过航空企业的实际应用与性能分析进一步验证了多案例库检索方法的有效性. 展开更多
关键词 贝叶斯信念网络 基于案例推理 知识管理
在线阅读 下载PDF
企业网站SEO技术研究 预览 被引量:21
15
作者 李福良 张辉 《合肥工业大学学报:自然科学版》 CAS CSCD 2004年第1期 92-96,共5页
SEO全称是search engine optimization,是针对用特定关键词在搜索引擎中搜索的情况,为了提升网站在搜索引擎中的排名而对网站进行的优化设计.SEO是提高网站访问流量的一个很好的方法.因为具有高质量的搜索结果,Google已成为许多人最喜... SEO全称是search engine optimization,是针对用特定关键词在搜索引擎中搜索的情况,为了提升网站在搜索引擎中的排名而对网站进行的优化设计.SEO是提高网站访问流量的一个很好的方法.因为具有高质量的搜索结果,Google已成为许多人最喜爱的搜索引擎.文章在详细分析Google的排名算法的基础上,对企业网站HYP针对Google进行了优化.在优化过程中,为了充分发挥网站的PageRank潜能并引导网站的PR值流向重要的网页,对HYP的内部链接结构进行了精心组织,经优化设计后,当人们用关键词'butterfly valve'在google中进行搜索时,HYP排名在前20名以内. 展开更多
关键词 企业网站 SEO 搜索引擎 网页级别 链接 网站建设 GOOGLE 因特网
在线阅读 免费下载
无监督的中文商品属性结构化方法 预览 被引量:3
16
作者 侯博议 陈群 +1 位作者 杨婧颖 李战怀 《软件学报》 EI CSCD 北大核心 2017年第2期262-277,共16页
从非结构化商品描述文本中抽取结构化属性信息,对于电子商务实现商品的对比与推荐及用户需求预测等功能具有重要意义.现有结构化方法大多采用监督或半监督的分类方法抽取属性值与属性名,通过文法分析器分析属性值与属性名之间的文法依... 从非结构化商品描述文本中抽取结构化属性信息,对于电子商务实现商品的对比与推荐及用户需求预测等功能具有重要意义.现有结构化方法大多采用监督或半监督的分类方法抽取属性值与属性名,通过文法分析器分析属性值与属性名之间的文法依存关系,并根据关联规则实现属性值与属性名的匹配.这些方法存在以下不足:(1)需要人工标记部分属性值、属性名及它们之间的对应关系;(2)属性值-属性名匹配的准确度受到语言习惯、句意逻辑、语料库及属性名候选集质量的严重制约.提出了一种无监督的中文商品属性结构化方法.该方法借助搜索引擎,基于小概率事件原理分析文法关系来抽取属性值与属性名.同时,提出相对不选取条件概率场,并使用Page Rank算法来计算属性值与属性名的配对概率.该方法无需人工标记的开销,且无论商品描述中是否显式地包含相应的属性名,该方法都能自动抽取到属性值并匹配相应的属性名.使用百度搜索引擎上的真实语料,针对4类商品的中文描述进行了实验.实验结果验证了对于候选属性名的自动生成,所提出的基于搜索引擎搜索属性值,并在包含属性值的搜索结果中抽取一般名词的候选属性名生成方法与只在描述句中抽取一般名词的候选属性名生成方法相比,查全率提高了20%以上;对于非量化类属性,所提出的基于相对不选取条件概率场的属性值-属性名匹配方法与基于依存关联的方法相比,Rank-1的准确率提高了30%以上,平均MRR提高了0.3以上. 展开更多
关键词 结构化 相对不选取条件概率场 PAGE RANK 基于概率的文法分析 搜索引擎
在线阅读 下载PDF
按需印刷平台中的相似搜索研究 预览
17
作者 张明西 张雷洪 +1 位作者 吕巍 孙刘杰 《包装工程》 CAS CSCD 北大核心 2015年第23期135-139,共5页
目的研究按需印刷平台中的相似搜索效率问题。方法利用用户与产品之间的"购买"关系构建"用户-产品"关系,基于P-Rank提出一种高效的相似搜索方法 POD-Rank,用于从"用户-产品"关系中发现相似产品。POD-Rank相似搜索过程依据"用户-... 目的研究按需印刷平台中的相似搜索效率问题。方法利用用户与产品之间的"购买"关系构建"用户-产品"关系,基于P-Rank提出一种高效的相似搜索方法 POD-Rank,用于从"用户-产品"关系中发现相似产品。POD-Rank相似搜索过程依据"用户-产品"关系离线计算用户相似性,并利用用户相似性在线计算产品相似性,而后进一步提出优化的在线查询处理算法,以降低查询处理的时间开销。结果 POD-Rank的计算时间开销和存储开销显著低于P-Rank,而且能够快速响应查询请求。结论POD-Rank的相似性计算开销为P-Rank的0.03%,存储开销为P-Rank的0.06%,计算效果与P-Rank接近,能够满足按需印刷平台中大规模产品数据处理的需求。 展开更多
关键词 按需印刷 P-RANK 相似搜索 “用户-产品”关系图
在线阅读 下载PDF
一种有效的等帧长帧同步盲识别方法 预览 被引量:3
18
作者 陆凯 张旻 李歆昊 《火力与指挥控制》 CSCD 北大核心 2015年第9期68-71,76共5页
提出一种基于分层的矩阵秩特征的判别方法,解决了等帧长帧同步的盲识别问题。首先构造等帧长帧识别的分层模型,然后在各子层中利用小区域矩阵秩值等于1的特征寻找可能的帧长值,统计各可能帧长值出现的概率判断真实帧长值,最后将序列按... 提出一种基于分层的矩阵秩特征的判别方法,解决了等帧长帧同步的盲识别问题。首先构造等帧长帧识别的分层模型,然后在各子层中利用小区域矩阵秩值等于1的特征寻找可能的帧长值,统计各可能帧长值出现的概率判断真实帧长值,最后将序列按照所求帧长的方式构造矩阵,判定满足特定秩值搜索窗的位置和移动搜索窗的距离获取同步信息,达到帧同步盲识别目的。理论分析了搜索窗宽度对识别算法的影响,并推导了算法容错性,得出了算法具有很好的鲁棒性,能够满足非合作的盲识别的要求。仿真结果验证了算法的有效性,表明算法具有一定的工程应用价值。 展开更多
关键词 帧同步 分层模型 矩阵秩 搜索窗
在线阅读 下载PDF
面向微博搜索的时间敏感的排序学习方法 预览 被引量:2
19
作者 王书鑫 卫冰洁 +1 位作者 鲁骁 王斌 《中文信息学报》 CSCD 北大核心 2015年第4期175-182,共8页
近年来微博检索已经成为信息检索领域的研究热点。相关的研究表明,微博检索具有时间敏感性。已有工作根据不同的时间敏感性假设,例如,时间越新文档越相关,或者时间越接近热点时刻文档越相关,得到多种不同的检索模型,都在一定程度上提高... 近年来微博检索已经成为信息检索领域的研究热点。相关的研究表明,微博检索具有时间敏感性。已有工作根据不同的时间敏感性假设,例如,时间越新文档越相关,或者时间越接近热点时刻文档越相关,得到多种不同的检索模型,都在一定程度上提高了检索效果。但是这些假设主要来自于观察,是一种直观简化的假设,仅能从某个方面反映时间因素影响微博排序的规律。该文验证了微博检索具有复杂的时间敏感特性,直观的简化假设并不能准确地描述这种特性。在此基础上提出了一个利用微博的时间特征和文本特征,通过机器学习的方式来构建一个针对时间敏感的微博检索的排序学习模型(TLTR)。在时间特征上,考察了查询相关的全局时间特征以及查询-文档对的局部时间特征。在TREC Microblog Track 2011 2012数据集上的实验结果表明,TLTR模型优于现有的其他时间敏感的微博排序方法。 展开更多
关键词 时间敏感 排序学习 微博搜索
在线阅读 下载PDF
基于Hooke&Jeeves模式搜索的排序学习方法 预览 被引量:2
20
作者 李金忠 杨威 +2 位作者 夏洁武 曾小荟 孙凌宇 《计算机工程》 CAS CSCD 北大核心 2015年第7期215-218,共4页
由于信息检索评价准则的不连续和不可导性,传统排序学习方法不能从训练数据中直接优化排序评价准则。针对该问题,将排序学习问题转化为线性组合优化问题,提出一种新的排序学习方法。该方法利用Hooke&Jeeves模式搜索,交替进行探测... 由于信息检索评价准则的不连续和不可导性,传统排序学习方法不能从训练数据中直接优化排序评价准则。针对该问题,将排序学习问题转化为线性组合优化问题,提出一种新的排序学习方法。该方法利用Hooke&Jeeves模式搜索,交替进行探测搜索和模式移动,从而加快排序学习的收敛速度。在10个排序学习数据集上的实验结果表明,与基于坐标上升法的排序学习方法相比,该方法的时间开销较低,排序效果较好。 展开更多
关键词 排序学习 排序模型 模式搜索 坐标上升法 信息检索
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部 意见反馈