知识

加载分类中...

    在了解了lucene的工作原理和流程后,就可以更进一步对原有代码进行改进了。在原有项目中使用的是默认的StandardAnalyzer,只能将文本分割成单个词,对于中文并不是很友好,所以本次将替换使用自定义分词器。 1.使用JieBa分词 根据Lucene的源码,只需要继承基类Analyzer即可实现自定义的分词器。此外在原有的Sear...

    Lucene.NET 搜索引擎
    潘帅     2021-10-01 09:25     來源: 人防后端     0 281 0

    对于关键词索引的创建和检索已经基本实现,但如果想要再继续深入就有必要理解Lucene.NET的工作原理和工作流程。 1.工作原理 当我们想从大量的信息查询某个特定的信息时,不仅需要知道这个特定信息是否存在,而且需要知道这个特定信息在什么位置。这种情况下遍历所有信息去查找这个特定的信息并不是一个明智选择,查找的成本会极其巨大。建立索引则是...

    Lucene.NET 搜索引擎
    潘帅     2021-09-30 17:37     來源: 人防后端     0 280 0

    经过上一篇的改造,可以作为公共方法使用了,但是通用性和抽象性还不够,所以继续从通用性着手来扩展方法。 1.泛型扩展 对前面的代码进行分析发现,多个方法都涉及到分析器Analyzer、存储目录Directory、索引操作器配置IndexWriterConfig的实例化,那么就考虑将这些对象作为属性抽离出来。 1.1.公共属性提取 /// ...

    Lucene.NET 搜索引擎
    潘帅     2021-09-30 08:57     來源: 人防后端     1 301 0

    经过上次的改造,可以实现对实体对象中的特定成员创建索引,但从实际的应用上来看,需要检索的数据内容格式多种多样,可能会有HTML、XML等。另外一些自定义的数据结构可能是以JSON等特殊规则形式存储的,对于这些情况就需要单独对数据进行分割处理。 1.索引基本概念回顾 1.1.索引文件结构 索引文件的结构是: -- 索引(Index)   ...

    Lucene.NET 搜索引擎
    潘帅     2021-09-30 08:52     來源: 人防后端     0 293 0

    目前的查询方法过于简单,而且无法与实际业务中的实体建立关系,因此本篇文章就来描述对查询方法的扩展。 1.查询多个字段的检索方法 1.1.定义接口及输入输出项 查询输入项SingleSearchOption: public class SingleSearchOption:SearchOptionBase { /// <summar...

    Lucene.NET 搜索引擎
    潘帅     2021-09-29 17:24     來源: 人防后端     0 317 0

    上一篇中实现的示例作为一个简单演示还行,但是作为通用方法使用就差的远了。本篇会对Lucene的基本操作进行完善,同时对公共方法进行提取,使其更适合在.NET Core项目中使用。 1.基本方法完善 1.1.删除索引 #region 删除所有索引 /// <summary> /// 删除所有索引 /// </summar...

    Lucene.NET 搜索引擎
    潘帅     2021-09-27 12:21     來源: 人防后端     0 269 0

    近期使用了ELK系列组件,不由的感慨其功能的丰富和强大,伴随而来的就是另一个想法“ELK太重,用在简单的小型项目上有些鸡肋,能不能做一个轻量版的搜索引擎用于微小型项目呢?”。 下面将会有一系列的文章来描述整个过程,每篇不会太长,但每篇相比前篇都会有所改进。 1.Lucene.Net简介 做搜索引擎必然绕不开Lucene。Lucene是A...

    搜索引擎 Lucene.NET
    潘帅     2021-09-27 09:09     來源: 人防后端     0 321 0

    近期进行项目总结对项目过程资料进行分析,其中包括对多份会议纪要的内容进行分析,使用ELK并结合中文分词器IK进行关键字的提取和统计分析。 1.Elasticsearch安装IK中文分词器 进入Elasticsearch目录输入命令行安装IK分词器 .\elasticsearch-plugin install https://github...

    ELK Kibana IK分词 中文分词 词云
    潘帅     2021-09-16 23:15     來源: 人防后端     1 300 0

    1.下载ShareX并安装 2.安装完成后运行 2.1 可以修改自己熟悉的快捷键 2.2设置截图后的动作,可以勾选以下几个选项,最下面的上传文件一定要关闭 2.3按住快捷键进行gif截图,截图完成后 点击stop即可 2.4可以在软件或者文件夹查看刚截好的截图信息 3.在测试中,遇到需要录屏描述的问题可以通过快捷键录制GIF,并可以直接...

    测试工具 功能测试
    张志文     2021-09-15 12:07     來源: 测试组     1 399 0

    iOS 中几种常用的锁总结 iOS锁介绍 多线程编程中,应该尽量避免资源在线程之间共享,以减少线程间的相互作用。 但是总是有多个线程相互干扰的情况(如多个线程访问一个资源)。在线程必须交互的情况下,就需要一些同步工具,来确保当它们交互的时候是安全的。 锁是线程编程同步工具的基础。iOS开发中常用的锁有如下几种: 1、@synchroni...

    线程 dispatch 使用 一个 semaphore 访问 加锁 互斥 pthread nslock
    朱凡     2021-08-28 21:23     來源: FM_App     0 253 0
    知识分享平台 -V 4.8.7 -wcp