首页 行业动态正文

「搜索引擎」怎样挑选企业搜索引擎

云返利网 行业动态 2020-08-21 05:15:05 7 0

在本博客系列的第一部份中,我们细致展现了智能企业搜刮的路程:出发点、要接见的地标和料想的目标地。这篇后续的博客文章是关于导航到我们之前定义的一个里程碑:挑选企业搜刮引擎。

人们很轻易以为搜刮引擎的挑选是一项手艺使命:哪一个引擎比其他引擎更好?然则,假如纯真斟酌搜刮引擎的功用,您大概会发明差异搜刮引擎之间的差异是微不足道的。当比较智能搜刮引擎增添的人工智能认知功用时,这类差异就更显著了。尽管如此,在我们的路程中照样有很多变量须要斟酌。

我将形貌为我们的客户在挑选他们的新搜刮引擎时事变优越的步骤。

挑选企业搜刮引擎

5步挑选企业搜刮引擎

步骤1:肯定潜伏的搜刮引擎

让我们先列出一切大概合适您须要的搜刮引擎。

列表的第一个泉源是您当前的供应商。您的构造中大概已有两个或更多的搜刮引擎在运转。任何由供应商或活泼的开源社区保护和支撑的当前布置的搜刮引擎都可以斟酌。假如你的搜刮引擎还没有升级到最新的稳固版本也没紧要。在这类状况下,将搜刮引擎的最新版本增加到您的列表中,以便您终究将最新版本与其他选项举行比较。

第二个泉源多是剖析师报告,比方Gartner的Insight引擎魔力象限报告或Forrester Wave™认知搜刮报告。一定要找最新的。这些资本为你的钻研供应了很好的概览信息。

假如您处置电子商务或其他特定范畴,那末除了针对您地点行业的特地功用外,您大概还愿望寻觅具有壮大嵌入式搜刮的目标应用程序的报告。在这类状况下,您大概寻觅的不是企业搜刮引擎,而是更侧重于用例的搜刮解决方案。本博客依然适用于挑选如许的搜刮平台。

行业剖析师平常依据某些前提建立他们的列表,大概不会发生一个详实的列表。因而,完成你的列表的第三个泉源将是任何你大概读到或听说过的搜刮引擎。它多是您尚未从现有供应商运用的产物。或许你在营销邮件、集会、收集钻研会上看到的东西。

第二步:减少你的候选搜刮引擎列表

假如你的列表中有凌驾12个搜刮引擎,我发起你将搜刮局限减少到几个——也就是说五个或更少。关于我们平常做的评价范例,我更喜好最多运用三个引擎。

为了从名单中删除一些候选人,我喜好从搜检每一个候选人与主要破坏者之间的关联入手下手。平常状况下,我只须要做一点点事变就可以作废一些申请者的资历。下面的列表展现了我过去看到的一些潜伏的障碍。每一个构造都是差异的,有些构造大概有阻挡或支撑下面一项或多项内容的政策或指导。所以,在阅历每一件事的时刻,斟酌一下你如今的状况和对未来的希冀。

  • 自托管。这是DIY模子。不管它在您的数据中心照样基于云的虚拟机中,您都担任布置、设置、保护和更新搜刮引擎。很多构造正在阔别这类传统的模子,以防止须要在内部治理软件。假如您更喜好托管效劳,那末任何自托管引擎都将从列表中消逝。
  • 来自搜刮引擎供应商的软件即效劳(SaaS)或平台即效劳(PaaS)。这些是托管云效劳,如AWS Elasticsearch或Amazon Kendra,谷歌云搜刮,Azure认知搜刮等。我的一些客户更喜好PaaS而不是SaaS,由于PaaS要领供应了分外的数据掌握。您大概须要与您的平安、隐私或执法团队就顺从性举行搜检。这有助于敏捷作废一些候选人的资历。
  • 关闭引擎。您大概熟习现已停产的谷歌搜刮装备(GSA)。它关于某些应用程序或构造来讲很好,但关于其他应用程序或构造来讲还不够。这基本上是一个黑箱解决方案。虽然有像GSA如许的产物,但须要定制或更多的掌握将作废一个关闭引擎的资历。
  • 夹杂式。夹杂式有多种变种。它多是一个整合了引荐效劳的自托管搜刮引擎;您的私有云与当地云的组合;或您的私有云与第三方云效劳;等。这些是更庞杂的解决方案,然则构造有合理的来由请求如许的布置。有些搜刮引擎在夹杂解决方案中表现不佳,因而不合适举行评价。

依据您的构造需求,您大概有一组更详细的项目。大概有基于预先同意的供应商列表的限定,由于到场一个新的供应商大概太耗时或庞杂。我们的目标是在没有太多剖析的状况下,疾速地将一些搜刮引擎从列表中划掉。请记着,我们试图将我们的名单减少到最有前程的候选人,愿望减少到三个或一个可治理的名单,以便举行更深切的比较。

第三步:定义评价规范

依据我的履历,当你与多个好处相干者打交道时,你挑选一个多年有效的搜刮引擎的概率会增添。与你当前的搜刮好处相干者协作,但不要遗忘未来的好处相干者。同时斟酌当前和未来的搜刮客户端,可以让你更好地评价现有的挑选。

虽然您构造的一些应用程序大概已具有了搜刮功用,但它们可以从企业平台而不是筒仓完成中获益。

以下是你的评价规范的一些平常种别。我将深切到每一个种别,并概述我们的客户平常须要或愿望具有的特定元素。

  • 连接器或爬虫。这些机制用于将数据从源加载到搜刮引擎中。关于须要索引的数据源,搜刮引擎有多少个连接器?除了如今必需索引的源以外,还应当包含未来大概索引的源。假如您设计在一到两年内停用一个源,您大概想要消除该源,由于您大概不愿望在其数据迁移到新的源之前对其举行索引。
  • 索引前的数据处置惩罚。为索引预备数据是最有代价的运动之一,但在搜刮完成中经常被疏忽。为了进步可查找性、搜刮相干性盘算、过滤、排序或其他须要,数据须要清算、规范化或雄厚。一些搜刮引擎包含开箱即用的数据处置惩罚器,并支撑针对特定数据处置惩罚需求的定制处置惩罚器。
  • 查询处置惩罚。搜刮术语,或许在某些状况下,用于查询的非结构化文本也可以从搜刮方面的一些预备中获益。就像它在索引、查询清算、规范化或充分方面所做的那样,这将使搜刮引擎可以更好地查找婚配的文档或依据相干性对它们举行评分。一些搜刮引擎供应了您大概会运用的具有特定企图的开箱即用的查询解析器。末了,寻觅未来大概须要增加自定义查询组件的可扩大性功用。
  • 言语学的支撑。假如您的内容采纳多种言语,那末支撑或可扩大性能力多是挑选一种引擎而不是另一种引擎的症结缘由。言语平常同时应用于索引端和查询端。言语学可以用作处置惩罚管道组件或文本剖析特征。
  • 第三方体系集成。跟着时候的推移,一些搜刮引擎与内容治理体系或软件结成了壮大的协作伙伴关联,以至大概为软件中的搜刮功用供应支撑。在这类状况下,搜刮引擎大概已与其他软件举行了当地集成。这是针对特定搜刮需求的加速器。
  • 搜刮效果平安性调解。企业搜刮应用程序必需保证用户只能从为他们预备的数据集取得搜刮效果。很多搜刮引擎供应对文档级别或元数据字段的接见掌握。然则,一些搜刮引擎充足天真,可以完成字段级平安性。有些引擎不供应开箱即用的平安性调解,但可以经由过程自定义集成或插件来支撑它。
  • 用户界面(UI)东西包。虽然您大概具有本身的UI开发团队,但您大概须要开箱即用的UI组件来增进搜刮客户机应用程序的集成。一些发动机带有如许的部件;其他一些东西许可您建立自力的搜刮应用程序或完全的搜刮效果页面(SERP),以嵌入到您本身的体系中。
  • 搜刮剖析和网站剖析。搜刮引擎平常生成或许可生成搜刮信号或事宜。不停增进的搜刮和网站剖析功用使智能搜刮引擎可以供应更相干和个性化的搜刮效果。这些剖析特征可以运用机械进修(ML)或其他高等要领来剖析信号或发生看法。
  • 高等人工智能(AI)功用。智能搜刮引擎取得他们的资历基于他们供应的人工智能功用。相干性评分、基于mlb的查询发起、引荐、查询企图和种种其他ai支撑的特征的自动调优并非搜刮引擎的规范,这多是挑选一个而不是另一个的缘由。
  • 受权模子。与任何软件一样,许可证是至关主要的。供应商运用的模子划定了本钱、可扩大性、可伸缩性或其他须要为您的需求细致剖析的前提。
  • 测试支撑。一些引擎内置了实行A/B测试、ML模子测试或比较、相干性排名评价等功用。我很愉快看到增加了这些特征,使产物担任人、搜刮治理员和开发人员更轻易革新相干性。

您可以运用其他规范来扩大上述列表,如治理用户界面、软件开发东西包(SDK)、日记、监控、文档或其他您感兴趣的范畴。

第四步:依据规范评价你的候选搜刮引擎

你如今应当有了三个摆布的候选人,以及评价规范。多年来,我和我的同事制作了多个电子表格用于搜刮引擎评价。平常流程以下:

  1. 建立一个表
  2. 枚举您定义的一切规范
  3. 肯定每一个规范的权重
  4. 评价一切候选搜刮引擎的每一个规范
  5. 将你对该规范的评价与分派的权重相乘,这会生成每一个引擎的规范得分
  6. 在搜刮引擎的一切规范中总结得分

在步骤4今后,您应当对一切潜伏搜刮引擎的一切规范举行评价。这一步包含钻研搜刮引擎的文档,征询搜刮引擎专家,在某些状况下,联络供应商。

第五步:搜检你的分数卡,挑选最合适的

电子表格的目标是为潜伏的搜刮引擎供应一个客观的评价。这个步骤应当很简单,由于电子表格已盘算了每一个种别的分数以及每一个搜刮引擎的总分数。

但平常状况下,差异选项的总分差异并不大。这时候分类就派上用场了。您可以依据对您的须要更主要的某些种别来挑选终究的引擎。假如你挑选把重点放在比较某些种别的小计分值上,就不要有一个异常主观的要素,由于它大概会在终究的挑选中形成误差。

路程的下一站:设计您的搜刮引擎完成

祝贺你!经由细致的评价,您已挑选了您的下一个企业搜刮引擎。路程还在继承,但在实行之前另有很多事变要做:

  • 设计实行新的搜刮引擎,
  • 预备一个多学科的团队以确保胜利的实行,
  • 计划对现有引擎的支撑,
  • 培训你的员工运用新引擎
  • 另有很多其他的东西。

它多是压倒性的…因而,设计你的下一段路程是必要的。还记得我在本系列的第一部份中形貌的地标吗?在搜刮引擎挑选过程当中,您大概会识别出其他地标,并弄清楚怎样抵达它们。

我相信你会有一个更好的主意,下一步后评价候选人搜刮引擎对你的细致请乞降希冀。比方,在完成新的搜刮引擎时,大概须要调解资本来保护当前的搜刮引擎。您大概须要将搜刮与一些现有的应用程序解耦,以至大概须要开发一个API层来最小化今后变动搜刮引擎的影响。因而,确保在完成所选搜刮引擎之前接见了这些预备里程碑。

(此处已增加圈子卡片,请到本日头条客户端检察)

【关于云返利网】

云返利网是阿里云、腾讯云、华为云产品推广返利平台,在各个品牌云产品官网优惠活动之外,云返利网还提供返利。您可以无门槛获得阿里云、华为云、腾讯云所有产品返利,在官网下单后就可以领取,无论是自己用、公司用还是帮客户采购,您个人都可以获得返利。云返利网的目标是让返利更多、更快、更简单!详情咨询13121395187(微信同号)