brief: | Mae i18n.site bellach yn cefnogi chwiliad testun llawn heb weinydd.

Mae'r erthygl hon yn cyflwyno gweithrediad technoleg chwilio testun llawn pen blaen pur, gan gynnwys mynegai gwrthdro a adeiladwyd gan IndexedDB, chwiliad rhagddodiad, optimeiddio segmentu geiriau a chymorth aml-iaith.

O'i gymharu â datrysiadau presennol, mae chwiliad testun llawn pen blaen pur i18n.site yn fach o ran maint ac yn gyflym, yn addas ar gyfer gwefannau bach a chanolig fel dogfennau a blogiau, ac mae ar gael all-lein.


Chwiliad Testun Llawn Gwrthdro Pen Blaen Pur

Dilyniant

Ar ôl sawl wythnos o ddatblygiad, i18n.site (offeryn adeiladu gwefan cwbl statig markdown multilingualtranslation & ) bellach yn cefnogi chwiliad testun llawn pen blaen pur.

Bydd yr erthygl hon yn rhannu gweithrediad technegol i18n.site chwiliad testun llawn pen blaen Ymweliad i18n.site

Cod ffynhonnell agored : Cnewyllyn chwilio / rhyngwyneb rhyngweithiol

Adolygiad O Ddatrysiadau Chwilio Testun Llawn Heb Weinydd

Ar gyfer gwefannau bach a chanolig pur statig megis dogfennau/blogiau personol, mae adeiladu ôl-len chwiliad testun llawn hunan-adeiladu yn rhy drwm, a chwilio testun llawn heb wasanaeth yw'r dewis mwyaf cyffredin.

Mae datrysiadau chwilio testun llawn di-weinydd yn perthyn i ddau gategori eang:

Yn gyntaf, tebyg algolia.com Mae darparwyr gwasanaeth chwilio trydydd parti yn darparu cydrannau pen blaen ar gyfer chwiliad testun llawn.

Mae angen talu gwasanaethau o'r fath yn seiliedig ar nifer y chwiliadau, ac yn aml nid ydynt ar gael i ddefnyddwyr ar dir mawr Tsieina oherwydd materion megis cydymffurfiad gwefan.

Ni ellir ei ddefnyddio all-lein, ni ellir ei ddefnyddio ar y fewnrwyd, ac mae ganddo gyfyngiadau mawr. Nid yw'r erthygl hon yn trafod llawer.

Yr ail yw chwiliad testun llawn pen blaen pur.

Ar hyn o bryd, mae chwiliadau testun llawn pen blaen pur cyffredin yn cynnwys lunrjs a ElasticLunr.js (yn seiliedig ar lunrjs datblygiad eilaidd).

lunrjs Mae dwy ffordd i adeiladu mynegeion, ac mae gan y ddau eu problemau eu hunain.

  1. Ffeiliau mynegai a adeiladwyd ymlaen llaw

    Gan fod y mynegai yn cynnwys geiriau o bob dogfen, mae'n fawr o ran maint. Pryd bynnag y caiff dogfen ei hychwanegu neu ei haddasu, rhaid llwytho ffeil fynegai newydd. Bydd yn cynyddu amser aros y defnyddiwr ac yn defnyddio llawer o led band.

  2. Llwytho dogfennau ac adeiladu mynegeion ar y hedfan

    Mae adeiladu mynegai yn dasg gyfrifiadurol ddwys.


Yn ogystal â lunrjs , mae rhai datrysiadau chwilio testun llawn eraill, megis :

fusejs , cyfrifwch y tebygrwydd rhwng llinynnau i chwilio.

Mae perfformiad y datrysiad hwn yn eithriadol o wael ac ni ellir ei ddefnyddio ar gyfer chwiliad testun llawn (gweler Fuse.js Mae ymholiad hir yn cymryd mwy na 10 eiliad, sut i'w optimeiddio? ).

TinySearch , defnyddiwch hidlydd Bloom i chwilio, ni ellir ei ddefnyddio ar gyfer chwiliad rhagddodiad (er enghraifft, rhowch goo , chwiliwch good , google ), ac ni all gyflawni effaith cwblhau awtomatig tebyg.

Oherwydd diffygion yr atebion presennol, datblygodd i18n.site ddatrysiad chwilio testun llawn pen blaen pur newydd, sydd â'r nodweddion canlynol :

  1. Yn cefnogi chwiliad aml-iaith ac mae'n fach o ran maint Maint y cnewyllyn chwilio ar ôl pecynnu gzip yw 6.9KB (er mwyn cymharu, maint lunrjs yw 25KB ).
  2. Adeiladwch fynegai gwrthdro yn seiliedig ar indexedb , sy'n cymryd llai o gof ac sy'n gyflym.
  3. Pan fydd dogfennau'n cael eu hychwanegu/addasu, dim ond y dogfennau sydd wedi'u hychwanegu neu eu haddasu sy'n cael eu hail-fynegeio, gan leihau nifer y cyfrifiadau.
  4. Yn cefnogi chwiliad rhagddodiad a gall arddangos canlyniadau chwilio mewn amser real tra bod y defnyddiwr yn teipio.
  5. Ar gael all-lein

Isod, cyflwynir manylion gweithredu technegol i18n.site yn fanwl.

Segmentu Geiriau Amlieithog

Mae segmentu geiriau yn defnyddio segmentiad geiriau brodorol y porwr Intl.Segmenter , ac mae pob porwr prif ffrwd yn cefnogi'r rhyngwyneb hwn.

Mae'r gair segmentu cod coffeescript fel a ganlyn

SEG = new Intl.Segmenter 0, granularity: "word"

seg = (txt) =>
  r = []
  for {segment} from SEG.segment(txt)
    for i from segment.split('.')
      i = i.trim()
      if i and !'| `'.includes(i) and !/\p{P}/u.test(i)
        r.push i
  r

export default seg

export segqy = (q) =>
  seg q.toLocaleLowerCase()

yn:

Adeilad Mynegai

Crëwyd 5 bwrdd storio gwrthrych mewn IndexedDB :

Pasiwch yr arae o ddogfen url a rhif fersiwn ver , a chwiliwch a yw'r ddogfen yn bodoli yn nhabl doc Os nad yw'n bodoli, crëwch fynegai gwrthdro. Ar yr un pryd, tynnwch y mynegai gwrthdro ar gyfer y dogfennau hynny na chawsant eu trosglwyddo.

Yn y modd hwn, gellir cyflawni mynegeio cynyddrannol a lleihau swm y cyfrifiad.

Mewn rhyngweithiad pen blaen, gellir arddangos bar cynnydd llwytho'r mynegai er mwyn osgoi'r oedi wrth lwytho am y tro cyntaf. Gweler "Bar Cynnydd gydag Animeiddiad, Yn Seiliedig ar Sengl progress + Pur css Gweithredu" Saesneg / Chinese .

IndexedDB Ysgrifennu Cydamserol Uchel

Mae'r prosiect yn idb yn seiliedig ar amgáu asyncronaidd o IndexedDB

Mae IndexedDB yn darllen ac yn ysgrifennu yn asyncronig. Wrth greu mynegai, bydd dogfennau'n cael eu llwytho ar yr un pryd i greu'r mynegai.

Er mwyn osgoi colli data yn rhannol a achosir gan ysgrifennu cystadleuol, gallwch gyfeirio at y cod coffeescript isod ac ychwanegu storfa ing rhwng darllen ac ysgrifennu i ryng-gipio ysgrifennu cystadleuol.

pusher = =>
  ing = new Map()
  (table, id, val)=>
    id_set = ing.get(id)
    if id_set
      id_set.add val
      return

    id_set = new Set([val])
    ing.set id, id_set
    pre = await table.get(id)
    li = pre?.li or []

    loop
      to_add = [...id_set]
      li.push(...to_add)
      await table.put({id,li})
      for i from to_add
        id_set.delete i
      if not id_set.size
        ing.delete id
        break
    return

rindexPush = pusher()
prefixPush = pusher()

Manwl a Dwyn I Gof

Bydd y chwiliad yn segmentu'r allweddeiriau a roddwyd gan y defnyddiwr yn gyntaf.

Tybiwch fod N gair ar ôl y segmentiad geiriau Wrth ddychwelyd canlyniadau, bydd canlyniadau sy'n cynnwys yr holl eiriau allweddol yn cael eu dychwelyd yn gyntaf, ac yna bydd canlyniadau sy'n cynnwys N-1 , N-2 ,..., 1 allweddair yn cael eu dychwelyd.

Mae'r canlyniadau chwilio a ddangosir yn gyntaf yn sicrhau cywirdeb yr ymholiad, ac mae'r canlyniadau a lwythir wedyn (cliciwch ar y botwm llwyth mwy) yn sicrhau'r gyfradd adalw.

Llwyth Ar Alw

Er mwyn gwella'r cyflymder ymateb, mae'r chwiliad yn defnyddio'r generadur yield i weithredu llwytho ar-alw, ac yn dychwelyd limit tro y cwestiynir canlyniad.

Sylwch bob tro y byddwch yn chwilio eto ar ôl yield , mae angen ichi ailagor trafodiad ymholiad o IndexedDB .

Rhagddodiad Chwiliad Amser Real

Er mwyn dangos canlyniadau chwilio tra bod y defnyddiwr yn teipio, er enghraifft, pan fydd wor yn cael ei fewnbynnu, mae geiriau sydd wedi'u rhagddodi â wor megis words a work yn cael eu harddangos.

Bydd y cnewyllyn chwilio yn defnyddio'r tabl prefix ar gyfer y gair olaf ar ôl segmentu geiriau i ddod o hyd i'r holl eiriau sydd wedi'u rhagddodi ag ef, a chwilio yn eu trefn.

Defnyddir swyddogaeth gwrth-ysgwyd debounce hefyd mewn rhyngweithio pen blaen (a weithredir fel a ganlyn) i leihau amlder mewnbwn defnyddwyr sbarduno chwiliadau a lleihau faint o gyfrifo.

export default (wait, func) => {
  var timeout;
  return function(...args) {
    clearTimeout(timeout);
    timeout = setTimeout(func.bind(this, ...args), wait);
  };
}

Ar Gael All-Lein

Nid yw'r tabl mynegai yn storio'r testun gwreiddiol, dim ond y geiriau, sy'n lleihau faint o storio.

Mae amlygu canlyniadau chwilio yn gofyn am ail-lwytho'r testun gwreiddiol, a gall paru service worker osgoi ceisiadau rhwydwaith mynych.

Ar yr un pryd, oherwydd bod service worker yn storio pob erthygl, unwaith y bydd y defnyddiwr yn gwneud chwiliad, mae'r wefan gyfan, gan gynnwys y chwiliad, ar gael all-lein.

Arddangos Optimeiddio Dogfennau MarkDown

Mae datrysiad chwilio pen blaen pur i18n.site wedi'i optimeiddio ar gyfer MarkDown dogfen.

Wrth ddangos canlyniadau chwilio, bydd enw'r bennod yn cael ei arddangos a bydd y bennod yn cael ei llywio pan glicir arni.

Crynhoi

Chwiliad testun llawn gwrthdro wedi'i weithredu ar y pen blaen yn unig, nid oes angen gweinydd. Mae'n addas iawn ar gyfer gwefannau bach a chanolig fel dogfennau a blogiau personol.

i18n.site Mae chwiliad pen blaen pur ffynhonnell agored hunanddatblygedig, bach o ran maint ac ymateb cyflym, yn datrys diffygion y chwiliad testun llawn pen blaen pur presennol ac yn darparu profiad gwell i ddefnyddwyr.