KąVeikiaValdžia.lt dokumentų paieškai naudoja galingą tekstų paieškos serverį – Apache Solr. Būtent šios technologijos dėka paieška tarp 60000 dokumentų (arba ~1.7 GB teksto) vyksta taip greitai.
Lietuviškų žodžių formas šis serveris atpažįsta dėka kodo sukurto Žygimanto Medelio, M. Petkevičiaus, Tomo Krilavičiaus.
Kadangi prisireikė šią technologiją panaudoti kitame projekte, o taip pat pastebėjau, jog kolegoms programuotojams sunku išmokti pasileisti ir naudoti Solr serverį, tai supakavau jį su visu lietuvių kalbos palaikymu ir padėjau viešam naudojimui į GitHub: emilis/solr-lt.
Pridėjau ir dokumentaciją pradedantiesiems… tiesa, darkyta anglų kalba.
Imkit, naudokit ir sėkmės jūsų darbuose!
P.S. Nepamirškit pasidalinti atgal pataisymais ir priminti man atnaujinti Solr versiją kai ji išeis. ;-)
Komentarai
Komentuoti šio įrašo nebegalima. Komentarų sistema išjungta.