Zdrojový kód wiki Vyhledávání v katalogu
Naposledy změněno Martin Mahr 2024/10/21 15:38
Show last authors
| author | version | line-number | content |
|---|---|---|---|
| 1 | |||
| 2 | |||
| 3 | (% class="box warningmessage" %) | ||
| 4 | ((( | ||
| 5 | Aktuálně probíhá návrh úplně nového mechanismu vyhledávání pro Tritius. Od doby vzniku Tritia pokročily technologie, posbírali jsme mnoho zpětné vazby i profesních zkušeností a tak jsme se rozhodli, že je na čase vymyslet vyhledání znovu na zelené louce. Cíle nového vyhledávání jsou: | ||
| 6 | |||
| 7 | * Maximální rychlost vyhledávání | ||
| 8 | * Významně lepší určování relevance | ||
| 9 | * Rychlejší indexace dokumentů bez nežádoucí ztráty výkonu Tritia | ||
| 10 | * Specializovaná podpora pro vyhledávání např. zkratek, iniciálů namísto jmen a další vychytávky | ||
| 11 | |||
| 12 | Přepokládaný termín dokončení je přelom roku 2022/2023. | ||
| 13 | ))) | ||
| 14 | |||
| 15 | (% class="box warningmessage" %) | ||
| 16 | ((( | ||
| 17 | Vyhledávání je předmětem neustálého vývoje a co platí dnes nemusí platit zítra. Pro vyhledávání v SOLRu neexistují univerzální návody nebo postupy, jak by mělo fungovat a co funguje na e-shopu nebude fungovat pro knihovnu. Jde o neustálou práci pokusů, omylů a drobných vylepšení na základě postupně získávaných zkušeností. | ||
| 18 | ))) | ||
| 19 | |||
| 20 | = Obecné informace = | ||
| 21 | |||
| 22 | * Vyhledávání standardně nehledí na diakritiku - je jedno, jestli vyhledáváte Novák// //nebo Novak | ||
| 23 | * Vyhledávání standardně nehledí na velikost písmen - je jedno, jestli vyhledáváte Novak nebo novak. | ||
| 24 | * Je možné používat **speciální znaky** pro vyhledávání | ||
| 25 | ** hvězdička - začíná/končí | ||
| 26 | *** Jan* - nalezne Jan, Jana, Janák, ... | ||
| 27 | *** *jany - nalezne Jany, Svijany, ... | ||
| 28 | ** uvozovky - vyhledává fráze | ||
| 29 | *** "Jan Novák" - nalezne záznamy, ve kterých je Jan Novák | ||
| 30 | |||
| 31 | == Úprava relevance neknižních dokumentů == | ||
| 32 | |||
| 33 | Tritius umožňuje nastavit dvě úrovně základního boostup pro dokumenty vyjmenovaných typů. | ||
| 34 | |||
| 35 | * SOLR_MAX_BOOST_TYPES - Seznam ID typů dokumentů s maximálním boostem. Defaultně pouze knihy. | ||
| 36 | * SOLR_OTHER_BOOST - Hodnota boostup pro ostatní dokumenty. Defaultně je to 0,25. | ||
| 37 | |||
| 38 | = Jednoduché vyhledávání = | ||
| 39 | |||
| 40 | * **vyhledává** téměř ve všech položkách z děl, | ||
| 41 | * **nevyhledává** v informacích ze svazků (přírůstková čísla apod) - lze to nastavit, ale z důvodu rychlosti je to ve výchozím stavu vypnuté, | ||
| 42 | * je možné vyhledávat zároveň ve všech informacích, nebo zvolit nějakou skupinu informací | ||
| 43 | * při vyhledávání více slov je mezi každým slovem operátor **nebo** | ||
| 44 | ** vyhledávání Jan Novák - nalezne všechny díla, u kterých se vyskytuje "Jan" nebo "Novák" | ||
| 45 | * Je-li vybráno konkrétní vyhledávané pole (Autor, název), potom se mezi slovy použije AND. | ||
| 46 | * Pokud se nenajde žádný výsledek, pak se zkusí hledaný výraz rozšířit o hvězdičky a vyhledává se tedy fráze začínající na hledaný výraz. | ||
| 47 | |||
| 48 | = Pokročilé vyhledávání = | ||
| 49 | |||
| 50 | * v rámci jednoho pole pro vyhledávání je mezi jednotlivými slovy vztah **a** | ||
| 51 | ** "Jan Novák" - nalezne záznamy, ve kterých se vyskytují obě slova "Jan" a "Novák" | ||
| 52 | * vztah mezi vyhledávanými poli je **a**, např. vyhledávání | ||
| 53 | ** autor: Jan Novák, název: Hrady - nalezne dokumenty s názvem který obsahuje "Hrady" a jejichž autorem je "Jan Novák" | ||
| 54 | |||
| 55 | = Kombinované vyhledávání = | ||
| 56 | |||
| 57 | * v rámci jednoho pole pro vyhledávání je mezi jednotlivými slovy vztah **a** | ||
| 58 | ** "Jan Novák" - nalezne záznamy, ve kterých se vyskytují obě slova "Jan" a "Novák" | ||
| 59 | * vztah mezi vyhledávanými poli je možné zvolit mezi **a **a **nebo** | ||
| 60 | ** Vztah **A: **autor: Jan Novák, název: Hrady - nalezne dokumenty s názvem který obsahuje "Hrady" **a** jejichž autorem je "Jan Novák" | ||
| 61 | ** Vztah **NEBO: **autor: Jan Novák, název: Hrady - nalezne dokumenty s názvem který obsahuje "Hrady" **nebo** jejichž autorem je "Jan Novák" | ||
| 62 | * Dostupné operátory - vyhledávané dotazy je možné kombinovat **se speciálními znaky** | ||
| 63 | ** **rovno **- u záznamu je uloženo "Novák, Jan" | ||
| 64 | *** je třeba vyhledávat přesně Novák, Jan (včetně čárky a správného pořadí, všechny ostatní varianty nenaleznou požadovaný záznam - např. Novák Jan, Jan Novák atd) | ||
| 65 | ** **obsahuje** - má význam obsahuje slova (hledá celá slova), u záznamu je uloženo "Lučištník. 1. Hledání svatého grálu" | ||
| 66 | *** je možné hledat (aby záznam byl nalezen): | ||
| 67 | **** lučištník | ||
| 68 | **** Lučištník hledání grálu | ||
| 69 | **** Hledání grálu | ||
| 70 | **** Hledání svatého grálu | ||
| 71 | **** atd. | ||
| 72 | ** **neobsahuje** - je opakem pro obsahuje, u záznamu je uloženo "Lučištník. 1. Hledání svatého grálu" | ||
| 73 | *** je možné hledat (aby záznam byl nalezen): | ||
| 74 | **** hory | ||
| 75 | **** hokej | ||
| 76 | **** noviny | ||
| 77 | **** atd. - informace které nejsou v záznamu uloženy | ||
| 78 | ** **začíná na** - vyhledává celá slova, u záznamu je uloženo "Lučištník. 1. Hledání svatého grálu". Operátor začíná se vztahuje na celou uloženou hodnotu (ne začátek slova) | ||
| 79 | *** je možné hledat (aby záznam byl nalezen): | ||
| 80 | **** lučištník | ||
| 81 | **** lučištník. 1. | ||
| 82 | **** Lučištník. 1. Hledání svatého | ||
| 83 | **** atd. | ||
| 84 | ** **nezačíná** - vyhledává celá slova, u záznamu je uloženo "Lučištník. 1. Hledání svatého grálu". Operátor nezačíná se vztahuje na celou uloženou hodnotu (ne začátek slova) | ||
| 85 | *** je možné hledat (aby záznam byl nalezen): | ||
| 86 | **** hory | ||
| 87 | **** hokej | ||
| 88 | **** noviny | ||
| 89 | **** atd. - informace které nejsou v záznamu uloženy | ||
| 90 | ** **vyplněno** - pole, ve kterém se vyhledává je uložena libovolná hodnota | ||
| 91 | *** pokud se bude vyhledávat v poli Autor, pak hledaný dokument **musí mít** vyplněného alespoň jednoh autora | ||
| 92 | ** **nevyplněno** - pole, ve kterém se vyhledává je prázdné | ||
| 93 | *** pokud se bude vyhledávat v poli Autor, pak hledaný dokument **nesmí mít** vyplněného žádného autora | ||
| 94 | |||
| 95 | = Kalendárium = | ||
| 96 | |||
| 97 | Kalendárium lze vypnout nastavením **CATALOG_CALENDARIUM_ENABLED**. | ||
| 98 | |||
| 99 | = Speciální případy vyhledávání = | ||
| 100 | |||
| 101 | == ISXN == | ||
| 102 | |||
| 103 | * u záznamu je uloženo např. "978-80-247-3656-3 (brož.)", je možné vyhledávat: | ||
| 104 | ** 978-80-247-3656-3 (brož.) | ||
| 105 | ** 978-80-247-3656-3 | ||
| 106 | ** 9788024736563 |