Wiki source code of Vyhledávání v katalogu

Last modified by Martin Mahr on 2024/10/21 15:38

Show last authors
1
2
3 (% class="box warningmessage" %)
4 (((
5 Aktuálně probíhá návrh úplně nového mechanismu vyhledávání pro Tritius. Od doby vzniku Tritia pokročily technologie, posbírali jsme mnoho zpětné vazby i profesních zkušeností a tak jsme se rozhodli, že je na čase vymyslet vyhledání znovu na zelené louce. Cíle nového vyhledávání jsou:
6
7 * Maximální rychlost vyhledávání
8 * Významně lepší určování relevance
9 * Rychlejší indexace dokumentů bez nežádoucí ztráty výkonu Tritia
10 * Specializovaná podpora pro vyhledávání např. zkratek, iniciálů namísto jmen a další vychytávky
11
12 Přepokládaný termín dokončení je přelom roku 2022/2023.
13 )))
14
15 (% class="box warningmessage" %)
16 (((
17 Vyhledávání je předmětem neustálého vývoje a co platí dnes nemusí platit zítra. Pro vyhledávání v SOLRu neexistují univerzální návody nebo postupy, jak by mělo fungovat a co funguje na e-shopu nebude fungovat pro knihovnu. Jde o neustálou práci pokusů, omylů a drobných vylepšení na základě postupně získávaných zkušeností.
18 )))
19
20 = Obecné informace =
21
22 * Vyhledávání standardně nehledí na diakritiku - je jedno, jestli vyhledáváte Novák// //nebo Novak
23 * Vyhledávání standardně nehledí na velikost písmen - je jedno, jestli vyhledáváte Novak nebo novak.
24 * Je možné používat **speciální znaky** pro vyhledávání
25 ** hvězdička - začíná/končí
26 *** Jan* - nalezne Jan, Jana, Janák, ...
27 *** *jany - nalezne Jany, Svijany, ...
28 ** uvozovky - vyhledává fráze
29 *** "Jan Novák" - nalezne záznamy, ve kterých je Jan Novák
30
31 == Úprava relevance neknižních dokumentů ==
32
33 Tritius umožňuje nastavit dvě úrovně základního boostup pro dokumenty vyjmenovaných typů.
34
35 * SOLR_MAX_BOOST_TYPES - Seznam ID typů dokumentů s maximálním boostem. Defaultně pouze knihy.
36 * SOLR_OTHER_BOOST - Hodnota boostup pro ostatní dokumenty. Defaultně je to 0,25.
37
38 = Jednoduché vyhledávání =
39
40 * **vyhledává** téměř ve všech položkách z děl,
41 * **nevyhledává** v informacích ze svazků (přírůstková čísla apod) - lze to nastavit, ale z důvodu rychlosti je to ve výchozím stavu vypnuté,
42 * je možné vyhledávat zároveň ve všech informacích, nebo zvolit nějakou skupinu informací
43 * při vyhledávání více slov je mezi každým slovem operátor **nebo**
44 ** vyhledávání Jan Novák - nalezne všechny díla, u kterých se vyskytuje "Jan" nebo "Novák"
45 * Je-li vybráno konkrétní vyhledávané pole (Autor, název), potom se mezi slovy použije AND.
46 * Pokud se nenajde žádný výsledek, pak se zkusí hledaný výraz rozšířit o hvězdičky a vyhledává se tedy fráze začínající na hledaný výraz.
47
48 = Pokročilé vyhledávání =
49
50 * v rámci jednoho pole pro vyhledávání je mezi jednotlivými slovy vztah **a**
51 ** "Jan Novák" - nalezne záznamy, ve kterých se vyskytují obě slova "Jan" a "Novák"
52 * vztah mezi vyhledávanými poli je **a**, např. vyhledávání
53 ** autor: Jan Novák, název: Hrady - nalezne dokumenty s názvem který obsahuje "Hrady" a jejichž autorem je "Jan Novák"
54
55 = Kombinované vyhledávání =
56
57 * v rámci jednoho pole pro vyhledávání je mezi jednotlivými slovy vztah **a**
58 ** "Jan Novák" - nalezne záznamy, ve kterých se vyskytují obě slova "Jan" a "Novák"
59 * vztah mezi vyhledávanými poli je možné zvolit mezi **a **a **nebo**
60 ** Vztah **A: **autor: Jan Novák, název: Hrady - nalezne dokumenty s názvem který obsahuje "Hrady" **a** jejichž autorem je "Jan Novák"
61 ** Vztah **NEBO: **autor: Jan Novák, název: Hrady - nalezne dokumenty s názvem který obsahuje "Hrady" **nebo** jejichž autorem je "Jan Novák"
62 * Dostupné operátory - vyhledávané dotazy je možné kombinovat **se speciálními znaky**
63 ** **rovno **- u záznamu je uloženo "Novák, Jan"
64 *** je třeba vyhledávat přesně Novák, Jan (včetně čárky a správného pořadí, všechny ostatní varianty nenaleznou požadovaný záznam - např. Novák Jan, Jan Novák atd)
65 ** **obsahuje** - má význam obsahuje slova (hledá celá slova), u záznamu je uloženo "Lučištník. 1. Hledání svatého grálu"
66 *** je možné hledat (aby záznam byl nalezen):
67 **** lučištník
68 **** Lučištník hledání grálu
69 **** Hledání grálu
70 **** Hledání svatého grálu
71 **** atd.
72 ** **neobsahuje** - je opakem pro obsahuje, u záznamu je uloženo "Lučištník. 1. Hledání svatého grálu"
73 *** je možné hledat (aby záznam byl nalezen):
74 **** hory
75 **** hokej
76 **** noviny
77 **** atd. - informace které nejsou v záznamu uloženy
78 ** **začíná na** - vyhledává celá slova, u záznamu je uloženo "Lučištník. 1. Hledání svatého grálu". Operátor začíná se vztahuje na celou uloženou hodnotu (ne začátek slova)
79 *** je možné hledat (aby záznam byl nalezen):
80 **** lučištník
81 **** lučištník. 1.
82 **** Lučištník. 1. Hledání svatého
83 **** atd.
84 ** **nezačíná** - vyhledává celá slova, u záznamu je uloženo "Lučištník. 1. Hledání svatého grálu". Operátor nezačíná se vztahuje na celou uloženou hodnotu (ne začátek slova)
85 *** je možné hledat (aby záznam byl nalezen):
86 **** hory
87 **** hokej
88 **** noviny
89 **** atd. - informace které nejsou v záznamu uloženy
90 ** **vyplněno** - pole, ve kterém se vyhledává je uložena libovolná hodnota
91 *** pokud se bude vyhledávat v poli Autor, pak hledaný dokument **musí mít** vyplněného alespoň jednoh autora
92 ** **nevyplněno** - pole, ve kterém se vyhledává je prázdné
93 *** pokud se bude vyhledávat v poli Autor, pak hledaný dokument **nesmí mít** vyplněného žádného autora
94
95 = Kalendárium =
96
97 Kalendárium lze vypnout nastavením **CATALOG_CALENDARIUM_ENABLED**.
98
99 = Speciální případy vyhledávání =
100
101 == ISXN ==
102
103 * u záznamu je uloženo např. "978-80-247-3656-3 (brož.)", je možné vyhledávat:
104 ** 978-80-247-3656-3 (brož.)
105 ** 978-80-247-3656-3
106 ** 9788024736563