Wiki source code of Vyhledávání v katalogu
Last modified by Martin Mahr on 2024/10/21 15:38
Show last authors
author | version | line-number | content |
---|---|---|---|
1 | |||
2 | |||
3 | (% class="box warningmessage" %) | ||
4 | ((( | ||
5 | Aktuálně probíhá návrh úplně nového mechanismu vyhledávání pro Tritius. Od doby vzniku Tritia pokročily technologie, posbírali jsme mnoho zpětné vazby i profesních zkušeností a tak jsme se rozhodli, že je na čase vymyslet vyhledání znovu na zelené louce. Cíle nového vyhledávání jsou: | ||
6 | |||
7 | * Maximální rychlost vyhledávání | ||
8 | * Významně lepší určování relevance | ||
9 | * Rychlejší indexace dokumentů bez nežádoucí ztráty výkonu Tritia | ||
10 | * Specializovaná podpora pro vyhledávání např. zkratek, iniciálů namísto jmen a další vychytávky | ||
11 | |||
12 | Přepokládaný termín dokončení je přelom roku 2022/2023. | ||
13 | ))) | ||
14 | |||
15 | (% class="box warningmessage" %) | ||
16 | ((( | ||
17 | Vyhledávání je předmětem neustálého vývoje a co platí dnes nemusí platit zítra. Pro vyhledávání v SOLRu neexistují univerzální návody nebo postupy, jak by mělo fungovat a co funguje na e-shopu nebude fungovat pro knihovnu. Jde o neustálou práci pokusů, omylů a drobných vylepšení na základě postupně získávaných zkušeností. | ||
18 | ))) | ||
19 | |||
20 | = Obecné informace = | ||
21 | |||
22 | * Vyhledávání standardně nehledí na diakritiku - je jedno, jestli vyhledáváte Novák// //nebo Novak | ||
23 | * Vyhledávání standardně nehledí na velikost písmen - je jedno, jestli vyhledáváte Novak nebo novak. | ||
24 | * Je možné používat **speciální znaky** pro vyhledávání | ||
25 | ** hvězdička - začíná/končí | ||
26 | *** Jan* - nalezne Jan, Jana, Janák, ... | ||
27 | *** *jany - nalezne Jany, Svijany, ... | ||
28 | ** uvozovky - vyhledává fráze | ||
29 | *** "Jan Novák" - nalezne záznamy, ve kterých je Jan Novák | ||
30 | |||
31 | == Úprava relevance neknižních dokumentů == | ||
32 | |||
33 | Tritius umožňuje nastavit dvě úrovně základního boostup pro dokumenty vyjmenovaných typů. | ||
34 | |||
35 | * SOLR_MAX_BOOST_TYPES - Seznam ID typů dokumentů s maximálním boostem. Defaultně pouze knihy. | ||
36 | * SOLR_OTHER_BOOST - Hodnota boostup pro ostatní dokumenty. Defaultně je to 0,25. | ||
37 | |||
38 | = Jednoduché vyhledávání = | ||
39 | |||
40 | * **vyhledává** téměř ve všech položkách z děl, | ||
41 | * **nevyhledává** v informacích ze svazků (přírůstková čísla apod) - lze to nastavit, ale z důvodu rychlosti je to ve výchozím stavu vypnuté, | ||
42 | * je možné vyhledávat zároveň ve všech informacích, nebo zvolit nějakou skupinu informací | ||
43 | * při vyhledávání více slov je mezi každým slovem operátor **nebo** | ||
44 | ** vyhledávání Jan Novák - nalezne všechny díla, u kterých se vyskytuje "Jan" nebo "Novák" | ||
45 | * Je-li vybráno konkrétní vyhledávané pole (Autor, název), potom se mezi slovy použije AND. | ||
46 | * Pokud se nenajde žádný výsledek, pak se zkusí hledaný výraz rozšířit o hvězdičky a vyhledává se tedy fráze začínající na hledaný výraz. | ||
47 | |||
48 | = Pokročilé vyhledávání = | ||
49 | |||
50 | * v rámci jednoho pole pro vyhledávání je mezi jednotlivými slovy vztah **a** | ||
51 | ** "Jan Novák" - nalezne záznamy, ve kterých se vyskytují obě slova "Jan" a "Novák" | ||
52 | * vztah mezi vyhledávanými poli je **a**, např. vyhledávání | ||
53 | ** autor: Jan Novák, název: Hrady - nalezne dokumenty s názvem který obsahuje "Hrady" a jejichž autorem je "Jan Novák" | ||
54 | |||
55 | = Kombinované vyhledávání = | ||
56 | |||
57 | * v rámci jednoho pole pro vyhledávání je mezi jednotlivými slovy vztah **a** | ||
58 | ** "Jan Novák" - nalezne záznamy, ve kterých se vyskytují obě slova "Jan" a "Novák" | ||
59 | * vztah mezi vyhledávanými poli je možné zvolit mezi **a **a **nebo** | ||
60 | ** Vztah **A: **autor: Jan Novák, název: Hrady - nalezne dokumenty s názvem který obsahuje "Hrady" **a** jejichž autorem je "Jan Novák" | ||
61 | ** Vztah **NEBO: **autor: Jan Novák, název: Hrady - nalezne dokumenty s názvem který obsahuje "Hrady" **nebo** jejichž autorem je "Jan Novák" | ||
62 | * Dostupné operátory - vyhledávané dotazy je možné kombinovat **se speciálními znaky** | ||
63 | ** **rovno **- u záznamu je uloženo "Novák, Jan" | ||
64 | *** je třeba vyhledávat přesně Novák, Jan (včetně čárky a správného pořadí, všechny ostatní varianty nenaleznou požadovaný záznam - např. Novák Jan, Jan Novák atd) | ||
65 | ** **obsahuje** - má význam obsahuje slova (hledá celá slova), u záznamu je uloženo "Lučištník. 1. Hledání svatého grálu" | ||
66 | *** je možné hledat (aby záznam byl nalezen): | ||
67 | **** lučištník | ||
68 | **** Lučištník hledání grálu | ||
69 | **** Hledání grálu | ||
70 | **** Hledání svatého grálu | ||
71 | **** atd. | ||
72 | ** **neobsahuje** - je opakem pro obsahuje, u záznamu je uloženo "Lučištník. 1. Hledání svatého grálu" | ||
73 | *** je možné hledat (aby záznam byl nalezen): | ||
74 | **** hory | ||
75 | **** hokej | ||
76 | **** noviny | ||
77 | **** atd. - informace které nejsou v záznamu uloženy | ||
78 | ** **začíná na** - vyhledává celá slova, u záznamu je uloženo "Lučištník. 1. Hledání svatého grálu". Operátor začíná se vztahuje na celou uloženou hodnotu (ne začátek slova) | ||
79 | *** je možné hledat (aby záznam byl nalezen): | ||
80 | **** lučištník | ||
81 | **** lučištník. 1. | ||
82 | **** Lučištník. 1. Hledání svatého | ||
83 | **** atd. | ||
84 | ** **nezačíná** - vyhledává celá slova, u záznamu je uloženo "Lučištník. 1. Hledání svatého grálu". Operátor nezačíná se vztahuje na celou uloženou hodnotu (ne začátek slova) | ||
85 | *** je možné hledat (aby záznam byl nalezen): | ||
86 | **** hory | ||
87 | **** hokej | ||
88 | **** noviny | ||
89 | **** atd. - informace které nejsou v záznamu uloženy | ||
90 | ** **vyplněno** - pole, ve kterém se vyhledává je uložena libovolná hodnota | ||
91 | *** pokud se bude vyhledávat v poli Autor, pak hledaný dokument **musí mít** vyplněného alespoň jednoh autora | ||
92 | ** **nevyplněno** - pole, ve kterém se vyhledává je prázdné | ||
93 | *** pokud se bude vyhledávat v poli Autor, pak hledaný dokument **nesmí mít** vyplněného žádného autora | ||
94 | |||
95 | = Kalendárium = | ||
96 | |||
97 | Kalendárium lze vypnout nastavením **CATALOG_CALENDARIUM_ENABLED**. | ||
98 | |||
99 | = Speciální případy vyhledávání = | ||
100 | |||
101 | == ISXN == | ||
102 | |||
103 | * u záznamu je uloženo např. "978-80-247-3656-3 (brož.)", je možné vyhledávat: | ||
104 | ** 978-80-247-3656-3 (brož.) | ||
105 | ** 978-80-247-3656-3 | ||
106 | ** 9788024736563 |