Wyszukiwanie w katalogu

Ostatnio modyfikowane 2025/10/01 13:16 przez Jan Slezák

 

Obecnie trwa opracowywanie zupełnie nowego mechanizmu wyszukiwania dla Tritius. Od momentu powstania Tritius technologia posunęła się naprzód, zebraliśmy wiele opinii i doświadczeń zawodowych, dlatego zdecydowaliśmy, że nadszedł czas, aby opracować wyszukiwanie od nowa. Cele nowego wyszukiwania są następujące:

  • Maksymalna szybkość wyszukiwania
    Znacznie lepsze określanie trafności
    Szybsza indeksacja dokumentów bez niepożądanej utraty wydajności Tritia
    Specjalistyczna obsługa wyszukiwania np. skrótów, inicjałów zamiast nazwisk i innych udogodnień

Przewidywany termin zakończenia to przełom roku 2022/2023.

Wyszukiwanie podlega ciągłym zmianom i to, co obowiązuje dzisiaj, jutro może już nie obowiązywać. Nie ma uniwersalnych instrukcji ani procedur dotyczących wyszukiwania w SOLR, a to, co sprawdza się w sklepie internetowym, nie sprawdzi się w bibliotece. Jest to ciągła praca polegająca na próbach, błędach i drobnych ulepszeniach opartych na stopniowo zdobywanym doświadczeniu.

Informacje ogólne

  • Vyhledávání standardně nehledí na diakritiku - je jedno, jestli vyhledáváte Novák nebo Novak
  • Vyhledávání standardně nehledí na velikost písmen - je jedno, jestli vyhledáváte Novak nebo novak.
  • Je možné používat speciální znaky pro vyhledávání
    • hvězdička - začíná/končí
      • Jan* - nalezne Jan, Jana, Janák, ...
      • *jany - nalezne Jany, Svijany, ...
    • uvozovky - vyhledává fráze
      • "Jan Novák" - nalezne záznamy, ve kterých je Jan Novák
  • Wyszukiwanie standardowo nie uwzględnia znaków diakrytycznych – nie ma znaczenia, czy wyszukujesz Novák, czy Novak.
  • Wyszukiwanie standardowo nie uwzględnia wielkości liter – nie ma znaczenia, czy wyszukujesz Novak, czy novak.
  • W wyszukiwaniu można używać znaków specjalnych
    • gwiazdka – początek/koniec
      • Jan* – znajdzie Jan, Jana, Janák, ...
      • *jany – znajdzie Jany, Svijany, ...
    • cudzysłów – wyszukuje frazy
      • „Jan Novák” – znajdzie wpisy, w których występuje Jan Novák

Korekta trafności dokumentów niebędących książkami

Tritius umożliwia ustawienie dwóch poziomów podstawowego wzmocnienia dla dokumentów wymienionych typów.

  • SOLR_MAX_BOOST_TYPES -

    Lista identyfikatorów typów dokumentów z maksymalnym wzmocnieniem. Domyślnie tylko książki.

  • SOLR_OTHER_BOOST – wartość wzmocnienia dla pozostałych dokumentów. Domyślnie wynosi 0,25.

Proste wyszukiwanie

  • wyszukuje prawie wszystkie pozycje z dzieł,
  • nie wyszukuje informacji z tomów (numery przyrostowe itp.) – można to ustawić, ale ze względu na szybkość jest to domyślnie wyłączone,
  • można wyszukiwać jednocześnie we wszystkich informacjach lub wybrać jakąś grupę informacji
  • przy wyszukiwaniu wielu słów między każdym słowem znajduje się operator lub
  • wyszukiwanie Jan Novák – znajdzie wszystkie dzieła, w których występuje „Jan” lub „Novák”
  • Jeśli wybrano konkretne pole wyszukiwania (autor, tytuł), między słowami zostanie użyte AND.
  • Jeśli nie zostanie znaleziony żaden wynik, zostanie podjęta próba rozszerzenia wyszukiwanego wyrażenia o gwiazdki i wyszukiwana będzie fraza zaczynająca się od wyszukiwanego wyrażenia. 

Wyszukiwanie zaawansowane

  • w ramach jednego pola wyszukiwania między poszczególnymi słowami występuje relacja i
    • „Jan Nowak” – wyszukuje rekordy, w których występują oba słowa „Jan” i „Nowak”
  • związek między wyszukiwanymi polami jest następujący, np. wyszukiwanie
    • autor: Jan Nowak, tytuł: Zamki – wyszukuje dokumenty, których tytuł zawiera słowo „Zamki” i których autorem jest „Jan Nowak”

Wyszukiwanie łączone

  • v rámci jednoho pole pro vyhledávání je mezi jednotlivými slovy vztah a
    • "Jan Novák" - nalezne záznamy, ve kterých se vyskytují obě slova "Jan" a "Novák"
  • vztah mezi vyhledávanými poli je možné zvolit mezi nebo
    • Vztah A: autor: Jan Novák, název: Hrady - nalezne dokumenty s názvem který obsahuje "Hrady" a jejichž autorem je "Jan Novák"
    • Vztah NEBO: autor: Jan Novák, název: Hrady - nalezne dokumenty s názvem který obsahuje "Hrady" nebo jejichž autorem je "Jan Novák"
  • Dostupné operátory - vyhledávané dotazy je možné kombinovat se speciálními znaky
    • rovno - u záznamu je uloženo "Novák, Jan"
      • je třeba vyhledávat přesně Novák, Jan (včetně čárky a správného pořadí, všechny ostatní varianty nenaleznou požadovaný záznam - např. Novák Jan, Jan Novák atd)
    • obsahuje - má význam obsahuje slova (hledá celá slova), u záznamu je uloženo "Lučištník. 1. Hledání svatého grálu"
      • je možné hledat (aby záznam byl nalezen):
        • lučištník
        • Lučištník hledání grálu
        • Hledání grálu
        • Hledání svatého grálu
        • atd.
    • neobsahuje - je opakem pro obsahuje, u záznamu je uloženo "Lučištník. 1. Hledání svatého grálu"
      • je možné hledat (aby záznam byl nalezen):
        • hory
        • hokej
        • noviny
        • atd. - informace které nejsou v záznamu uloženy
    • začíná na - vyhledává celá slova, u záznamu je uloženo "Lučištník. 1. Hledání svatého grálu". Operátor začíná se vztahuje na celou uloženou hodnotu (ne začátek slova)
      • je možné hledat (aby záznam byl nalezen):
        • lučištník
        • lučištník. 1.
        • Lučištník. 1. Hledání svatého
        • atd.
    • nezačíná - vyhledává celá slova, u záznamu je uloženo "Lučištník. 1. Hledání svatého grálu". Operátor nezačíná se vztahuje na celou uloženou hodnotu (ne začátek slova)
      • je možné hledat (aby záznam byl nalezen):
        • hory
        • hokej
        • noviny
        • atd. - informace které nejsou v záznamu uloženy
    • vyplněno - pole, ve kterém se vyhledává je uložena libovolná hodnota
      • pokud se bude vyhledávat v poli Autor, pak hledaný dokument musí mít vyplněného alespoň jednoh autora
    • nevyplněno - pole, ve kterém se vyhledává je prázdné
      • pokud se bude vyhledávat v poli Autor, pak hledaný dokument nesmí mít vyplněného žádného autora

Kalendarz

Kalendárium lze vypnout nastavením CATALOG_CALENDARIUM_ENABLED.

Specjalne przypadki wyszukiwania

ISXN

  • W zapisie zapisano np. „978-80-247-3656-3 (broż.)”, można wyszukiwać:
    • 978-80-247-3656-3 (broż.)
    • 978-80-247-3656-3
    • 9788024736563