Wiki source code of Postup převodu dat z Clavia

Version 14.1 by Jan Šimeček on 2024/06/28 10:10

Show last authors
1
2
3 = Záloha dat Clavia pro převod do Tritia =
4
5 Postup pro malé knihovny k poslání je zde: [[Záloha dat Clavia pro převod do Tritia>>doc:.Zaloha-dat-Clavia-pro-prevod-do-Tritia.WebHome]]
6
7 = Převod =
8
9 == Tipy a Triky ==
10
11 |(((
12
13 {{html}}
14 <div style="word-wrap: break-word;">
15 |=Popis
16 |(% colspan="1" %)Revize se nepřevádí, musí být před zahájením převodu do Tritia uzavřena.
17 |(% colspan="1" %)Dispečink Clavia se nepřevádí, pokud data potřebují, tak si je musí před vypnutím Clavia opsat.
18 |(% colspan="1" %)Statistiky LWWW se nepřevádí, knihovna si je musí opsat.
19 |Neměnit klíč v definici poplatků po testovacím převodu, nepovede se pak napojení poplatků při dalším importu - měnit až po posledním importu knihovny.
20 |Neměnit zkratky v odděleních, nebude fungovat vazba výchozího oddělení čtenáře - měnit až po ostrém startu.
21 </div>
22 {{/html}}
23
24 )))
25
26 == Příprava převodu ==
27
28 * Zeptat se knihovny před převodem: [[Dotazy na knihovnu před převodem>>doc:.Dotazy-na-knihovnu-pred-prevodem.WebHome]]
29 * Zálohu rozbalovat přes **{{html}}<span style="color: red;">Total Commander </span>{{/html}}**- ne přes Windows průzkumníka!!!
30
31 1. **{{html}}<span style="color: green;">Aktualizovat Clavius</span>{{/html}}** na současnou verzi (Pomůcky → Update přes internet)
32 1. **{{html}}<span style="color: green;">Provést synchronizaci polí</span>{{/html}}** (Pomůcky → Editace polí → Sync → Aktualizovat)
33 1. **{{html}}<span style="color: green;">Provést kontrolu integrit dat </span>{{/html}}**(chyby opravovat !!! hlavně dogenerovat autority a smazat chybná pole)
34 1*. Katalogizace:
35 1**. **do integrit with .t.,.t. **( lze využít i příkazu **do tritius** , dělá to samé )
36 1***. vyzve ke sloučení slovníků C1 a C3 do C1 - dát ano
37 1**. **do OKindik with .T.**
38 1*. Výpůjčák
39 1**. Clex.exe → Systém → Provést Kontrolu integrity dat)
40 1. **{{html}}<span style="color: green;">pohled([select !s.scislo, s.pcislo, s.ucislo, #s.ckod from svazky s, (select ckod from svazky group by ckod having count(*)>1) s1 where s.ckod<>'' and s.ckod=s1.ckod order by s.ckod])</span>{{/html}}**
41 1*. duplicity čárových kódů svazků řešit ve foxíku tak že za čárový kód přídáte písmeno a,b,c ...  kromě prvního výskytu čárového kódu
42 1. **{{html}}select isxn, count(*) as pocet from tituly group by isxn order by pocet desc{{/html}}**
43 1*. kontrola na duplicitu ISBN
44
45 == Vlastní export dat z Clavia - automaticky (verze Clavia od 28.2.2019) ==
46
47 * **{{html}}<span style="color: red;">Pokud se jedná o reksové centrum, musí export probíhat pod uživatelem Správce Reksu!!</span>{{/html}}** ( Systém - Servis dat - Výběr jiné knihovny - zaškrtnout Správce REKSu - OK )
48 * Při importu REKS knihovny = přečíst oddíl 2.5 ( možná úprava svazků v Claviu )
49 * ve foxíku spustit:
50 * **do FULLEXPORT**
51 ** -vyzve ke kontrole OKAcisla - dát ano a lze jít spát, bude následně automaticky pokračovat export tagů
52 * TAG soubory se automaticky vygenerují do složky TXT ve složce Clavius
53
54 == Příprava CLAVIUS SQL ==
55
56 Pro převod dat akvizice, výpůjčního protokolu a další částí se používá přímý převod do Tritiia z SQL databáze Clavius.
57 Proto je nutné převést celý Clavius do SQL (lze využít SQL server pro Tritius), tento krok lze vynechat jen pokud se importuje pouze fond.
58
59 * postup vytvoření databáze clavius na SQL serveru a převodu dat Clavia pomocí **NASQL.EXE** viz: [[http:~~/~~/www.vkta.cz/LANius/diskety/sql/mssql.htm>>url:http://www.vkta.cz/LANius/diskety/sql/mssql.htm]] pro MSSQL
60 * není potřeba nic nastavovat pouze je potřeba SQL uživatel který má plná práva pro databázi clavius
61
62 == Importování knihovny pokud v cílovém Tritiu již je část svazků (např. Výměnné soubory) ==
63
64 V případě připojování dat je nutná existence čárového kódu v tabulce svazky u výměnných souborů, aby došlo ke správnému napárování:
65
66 |
67
68 {{{Kontrola dat v Claviu, jestli obsahují vygenerovaný správně ckod, kdy 31840 - je prefix nadřízené knihovny:
69  
70 browse for betw(val(pcislo),500000,599999) and !empt(ckod) and ckod<>'31840'
71  
72 Pokud nic nevrátí, tak netřeba dělat! V opačném případě je potřeba předem dogenerovat do svazky.ckod čárový kód s prefiem nadřízené knihovny:
73  
74 browse for betw(val(pcislo),500000,599999) and betw(len(allt(ckod)),0,8)
75
76 repl ckod with '31840'+padl(allt(pcislo),8,'0') for betw(val(pcislo),500000,599999) and betw(len(allt(ckod)),0,8)
77 repl ckod with '31840'+right(ckod,7) for betw(val(pcislo),500000,599999) and !empt(ckod) and ckod<>'31840' }}}
78
79 Je nutné zkontrolovat u VS, aby svazky měli **vyplněný **CKOD (viz výše) a poté **PIDKN **obsahovalo znak **˙ :**
80
81 |
82
83 {{{Kontrola:
84 pohled("SELECT * FROM svazky where ckod <> ' ' AND ckod not like 'prefixImportovaneREKSovky%' AND pidkn != '˙'")
85
86 Oprava:
87 pohled("UPDATE svazky SET pidkn = '˙' where ckod <> ' ' AND ckod not like 'prefixImportovaneREKSovky%' AND pidkn != '˙'")}}}
88
89 //Rozdíly oproti bodu 2.6.2 Import dat~://
90
91 1. **Díla:**
92
93 *
94 ** vybrat v roletce pro duplicity: Kontroluje duplicitu čárových kódů - duplicitní čárové kódy neimportuje a nepřidá je failed souboru
95 *** doporučuji použít až na druhý pokus a okem zkontrolovat, že jsou to opravdu duplicity s knihovnou, která už je na serveru
96
97 1. **Výpůjčky:**
98
99 *
100 ** Vybrat KPUJCKY_REKS a neimportovat KPUJCKY!
101
102 == Import dat v Tritiu, pokud v cílovém Tritiu není část svazků (např. Výměnné soubory) ==
103
104 === Založení knihovny v Tritiu ===
105
106 Je potřeba zaregistrovat novou knihovnu v Tritiu (Přihlášení do Tritia tlačítko Registrovat)
107
108 Při převádění REKSového Clavia nebo převádění knihovny, která má Carmen (Knihovna s REKSovkami - Clavius neobsahuje pouze jednu knihovnu) nedávat po registraci vytvořit webovou definici - vznikne naimportováním DEFWEB, kdy dojde k založení webové definice pro každou REKSovou knihovnu.
109
110 ~!!!Pokud se jedná o sdílený server, kde již běží knihovny na ostro, tak provést zálohu databáze, kdyby se něco zvrtlo co nedokáže [[Postup Odstranění importovaných dat>>url:https://confluence.tritius.cz/pages/viewpage.action?pageId=102925148]] vyřešit a bylo potřeba provést obnovení!!!
111
112 ~!!!Před zahájením zkontrolovat dostatek místa na disku VM!!!.
113
114 Kontrolu lze provést 2 způsoby:
115
116 1. přes putty pomocí příkazu df -h
117 1. v Zabixxu: Sledování → Obrazovky → VM Overview → Hostitel vybrat VM a podívat se na graf Disk space usage
118
119 === Import dat ===
120
121 Import REKS: nezapomenout **zamknout** slovníky (především klíčová slova, popřípadě dodavatele)
122
123 **POZOR!!!!**: kontrola na existenci A podpolí v Tritiu, které zbyli od minulého importu, pokud ano tak smazat před importem!:
124
125 |
126
127 {{{select count(*) from authority_data where subfield_definition in (
128 select id from subfield_definition where name_sub='A')
129
130 select count(*) from work_data where subfield_definition in (
131 select id from subfield_definition where name_sub='A')
132
133 dále:
134 Po zapnutí Importovacího módu nesmí tabulka import_id_backup obsahovat jediný řádek, který má ve sloupci library ID právě převáděné knihovny, tedy select * from import_id_backup where library = ID_prave_prevadene_knihovny musí vrátit 0 . }}}
135
136 * Pokud importuji do knihovny s defaultně jiným jazykem (slovenské knihovny) musím před importem správně nastavit **SYSTEM_DEFAULT_LANGUAGE **tak i** LOCALE.**
137 * Pokud se nejedná o multiknihovní instanci, nastavit v položkách nastavení **MULTI_LIBRARY_INSTANCE** na false ( -304 ) - musí se provést před importem vzkazů čtenářů.
138 * V záložce **Systém** je volba **Import dat**
139 * Spustí se importní mód - běžní uživatelé se do knihovny v importním módu nemohou přihlásit
140 * //Doporučení - naimportovat dump databáze na VM s Tritiem pod uživatelem root (import je řádově rychlejší)//
141 * URL spojení databázi Clavius SQL kde jsou výpůjčky :
142 ** Pro MySQL: **jdbc:mysql:~/~/server.lanius.cz:3306///<databaseName>//?useUnicode=true&characterEncoding=UTF-8&serverTimezone=Europe/Prague**
143 ** Pro MSSQL: **jdbc:sqlserver:~/~/192.168.0.24:1433;databaseName=//<databaseName>//**;SendStringParametersAsUnicode=False;
144 * Zadáte uživatele a heslo pro připojení do databáze a tlačítkem **Připojit** provedete spojení (po úspěchu se tlačítko změní na **Odpojit**)
145 * **Start import mode**
146 * Postupně procházíme jednotlivé záložky zleva do prava. Vynecháváme ty které nejsou vždy (akvizice, webový katalog Carmen)
147 ** **Záložka Definice** - vybrat postupně po jedné definiční tabulky a dejte **Importuj** vybrané tabulky (v případě opakovaného importu podruhé neprovádět !!!)
148 *** **Definici webů (DEFWEB)** importovat pouze pro REKSové knihovny (při převodu do sdílené knihovny je třeba založit ručně při registraci knihovny)
149 *** Pokud se nepodaří v případě knihovny, která má Carmen převést DEFWEB, tak stačí v Tritius založit ručně webovou definici a do import_id vyplnit ID, které se najde v databázi Clavia:
150 *** SELECT distinct defWebId FROM car_cloud;
151
152 *
153 ** //Doporučení - Pokud se jedná o převod větší knihovny, tak po importu větších dat (autorit, díla, poplatky, čtenáři, výpůjčky, ...) dělat zálohu databáze//
154 ** **Záložka Autority (u REKSovky zvážit neimportování!)**:
155 *** tlačítko Nahrát soubor nalistujeme **AUTORITY.TAG** a po jeho nahrání jej vybereme a dáme Importovat. Po importu jsou chybné, neimportované záznamy v souboru failed
156 ** Pokud je soubor velký desítky MB a nejde nahrát zkuste přímou adresu např.  : [[http:~~/~~/192.168.0.250:8080/Tritius/>>url:http://192.168.0.250:8080/Tritius/cz.effectiva.tritius.Application/Application.html#Import_wizard]]  takto obejdete Apache web server
157 ** **Záložka Díla a Svazky (u REKSovky zvážit ztitulování a neskládání autorit!):**
158 *** obsah složky **NAWEB** z Clavia (pokud existuje) - v průvodci importu dat je na záložce import děl tlačítko, které nahraje zabalenou složku (NAWEB.zip) do příslušné složky a rozbalí. (dříve - ručně nakopírovat do složky Tritia (\tritius\files\Clavius\WORK\NAWEB)
159 *** Pozor: zkontrolovat názvy souborů pokud obsahují mezery nebo znaky s diakritikou nedojde k propojení !!!
160 *** Typ importu duplicit - kontroluje duplicitu podle typu dokumentu a ISBN, popřípadě podle typu dokumentu, názvu, autora a roku (Zkontrolovat duplicity ISBN v TAGu)
161 *** Přes Nahrát soubor vybereme **DATA.TAG** a po jeho nahrání jej vybereme a dáme Importovat. Po importu jsou chybné, neimportované záznamy v souboru failed
162 *** Problémové záznamy v souboru failed, které se nenaimportovaly, je potřeba hned řešit tzn. **opravit a opakovaně importovat teprve pak se může pokračovat**!
163 ** **Čtenáři:**
164 *** Vybrat CTENARI nebo CTENARI_DO_VSECH_KNIHOVEN - neimportovat obě!
165 ** **MVS**
166 *** Lepší Vytvářet nové záznamy, aby nedocházelo k propojení rezervací na MVS.
167 ** **Záložka Výpůjčky**:
168 *** Vybrat KPUJCKY nebo KPUJCKY_REKS - neimportovat obě!
169 *** postupně po jednotlivých tabulkách importovat a v logu kontrolovat provedení.
170 *** **Poplatky **- způsob uhrazení (poplatek.kartou)
171 **** 0 - platba v hotovosti
172 **** 1, 2, 3, 4 - platba kartou
173 **** 5, 6, 7 - platba na účet
174 **** 8, 9 - platba kreditem
175 * //Odstranit z VM databázi Clavia, pokud byla naimportována do VM.//
176
177 === Odstranění importovaných dat ===
178
179 Pokud dojde během importu k problému s některou částí importu (kromě nastavení), tak ji lze smazat pomocí: [[Postup Odstranění importovaných dat>>url:https://confluence.tritius.cz/pages/viewpage.action?pageId=102925148]]
180
181 == Nastavení po importu ==
182
183 * **Před ukončením importního módu je třeba vytvořit zálohu databáze.**
184 * **Ukončit import mód - až v momentě, kdy jsou všechna data správně převedená! **(u velkého serveru může zastavení trvat i půl hodiny)
185 * Pokud se převáděla konfigurace výpůjčního protokolu je potřeba projít a opravit podmínky v následujících částek nastavení, jinak by spadla reindexace:
186 ** Kategorie operací
187 ** Pravidla registrací
188 ** Prohledávané oblasti
189 ** Definice webů - nastavit také výp. kategorii **Nezobrazovat na WWW** ((itemBorrowCategoryId IS NULL OR itemBorrowCategoryId <> 3)) - ID se liší podle převodu
190 * Na poslední záložce **Naplánované úlohy** spustit postupně od shora jednotlivé operace
191 ** u malé knihovny nečekat na dokončení a lze pustit od shora najednou
192 ** u velké knihovny pustit 1., 2., 3., počkat na dokončení a poté pustit 4. a po dokončení pustit 5. a po dokončení pustit 6.
193
194 == Závěrečné důležité operace ==
195
196 * **Restart Tomcatu pomocí tools** (vyčistí se paměť po importu) !!!(((
197
198 )))
199 * **Provést nastavení podle checklist!!!!**
200 * **Přečíst 2.1 Tipy a Triky na začátku stránky!**
201
202 = Regulární výrazy pro opravy dat =
203
204 Všechny nové regulární výrazy je třeba nejprve otestovat vývojářem - **ReplaceHelperTest**.
205
206 |(((
207 == Autority ==
208
209 |=Popis problému|=Regulární výraz|=Vstup|=Výstup|=(% colspan="1" %)Poznámka
210 | Pole 100 obsahuje podpole 4.|
211
212 {{{100\\ [\\ 0-9]{2}\\ \\$4.*}}}|
213
214 {{{100 1  $4070}}}| |(% colspan="1" %)Celé pole se zahodí.
215
216 | Obsahuje pole 1??|
217
218 {{{(1\?\?\ )(.*,.*)§100 $2}}}
219
220 {{{(1\?\?\ )(.*)§110 $2}}}|
221
222 {{{1??  $aAudoly, Sylvie}}}|
223
224 {{{100 $aAudoly, Sylvie}}}|(% colspan="1" %)Pokusí se rozpoznat zda se jedná o osobní jméno, nebo korporaci (pokud je osobní jméno, obsahuje hodnota čárku)
225
226 |(% colspan="1" %)Pole 1XXa je prázdné|(% colspan="1" %)
227
228 {{{^1??.*\\$a$}}}|
229
230 {{{199  $a}}}|(% colspan="1" %) |Odstraní se celé opakování pole
231
232 |(% colspan="1" %)Obsahuje pole 100 a 110|(% colspan="1" %)
233
234 {{{^110.*}}}|
235
236 {{{100 1 $aRoni, Luigi 110 2 $aRoni, Luigii}}}|
237
238 {{{100 1 $aRoni, Luigi}}}|(% colspan="1" %)Odstraní opakování pole 110
239
240 == Díla ==
241
242 |=Popis problému|=Regulární výraz|=Vstup|=Výstup|=(% colspan="1" %)Poznámka
243 |Odkazy na soubory v NAWEB obsahují před adresářem neplatné znaky.|
244
245 {{{(X00[\ ]{4}.*\$[uo]).*(NAWEB.*)(\$.*)§$1$2$3 (X00[\ ]{4}.*\$[uo]).*(NAWEB.*)§$1$2}}}|
246
247 {{{X00 $uW:\NAWEB\OBSAHY\N38492.pdf$tObsah$oNAWEB\2016_Knihy\N38492.jpg X00 $uW:\NAWEB\OBSAHY\N38492.pdf$tObsah$oW:\NAWEB\2016_Knihy\N38492.jpg X00 $uNAWEB\OBSAHY\N38492.pdf$tObsah$oW:\NAWEB\2016_Knihy\N38492.jpg X00 $oW:\NAWEB\OBSAHY\N38492.pdf$tObsah$uNAWEB\2016_Knihy\N38492.jpg X00 $oW:\NAWEB\OBSAHY\N38492.pdf$tObsah$uW:\NAWEB\2016_Knihy\N38492.jpg X00 $oNAWEB\OBSAHY\N38492.pdf$tObsah$uW:\NAWEB\2016_Knihy\N38492.jpg}}}|
248
249 {{{X00 $uNAWEB\OBSAHY\N38492.pdf$tObsah$oNAWEB\2016_Knihy\N38492.jpg X00 $uNAWEB\OBSAHY\N38492.pdf$tObsah$oNAWEB\2016_Knihy\N38492.jpg X00 $uNAWEB\OBSAHY\N38492.pdf$tObsah$oNAWEB\2016_Knihy\N38492.jpg X00 $oNAWEB\OBSAHY\N38492.pdf$tObsah$uNAWEB\2016_Knihy\N38492.jpg X00 $oNAWEB\OBSAHY\N38492.pdf$tObsah$uNAWEB\2016_Knihy\N38492.jpg X00 $oNAWEB\OBSAHY\N38492.pdf$tObsah$uNAWEB\2016_Knihy\N38492.jpg}}}|(% colspan="1" %)Odstraní znaky co nepatří před NAWEB.
250
251 |(% colspan="1" %)X00 odakzuje na adresář, který neexistuje z důvodu velikosti písmen na linuxu (velikost písmen se musí shodovat).|(% colspan="1" %)
252
253 {{{(X00[\ ]{4}\$[ou]NAWEB[\\/])OBSAHY([\\/].*)§$1Obsahy$2}}}|
254
255 {{{X00 $oNAWEB/OBSAHY/NC3404.pdf}}}|
256
257 {{{X00 $oNAWEB/Obsahy/NC3404.pdf}}}|(% colspan="1" %)Změna velikosti písmen "OBSAHY" → "Obsahy". Regulární příkaz se musí dát až za regulární příkaz opravující validnost cesty.
258
259 |(% colspan="1" %)Obsahuje pole ???.|(% colspan="1" %)
260
261 {{{^\?\?\?.*}}}|
262
263 {{{???  $aCzech Republic$eautomapa}}}|(% colspan="1" %) |Odstraní otazníkové pole.
264
265 |(% colspan="1" %)1XX4 nebo 7XX4 obsahuje neexistující kód role|(% colspan="1" %)
266
267 {{{(^[710]{3}.*)(\$4sut)(.*)§$1$3}}}|
268
269 {{{100 1  $A1000239919$aLiker, Jeffrey K.$7xx0031426$4sut}}}|
270
271 {{{100 1  $A1000239919$aLiker, Jeffrey K.$7xx0031426}}}|(% colspan="1" %)kód role z autority Neznámý kód role odstraní.
272
273
274 )))
275
276 ~{~{/html}}~{~{/html}}