Obsah Dal¹í Pøedchozí

9.4 Pøíruèka administrátora

Tato kapitola poskytuje informace pøípadnému administrátorovi serverù systému Agent. Popisuje, zvolenou koncepci konfigurace a pøehledným zpùsobem ukazuje, jak lze systém Agent konfigurovat a parametrizovat.

Tato kapitola nepopisuje tu èást konfigurace, kterou je mo¾né provádìt prostøednictvím klienta. Tyto informace naleznete v kapitole Pøíruèka u¾ivatele (9.3).

V následujících odstavcích se nejprve seznámíme s koncepcí konfigurace serverù systému Agent a s jejími mo¾nostmi (9.4.1). Dále bude struènì uveden pøehled typù konfiguraèních souborù, které jsou nutné pro bìh serverù systému Agent (9.4.2). V dal¹í èásti budou rozebrány vztahy mezi konfiguraèními soubory (9.4.3). A na závìr uvedeme pøehled parametrù dùle¾itých konfiguraèních souborù spolu s odkazy na ty èásti dokumentace, kde lze nalézt v pøípadì potøeby dodateèné informace ke konfiguraci serverù (9.4.4).

9.4.1 Mo¾nosti a koncepce konfigurace

Konfiguraèní informace serverù systému Agent jsou ulo¾eny v textových (ASCII) souborech. Tato volba byla uèinìna pro flexibilnost tohoto zpùsobu ulo¾ení dat. Konfiguraèní soubory je mo¾né prohlí¾et a editovat témìø jakýmkoliv editorem textù.

Jeliko¾ systém Agent je svou podstatou modulární systém, nejevilo se vhodné ani výhodné umístit ve¹keré konfiguraèní informace na jedno místo, napøíklad do jednoho souboru. Namísto toho respektuje ulo¾ení konfiguraèních informací modulárnost systému. To znamená, ¾e ka¾dý modul ukládá svoje konfiguraèní parametry do svého separátního souboru (nebo mno¾iny souborù). Na druhou stranu bylo vhodné urèitým zpùsobem podchytit hierarchii tìchto modulù. To bylo uèinìno tím, ¾e pro ka¾dý server existuje jeden koøenový konfiguraèní soubor, obsahující kromì parametrù serveru i odkazy (ve formì cest k souborùm èi adresáøùm) na konfiguraèní soubory podøazených modulù. Je samozøejmé, ¾e podobné vìtvení je mo¾né i na dal¹ích úrovních, tak¾e konfigurace serveru mù¾e tvoøit stromovou strukturu.

Toto øe¹ení pøiná¹í dvì výhody. Za prvé lze s pomocí rùzných koøenových konfiguraèních souborù pro daný server vytvoøit pøístupové body ke zcela odli¹ným konfiguracím v¹ech modulù serveru. Zároveò je v¹ak mo¾né mezi rùznými konfiguracemi serverù sdílet nìkteré konfiguraèní soubory a u¹etøit si tak práci s jinak èasovì nároèným udr¾ováním nìkolika podobných konfigurací.

9.4.2 Typy konfiguraèních souborù

Konfiguraèní soubory pro jednotlivé moduly se li¹í syntaxí i strukturou. Ka¾dý modul pou¾ívá takovou formu zápisu, která je pro nìj nejvhodnìj¹í. V rámci serverù systému Agent rozli¹ujeme následující typy konfiguraèních souborù.

n-tice <klíè, hodnota>
Tento typ pou¾ívají napøíklad koøenové konfiguraèní soubory. Na ka¾dém øádku souboru je ulo¾en jeden pár <klíè, hodnota>. Klíè a hodnota jsou oddìlený znakem '=' (rovnítko). Klíè musí být v rámci souboru unikátní.
seznam pravidel pro vytvoøení automatu
Tento druh konfiguraèních souborù pou¾ívá parser dotazovacího a manipulaèního jazyka ve vyhledávacím i sí»ovém serveru. Pøíslu¹ný soubor obsahuje gramatiku jazyka, který je pøijímán rozhraním daného serveru. Na ka¾dém øádku souboru je uvedeno jedno pravidlo gramatiky. Tento soubor nemá smysl editovat èi mìnit, proto¾e na základì této gramatiky je zalo¾ena èást kódu serverù. Jeho editací nebo znièením je mo¾né naru¹it chod daného serveru.
seznam pravidel pro aplikaci filtrù
Tento druh konfiguraèních souborù je pou¾íván mana¾erem indexovacích a vyhledávacích filtrù. Zmìnami tohoto souboru lze mìnit mno¾inu a poøadí vstupních filtrù i pravidla pro jejich aplikaci.
konfiguraèní parametry filtrù
Sem øadíme celou skupinu formátù konfiguraèních souborù pou¾ívaných indexovacími a vyhledávacími filtry. Ka¾dý druh filtru mù¾e pou¾ívat svùj vlastní formát konfiguraèního souboru.
seznam databází
Tento soubor obsahuje seznam v¹ech databází, které lze pou¾ívat z daného serveru. Ka¾dá databáze zabírá v¾dy dvojici øádkù. Na prvním je jméno databáze (musí být v rámci daného serveru unikátní) a na dal¹ím je cesta k adresáøi dané databáze. Ka¾dá databáze musí být v samostatném adresáøi.
seznam u¾ivatelù
Soubor obsahuje seznam zavedených u¾ivatelù a kód jejich pøístupových práv. Ka¾dý øádek tvoøí záznam jednoho konkrétního u¾ivatele. První èást záznamu je u¾ivatelské jméno, druhá èást heslo (v nezakódované podobì) a tøetí èást kód pøístupových práv (1 - u¾ivatel, 2 - administrátor). Jednotlivé èásti jsou oddìleny znakem ' ' (mezera).
konfigurace sezení
Zde jsou ulo¾eny parametry sezení. Tento soubor není urèen k ruènímu editování, nýbr¾ je vygenerován prostøednictvím klientské aplikace (AdminAgent) na základì nastavení provedeného administrátorem systému.
 

9.4.3 Hierarchie konfiguraèních souborù

Jak vyplývá ze zvolené koncepce konfiguraèních souborù a architektury systému Agent, servery systému mají celkem dva koøenové konfiguraèní soubory. Jeden pro vyhledávací server (search_svr) a jeden pro sí»ový server (net_svr). V následující èásti popí¹eme postupnì obì konfiguraèní hierarchie pro oba servery. Jedná se de facto o konkrétní pøíklad takových hierarchií. Administrátor systému mù¾e samozøejmì zmìnit názvy a umístìní nìkterých souborù, nicménì struktura musí být zachována.

Sí»ový server (search_svr)

Vyhledávací server (net_svr)

9.4.4 Pøehled parametrù konfiguraèních souborù serverù

search_svr.cfg

port udává na kterém portu má search_svr naslouchat pro pøipojení klientù
thread_pool_size nastavuje poèet vláken, která budou konkurentnì zpracovávat po¾adavky klientù
database_path adresáø ve kterém se mají vytváøet nové databáze
document_filter_config konfiguraèní soubor s pravidly pro filtraci indexovaných dokumentù, více o konfiguraci modulu FilterManager lze nalézt v kapitole Vstupní filtry (5.2.3)
query_filter_config konfiguraèní soubor s pravidly pro filtraci dotazù, více o konfiguraci modulu FilterManager lze nalézt v kapitole Vstupní filtry (5.2.3)
asystem_path cesta k seznamu databází, hledá se soubor asystem.dat
parser_aut seznam pravidel pro vytvoøení automatu
dll_filter_path cesta k adresáøi obsahujícímu filtry
dll_config_path cesta k adresáøi obsahujícímu konfiguraèní soubory filtrù, více o konfiguraci jednotlivých filtrù lze nalézt v kapitole Vstupní filtry (5.2.3)
max_query maximální poèet dokumentù, které má vyhledávací server vracet v odpovìdi na dotaz.

database.cfg

clusters_min_update_similarity minimální podobnost centra shluku a vkládaného dokumentu nutná pro vlo¾ení dokumentu do shluku sdru¾eného pod daným centrem
clusters_min_search_similarity minimální podobnost centra shluku a dotazu nutná k dal¹ímu prohledávání shluku sdru¾eného pod daným centrem
clusters_min_result_similarity minimální podobnost dokumentu k dotazu nutná pro jeho zaøazení do výsledku
clusters_search_buffer ovlivòuje ¹íøku prohledávání shlukù
min_term_frequency minimální relativní èetnost termu vzta¾ená k nejèastìj¹ímu termu v daném dokumentu nutná pro pøiøazení termu k dokumentu v databázi
max_term_frequency maximální relativní èetnost termu vzta¾ená k nejèastìj¹ímu termu v daném dokumentu nutná pro pøiøazení termu k dokumentu v databázi

net_svr.cfg

port udává na kterém portu má search_svr naslouchat pro pøipojení klientù
thread_pool_size nastavuje poèet vláken, která budou konkurentnì zpracovávat po¾adavky klientù
search_svr_host adresa vyhledávacího serveru, ke kterému se má sí»ový server pøipojit
search_svr_port port na kterém daný vyhledávací server bì¾í
session_config konfiguraèní soubor obsahující parametry sezení
user_config konfiguraèní soubor obsahující databázi u¾ivatelù
parser_aut seznam pravidel pro vytvoøení automatu
max_users maximální poèet u¾ivatelù pøipojených najednou k sí»ovému serveru
max_history maximální poèet výsledkù (odpovìdí na dotazy), které má sí»ový server ke¹ovat

session.cfg

1. øádek jméno pracovní databáze
2. øádek pracovní jazyk
3. øádek timeout v minutách
4. øádek poèet dokumentù vracených v jedné dávce odpovìdi
5. øádek seznam podporovaných kódování oddìlených mezerou
6. øádek seznam podporovaných jazykù oddìlených mezerou
7. øádek seznam podporovaných formátù souborù oddìlených mezerou

1999-03-04 Jaroslav Gergic