Obsah Dal¹í Pøedchozí

1 Úvod

Softwarový projekt Vyhledávání v plných textech (dále Agent) byl zahájen v roce 1997 s úmyslem vytvoøit jednoduchý, kvalitní, spolehlivý nástroj pro orientaci v rozsáhlých databázích textù. Mezi jeho hlavní pøednosti má patøit modularita, snadná roz¹iøitelnost o dal¹í moduly, ¾ádné principiální omezení velikosti zpracovaných dat a pou¾ití moderních a souèasnì perspektivních technologií na poli informaèních systémù - Java, multithreading, komunikace prostøednictvím Internetu. Pro implementaci byla zvolena platforma Win32. Dùvodem k tomuto kroku byly pøedev¹ím pøedchozí zku¹enosti èlenù týmu s programováním na této platformì a v neposlední øadì také dostupnost kvalitních vývojových prostøedkù.

1.1 Specifikace

Systém vyhledávání v plných textech Agent má slou¾it libovolnému u¾ivateli, bez nutnosti jeho pøedchozího za¹kolení, k získávání informací o dokumentech ulo¾ených v databázi systému pomocí jednoduchého, srozumitelného jazyka. Jazyk musí být natolik srozumitelný, aby k sestavení dotazu, pøi vyu¾ití v¹ech prvkù jazyka, staèilo nepouèenému u¾ivateli pouze nìkolikaminutové seznámení s referencí jazyka.

U¾ivatel mù¾e k systému pøistupovat prostøednictvím klientského programu z libovolného poèítaèe pøipojeného k hostitelskému stroji sítí s protokoly TCP/IP, pøípadnì pøímo lokálnì z hostitelského poèítaèe. Maximální poèet souèasnì pøipojených u¾ivatelù lze nastavit pøed spu¹tìním systému a jeho horní mez je stanovena schopnostmi hostitelského poèítaèe èi nastavením jeho OS.

Systém Agent velice jednoduchým zpùsobem øe¹í i pøístupová práva u¾ivatelù. Bì¾ný u¾ivatel má mo¾nost vyu¾ít funkce vyhledání dokumentù podle svého dotazu. Výsledky mù¾e ulo¾it do schránky nebo otevøít stránku ve Webovském browseru. Administrátor smí navíc pomocí administrátorského klientského nástroje pøidat dokumenty do databáze, odebrat je, ovlivnit databázi termù, spou¹tìt reorganizaci databázových souborù (za plného provozu systému), pøidávat a ubírat databáze a dal¹í administrativní úkony. K administraci systému Agent je zapotøebí obecná znalost funkce DIS (dokumentografických informaèních systémù) a seznámení se s konfiguraèními mo¾nostmi systému Agent. Administrátor smí provádìt èást akcí za plného provozu systému Agent, sní¾í tím ov¹em propustnost systému pro dotazy. Administrátor se na systém pøipojuje lokálnì i vzdálenì. Poèet souèasnì pøipojených administrátorù je limitován poètem povolených u¾ivatelù.

Celý systém Agent je øe¹en modulárnì tak, aby libovolná èást mohla být nahrazena jinou, která splòuje pøedepsaná rozhraní pro ten který modul, bez vlivu na funkènost ostatních modulù. Je tedy mo¾né doplnit èi nahradit filtry pro konverzi dokumentù, zmìnit vzhled a mo¾nosti klientských programù, doplnit bezpeènost a u¾ivatelské úèty, pøidat thesaurus, zavést výpoèty statistiky, vylep¹it lematizaci, pou¾ít relaèní, distribuovaný, èi jiný databázový systém na uchovávání informací o dokumentech nebo vylep¹it výpoèty podobnosti dokumentù.

Systém Agent neklade ¾ádné omezující podmínky na velikost vkládaných dokumentù, poèet ulo¾ených dokumentù ani délku dotazù. Zatím není ov¹em s ohledem na pilotní vyu¾ití vícevláknové architektury optimalizován na rychlost. Agent je urèen pro prostøedí OS Windows 95/98 a WindowsNT 4.0, èemu¾ musí odpovídat i hardware hostitelského poèítaèe. Klientské nástroje jsou urèeny pro platformu Java 2.

Systém Agent nezná pojem transakce a neprovádí zápisy do ¾urnálu, proto jediným spolehlivým zpùsobem zaji¹tìní dat pøed po¹kozením pøi nestandardní situaci je zálohování databázových souborù. K po¹kození souborù mù¾e dojít pouze pøi havárii v dobì vykonávání administrátorských operací, pøi kterých se zapisuje na disk. Systém neprovádí statistiku pøístupu k dokumentùm ani nesleduje zatí¾ení systému.

1.2 Úèastníci projektu

Vedoucí Projektu: RNDr. Jan Hric  
Èlenové týmu: Tomá¹ Foltýnek TF
Jaroslav Gergiè JG
Pavel Krtièka PK
Robert Macháèek RM
Václav Pech VP
Roman Slavík RS
Radek Weisfeit RW

1999-02-28 Vaclav Pech