Pretraga
Za pretragu HNK-a potreban klijentski program za pristup i pretraživanje korpusa Bonito.
Instalacija Bonita
Nakon preuzimanja Bonita za odgovarajući operacijski sustav (Windows, Linux/Unix/MacOs) sa njegovih službenih stranica (http://www.textforge.cz/download) potrebno ga je instalirati. Pod Windowsima treba raspakirati preuzetu ZIP datoteku u npr. c:\Program Files\Bonito, napraviti prečac na radnome stolu i pokrenuti ga. Za pokretanje pod Linuxom/MacOs-om potrebno je prethodno imati instaliran Tcl/Tk inačice 8.2 ili više.
Podešavanje Bonita
Pri prvom pokretanju Bonita, potrebno je podesiti parametre pristupa i korisničkih postavki.
Podešavanje parametara pristupa
Do podešavanja parametara pristupa dolazi se kroz izbornik Manager -> Connection:
Za vrijeme probnoga rada HNK-a v 2.0 korisničko ime će biti gost, a zaporku valja ostaviti praznom. Ukoliko je vaše računalo spojeno na Internet, pritiskom na OK priključujete se na poslužitelj HNK-a (u gornjem desnom kutu prozora otvorit će gumb s imenom polaznoga potkorpusa) i možete početi s radom.
Korisničke postavke
Do podešavanje korisničkih postavki dolazi se kroz izbornik Manager -> Options:
Ukoliko se želi zapamtiti postavke samo za vrijeme trenutačnoga odvijanja programa, onda treba potvrditi promjenu postavki pritiskom na Apply. Potvrdom na Save postavke se pamte za svako sljedeće pokretanje programa. Kad se ponovno pokrene Bonito, postavke će biti primijenjene.
Odabir korpusa
Prije pokretanja pretrage potrebno je odabrati željeni korpus ili potkorpus pritiskom na gumb u gornjem desnom kutu glavnoga prozora:
Jednostavne pretrage
Ulazni kriterij za pretragu tj. pronalaženje stožernice i dobivanje njezine konkordancije unosi se u redak New query na vrhu glavnoga prozora:
Otvaranjem strjelice na kraju unosnoga retka, dobiva se popis svih prošlih pretraga tako da ih nije potrebno nanovo utipkavati.
Primjeri jednostavnih pretraga:
- glava
daje konkordanciju stožernice glava - glavo luda
daje konkordanciju s dvije uzastopne riječi glavo luda kao stožernicom - glava benzinskoga motora
daje konkordanciju s tri uzastopne riječi glava benzinskoga motora kao stožernicom
Složene pretrage
Pretrage s regularnim izrazima
- glav.
daje konkordanciju svih riječi koje počinju s glav, a iza toga slijedi samo još jedno pisme - glav.*
daje konkordanciju svih riječi koje počinju s glav, a iza toga slijedi 0 ili više pismena - glav.+
daje konkordanciju svih riječi koje počinju s glav, a iza toga slijedi 1 ili više pismena - glav(a|e|i|u|o|om|ama)
daje konkordanciju svih riječi koje počinju s glav, a završavaju s nekim od završetaka
unutar zagrada - glava?
daje konkordanciju riječi glava i riječi kraće za posljednje pisme tj. glav - "glava" | "noga" | "ruka" ili [word="glava"] | [word="noga"] | [word="ruka"]
daje konkordanciju s tri različite stožernice: glava, noga, ruka
Tablica s primjerima uporabe osnovnih regularnih izraza
| Izraz | Opis | Primjer | Očekivani rezultati |
|---|---|---|---|
| . | točka zamjenjuje bilo koje pojedinačno pisme |
glav. | glava, glave, glavu |
| * | zvjezdica zamjenjuje nijedno, jedno ili više prethodnih pismena |
glav* | glav, glavv, glavvv, glavvvv, glavvvvv,... |
| + | plus zamjenjuje jedno ili više prethodnih pismena |
glav+ | glavv, glavvv, glavvvv... |
| {x} | vitičaste zagrade označavaju broj traženoga ponavljanja prethodnoga pismena |
glav.{3} | glavama, glavica, glavicu, glavice, glavici, glavara, glavare, glavari... |
| {x,y} | raspon u vitičastim zagradama označava raspon dopuštenih ponavljanja prethodnoga pismena |
glav{1,4} .{5,10} |
glav, glavv, glavvv, glavvvv svi nizovi duljine između 5 i 10 pismena |
| | | okomita crta označava logičku operaciju ili |
glava|ruka | glava, ruka |
| [ ] | uglate zagrade označuju skup ili raspon pismena iz kojeg je moguće birati razrješenja postave |
glav[aeiou] [g-k]lava |
glava, glave, glavi, glavo, glavu
glava, hlava, ilava, jlava, klava |
| ( ) | oble zagrade služe za grupiranje izraza |
(G|g)lava ([Gg]|[Pp])lava |
Glava, glava Glava, glava, Plava, plava |
| (?i) | ovaj izraz služi za zanemarivanje razlike između velikih i malih slova | (?i)glava | Glava, glava |
Ukoliko se u upitu želi upotrijebiti točka ., plus +, zvjezdica *, oble ( ), vitičaste { } ili uglate [ ] zagrade, svakome od tih pismena mora prethoditi \ čime se ta pismena tumače doslovno, a ne kao dio metajezika regularnih izraza.
Pretrage sa strukturnim oznakama u tekstu
- <head> "glava"
daje konkordanciju riječi glava kad se nalazi na samom početku bilo kojeg naslova - "glava" within <head>
daje konkordanciju riječi glava kad se nalaze bilo gdje unutar bilo kojeg naslova - "glava" within <head type="pn">
daje konkordanciju riječi glava kad se nalaze unutar naslova vrste "pn" tj. podnaslova - <head> "[0-9]+"
daje konkordanciju brojeva na samom početku svakoga naslova - ".*ba" </head>
daje konkordanciju svih riječi koje završavaju na -ba na samom kraju svakoga naslova
Popis u korpusu uporabljenih strukturnih oznaka dostupan je kroz izbornik Corpus -> Information summary ili pokratom (ctrl+I):
Pretrage s lemom ili gramatičkim kategorijama
Napomena: Ovakva vrsta pretrage bit će dostupna za čitav HNK tek u HNK v 2.5 najavljenom za proljeće 2006. Za sada je to moguće isprobavati jedino na cw2000 potkorpusu.
- [lemma="glava"]
daje konkordanciju svih oblika leme glava - [msd="Ncm.*"]
daje konkordanciju svih oblika svih općih (c) imenica (N) muškoga roda (m) - [msd="Af.*"] [lemma="glava"]
daje konkordanciju svih oblika leme glava kad je ispred neki neposvojni (f) pridjev (A) - [msd="S.*"] [msd="Nc..g"]
daje konkordanciju svih prijedloga (S) iza kojih slijedi opća (c) imenica (N) u genitivu (g)
Za objašnjenje i točan opis kratica za gramatičke kategorije tj. morfosintaktičkih oznaka (MSD-ova) pogledati na službene stranice MulTextEast preporuka.
Popis u korpusu uporabljenih naziva za atribute pojavnica (lema, gramatičke kategorije itd.) dostupan je kroz izbornik Corpus -> Information summary ili pokratom (ctrl+I) (vidi sliku iznad).
Prikaz dodatnih obavijesti u konkordancijama
U konkordancijama je moguće osim samoga teksta prikazati i kraticu izvornika, atribute pojavnice, strukturne oznake.
Prikaz kratice izvornika
Do prikaza kratice izvornika dolazi se kroz izbornik View -> References ili pokratom F4.
U HNK-u izvornik je kodiran referencijom na doc.file tako da treba odabrati tu ponuđenu referenciju. Kratica izvornika bit će prikazana na početku svakoga konkordancijskoga retka u zelenoj boji.
Prikaz atributa pojavnice
Do prikaza atributa pojavnica dolazi se kroz izbornik View -> Attributes ili pokratom F5.
U HNK-u atributi su kodirani nazivima lemma za leme i msd za gramatičke kategorije. Odabirom željenih atributa oni se prikazuju samo uz stožernicu (Only in KWIC) ili uza sve pojavnice u konkordanciji (For all positions).
Prikaz strukturnih oznaka
Do prikaza strukturnih oznaka dolazi se kroz izbornik View -> Structures ili pokratom F6.
Za odabir su ponuđene sve u korpusu uporabljene strukturne oznake, a u konkordanciji su prikazane zelenom bojom.
Ispisivanje i spremanje konkordancije
Konkordancije je moguće ispisati na papir (Concordance -> Print) ili spremiti u datoteku (Concordance -> Save to file ili pokrata F2). Ukoliko ispisujete na pisač, valja znati da Bonito automatski odabire polazni pisač i sve njegove polazne vrijednosti bez mogućnosti njihova podešavanja (ovisno o veličini postavljene konkordancijske okoline, to često mora biti pisač i papir veličine A3). Stoga postoji mogućnost spremanja konkordancije u datoteku i njezina otvaranja i preoblikovanja u nekom drugom programu.
Pri spremanju u datoteku, preporučljivo je odabrati utf-8 kodiranje pismena jer se time omogućuje potpuno očuvanje različitih pismovnih skupova. To univerzalno kodiranje danas mogu otvarati gotovo svi programi za uređivanje teksta.
Dokumentacija uz Bonito
Dodatne mogućnosti programa Bonito možete pregledati u njegovu priručniku koji se u HTML obliku poziva kroz izbornik Help -> Documentation. Također je dostupan priručnik i u PDF obliku u podmapi doc mape u koju je Bonito instaliran (npr. c:\Program Files\Bonito\doc).
