Norme comuni/Linee guida sull'indicizzazione/Indicizzazione per soggetto/Gli strumenti

Da GuidaSBN.
Versione del 18 gen 2023 alle 13:59 di Marco Sferruzza (Discussione | contributi) (Il Nuovo soggettario: architettura e componenti)

Home > Norme comuni > Linee guida sull'indicizzazione > Indicizzazione per soggetto > Gli strumenti
4.2 Indicazioni metodologiche
Il titolo di questa voce non è corretto per via delle caratteristiche del software MediaWiki. Il titolo corretto è Norme per il trattamento di informazioni e dati comuni a tutte le tipologie di materiale.

4.1 Gli strumenti

Il Nuovo soggettario: architettura e componenti

Il Nuovo soggettario è un sistema integrato, composto da parti distinte ma complementari che concorrono a regolare l’attività di indicizzazione. Come illustrato nel seguente schema grafico[1], il sistema comprende:

  • il linguaggio documentario costituito dalle norme presenti in “Nuovo soggettario. Guida al sistema italiano di indicizzazione per soggetto” e dal vocabolario controllato costituito dal Thesaurus;
  • il corredo applicativo costituito dalle Note sintattiche che accompagnano alcuni termini del Thesaurus e dal Manuale applicativo;
  • il linguaggio applicato composto dall’insieme delle stringhe di soggetto, create secondo le norme e presenti nei cataloghi delle biblioteche che hanno adottato il Nuovo soggettario;

ComponentiNS.jpg

Il sistema del Nuovo soggettario è formato dalle seguenti componenti:

  • la Guida presenta le norme generali sia per il controllo del vocabolario sia per la costruzione delle stringhe da parte degli indicizzatori.
Le norme in essa contenute sono sviluppate a partire dalla Guida all'indicizzazione per soggetto a cura del GRIS (Digitalizzazione della ristampa 2001: ed. orig. 1996), dai principi e modelli concettuali IFLA e dagli standard ISO in materia[2].
  • Il Thesaurus: vocabolario controllato e strutturato di termini che costituiscono la base terminologica del linguaggio documentario. I termini sono collegati fra loro da relazioni semantiche e corredati da varie note. Il Thesaurus è accessibile on line dal 2007, con un'interfaccia utente aggiornata nel 2020, e con dati aggiornati ogni sei mesi (per il suo continuo incremento quantitativo vedi Novità). Dai termini preferiti è possibile navigare ai soggetti del catalogo BNCF e del catalogo SBN. In certi casi i termini sono collegati anche a risorse descritte in data base di archivi e musei.
Migliaia di termini presentano equivalenti in inglese, francese, tedesco, spagnolo previsti da analoghi strumenti di indicizzazione per soggetto e curati dalle biblioteche nazionali di altri Paesi.
I dati del Thesaurus sono aperti e disponibili in formati e protocolli standard nell’ottica del web semantico.
  • le Note sintattiche: insieme al Manuale applicativo, costituiscono il corredo applicativo del Nuovo soggettario per la costruzione delle stringhe di soggetto. Esse corredano alcuni termini del Thesaurus di cui indicano il corretto utilizzo, in applicazione delle norme del linguaggio.
  • il Manuale applicativo: periodicamente aggiornato, insieme alle note sintattiche del Thesaurus facilita l’applicazione delle regole generali; presenta approfondimenti di argomenti trattati nella Guida e problematiche relative a particolari aspetti o casistiche. Nel Manuale, i termini impiegati nelle stringhe degli esempi (a eccezione dei nomi propri) presentano un link diretto con i medesimi termini del Thesaurus. Reciprocamente, i termini del Thesaurus, se compresi fra gli esempi riportati nel Manuale, hanno un link che li collega ad esso.
  • le stringhe di soggetto: rappresentano il linguaggio del Nuovo soggettario applicato in modalità pre-coordinata. I termini preferiti del Thesaurus presentano, nella colonna di destra, collegamenti con i soggetti delle notizie bibliografiche dei cataloghi BNCF e SBN. Tramite la Bibliografia nazionale italiana disponibile on line è possibile, all’inverso, navigare dall’Indice soggetti dei fascicoli ai termini del Thesaurus.


Il principale riferimento del linguaggio del Nuovo soggettario è il modello analitico-sintetico (vedi Guida, § G) che distingue il piano della semantica da quello della sintassi:

  • piano semantico: relazioni ‘a priori’ (paradigmatiche) sulla base del significato dei termini, indipendentemente dai documenti. Si tratta di relazioni di equivalenza, gerarchiche, associative;
  • piano sintattico: relazioni ‘a posteriori’ (sintagmatiche), tipicamente fra gli elementi di una frase, relative al tema di base individuato dall’analisi concettuale del documento. Tali relazioni logiche fra i concetti influiscono sull’ordine di citazione dei termini che li esprimono all’interno delle stringhe di soggetto, in base alle norme sintattiche previste.

Impiego nell’indicizzazione

Il Nuovo soggettario può essere impiegato sia in modalità pre-coordinata, sia in modalità post-coordinata. I termini usati sono quelli nella forma preferita prevista dal Thesaurus o, nel caso di nomi propri, sono impiegati nella forma indicata nel Manuale applicativo[3].


  • Pre-coordinazione. I termini sono combinati dal catalogatore al momento della costruzione della stringa di soggetto, secondo le norme della sintassi del Nuovo soggettario. Questa modalità è da preferire in quanto garantisce il miglior livello di precisione e rilevanza dal punto di vista della ricerca dell’utente.
  • Post-coordinazione. I termini, comunque controllati nel Thesaurus, sono attribuiti singolarmente dal catalogatore, senza essere combinati fra loro: la combinazione dei termini potrà avvenire al momento della ricerca da parte dell’utente.
La post-coordinazione può costituire un’alternativa alla costruzione delle stringhe di soggetto. Dopo l’analisi concettuale e l’elaborazione dell’enunciato, i termini individuati per esprimerlo vengono collegati singolarmente e direttamente alla notizia bibliografica. La ricerca potrà risultare più onerosa perché non è garantito il principio dell’esaustività, con conseguenze sul piano della rilevanza e della precisione. In fase di ricerca, per limitare il ‘rumore’, i termini potranno essere abbinati con operatori logici e/o con altri termini aggiunti in funzione di raffinamento, pur senza la garanzia di raggiungere risultati soddisfacenti.
Qualora venga preferita questa modalità di indicizzazione per soggetto, i termini dovrebbero essere indicati in un campo apposito del catalogo espressamente dedicato, necessariamente da sviluppare anche nell’Indice SBN e anche con adeguamento della ricerca nell'Opac SBN.

Le due modalità di indicizzazione (pre-coordinata e post-coordinata) possono eventualmente integrarsi nell’ambito di particolari sistemi documentari, anche in uno stesso Polo SBN, ad esempio in relazione a diverse tipologie di risorse indicizzate o a particolari domini disciplinari.


  • Genere/forma. Questa modalità di indicizzazione non si riferisce al contenuto concettuale dell’opera ma ha come obiettivo di indicare la “forma” e/o il “genere” dell'opera stessa[4].
I termini attribuiti dovrebbero essere scelti fra quelli del Thesaurus e, anche in questo caso (come per eventuale indicizzazione post-coordinata) dovrebbero essere indicati in un campo apposito del catalogo da sviluppare anche nell’Indice SBN[5].
Sull’indicizzazione per genere/forma vedi il paragrafo F.3 della Guida.
L’indicizzazione genere/forma è una modalità particolarmente utile per biblioteche che indicizzano anche opere letterarie o artistiche.
L’impiego dell’indicizzazione per genere/forma non esclude la possibilità di una contemporanea indicizzazione pre-coordinata e/o post-coordinata.

Note

  1. Tratto dalla Guida, p. 59.
  2. ISO 5963/1985 Methods for examining documents, determining their subjects, and selecting indexing terms. Per il Thesaurus lo standard di riferimento attuale è l’ISO 25964, Thesauri and interoperability with other vocabularies diviso in 2 parti: Part 1: Thesauri for information retrieval (2011, confermato nel 2017) e Part 2: Interoperability with other vocabularies (2013, confermato nel 2018). L’ISO 25964 sostituisce i precedenti ISO 2788, Guidelines for the establishment and development of monolingual thesauri (1974 e 1986) e ISO 5964, Guidelines for the establishment and development of multilingual thesauri (1985).
  3. Vedi Manuale applicativo, paragrafo A.
  4. Su questo tipo di indicizzazione vedi la documentazione del Gruppo di lavoro IFLA: https://www.ifla.org/node/8526 e https://www.aib.it/aib/sezioni/emr/bibtime/num-xx-1-2-3/lucarelli.htm.
  5. Allo stato attuale, in fase di inserimento di “Titolo dell’opera” nella descrizione catalografica della notizia, è possibile inserire tra i codici di qualificazione quello relativo alla forma prevalente dell’opera che è desunto dalla traduzione italiana dell’Unimarc. Per l’elenco dei codici relativi alla forma dell’opera vedi qui.