Strumenti Utente

Strumenti Sito


catalog:schiacciamento_authority
Traduzioni di questa pagina:

Questa è una vecchia versione del documento!


Schiacciamento authority

Lo schiacciamento di authority permette di fondere una o più authority in un'unica altra authority.
Questa funzione di utilità permette di correggere velocemente situazioni di duplicazione, senza costringere a ricreare i legami ad authority o notizie.

Cancellazione dell'authority schiacciata

Al termine dello schiacciamento le authority schiacciate saranno permanentemente eliminate dal catalogo, rendendone impossibile il recupero a posteriori. Per questo motivo si consiglia di fare particolarmente attenzione nell'utilizzare questa funzione.

Il funzionamento di questa pagina è identico a quello della pagina per lo schiacciamento di notizie, con l'unica differenza che, oltre allo schiacciamento vero e proprio (per cui la sostituzione di una o più voci con un'altra), questa pagina permette anche di impostare le voci selezionate come forme varianti della voce d'autorità.
E' sufficiente che, una volta selezionate le voci da schiacciare, invece del pulsante Schiaccia, si prema il pulsante Imposta come varianti.

Innanzitutto bisogna scegliere la voce su cui si vuole schiacciare le altre voci di authority (1).

Una volta scelta l'authority, questa viene visualizzata in anteprima nella parte superiore della pagina. Il link rapido vai all'authority permette di andare alla voce ed eventualmente apportarvi delle modifiche.

Una volta certi della voce su cui schiacciare è sufficiente utilizzare la parte inferiore della pagina per ricercare (2) e selezionare (3) le voci da schiacciare.
Quindi è sufficiente cliccare il pulsante Schiaccia (4). Oppure imposta come varianti nel caso non si intenda cancellare le voci ma solamente impostare delle forme varianti.

Selezione delle authority

Anche se tra le voci selezionate per lo schiacciamento è presente la stessa voce su cui si sta effettuando lo schiacciamento, questa non verrà eliminata.

Cluster authority

Questa funzionalità consente di selezionare una o più tipologie di authority per individuare i candidati allo schiacciamento e procedere con la fusione o impostazione di varianti. Attraverso degli algoritmi che individuano delle similarità tra intestazioni vengono proposti dei cluster, ovvero dei raggruppamenti di elementi simili sui quali è possibile agire per la fusione o la gestione delle forme non preferite. Lo strumento è ispirato a OpenRefine, un software open source nato per il data cleaning.

Modifica delle authority

Al termine delle operazioni (di schiacciamento o impostazione di variante) le authority saranno permanentemente modificate. Per questo motivo si consiglia di fare particolarmente attenzione nell'utilizzare questa funzione.

Si inizia selezionando uno o più tipi di authority per i quali si vogliono vedere i cluster di elementi simili. A differenza della funzionalità di schiacciamento authority, qui è possibile agire anche su entità differenti, per esempio schiacciare argomenti e persone. Nel tipo record si può specificare se si tratta di una etichetta di nodo (indicazione che si trova nei termini tesaurali), di un termine accettato, apicale (sempre per gli elementi tesaurali)o di un termine non preferito. Se si vuole cercare in tutti i tipi di record basta non selezionare i valori di questa tendina. La chiave del cluster consente invece di scegliere l'algoritmo migliore per individuare le similarità:

  • algoritmo 1: prende le parole e le sequenze di numeri, scarta la punteggiatura, elimina i termini doppi tenendone solo uno ed ordina gli elementi in ordine alfabetico. Per esempio Manzoni, Alessandro <1923 - 1933> diventa alessandro manzoni 1923 1933;
  • algoritmo 2: funziona come il precedente ma esclude il testo tra parentesi uncinate, è pensato per normalizzare nomi di persona senza considerare gli elementi della disambiguazione;
  • algoritmo 3: prende in considerazione solo i termini numerici;
  • algoritmo 4: prende in considerazione solo i termini alfabetici escludendo i numeri, è pensato per gestire cluster senza considerare i dati numerici presenti nelle intestazioni.

Nel campo parole intestazione è invece possibile inserire i termini (o parte iniziale dei termini) che si vogliono ricercare

Quando vengono selezionate più authority queste vengono ricercate in OR, significa che si stanno cercando authority che appartengono almeno a un tipo tra quelli selezionati.

Dopo aver scelto i parametri per individuare i duplicati, i risultati si presentano come una lista, ciascun cluster può essere visualizzato nel dettaglio cliccando su espandi.

Nella colonna denominata corretta si sceglie la forma preferita dell'authority (1), poi si individuano le forme che si vogliono schiacciare o impostare come varianti selezionandole nella colonna chiamata duplicata (2). Infine si clicca sul pulsante schiaccia o imposta come varianti (3), a seconda del tipo di modifica che si vuole fare.

I numeri accanto alle diciture corretta e duplicate indicano gli identificativi univoci delle authority selezionate rispettivamente come corretta e da schiacciare o impostare come varianti.

catalog/schiacciamento_authority.1579788003.txt.gz · Ultima modifica: 23/01/2020 15:00 da camilla