| 2-byte
Un byte di informazione è composta
da otto 0 o 1 (chiamati anche bit). Otto bit possono
essere disposti secondo 256 schemi unici, come ad
esempio 01001010. Ogni carattere di un font è
associato nel computer a un singolo numero di identificazione
o byte a cui fa riferimento il sistema operativo.
Una mappa caratteri di 1 byte è più
che sufficiente per la maggior parte dei font, dato
che i set di caratteri di quasi tutte le lingue
occidentali ne
contengono molti meno di 200. I caratteri di alcune
lingue, tuttavia, richiedono codifiche a due byte (ad
esempio il cinese, coreano e giapponese).
Due byte sono composti
da sedici 0 o 1, che possono disporsi in ben 65.536
schemi unici.
ActiveX
Insieme di tecnologie che consente l'interazione
tra componenti software in un ambiente di rete,
indipendentemente dal linguaggio utilizzato per
la creazione dei componenti.
Allineamento
Operazione di individuazione di segmenti di testo
corrispondenti in documenti originali e tradotti
ai
fini dell'importazione come coppie di frasi in una
memoria di traduzione. L’allineamento richiede
la disponibilità del documento sorgente (originale)
e finale (traduzione) in formato elettronico.
Applicazione (v. programma)
American Standard Code for Information
Interchange (ASCII)
Schema standard di codifica dei caratteri a
byte singolo utilizzato per i dati basati su
testo. Il sistema ASCII utilizza combinazioni
numeriche da 7 o 8 bit per consentire rispettivamente
la rappresentazione di 128 o 256 caratteri.
Le combinazioni a 7 bit vengono utilizzate
per rappresentare tutte le lettere maiuscole
o minuscole, i numeri da 0 a 9, i segni di
punteggiatura e i caratteri speciali di controllo.
I sistemi basati su processore x86 più recenti
supportano l'uso dello standard ASCII esteso.
Lo standard ASCII esteso consente di utilizzare
l'ottavo bit di ciascun carattere per identificare
ulteriori 128 caratteri speciali, lettere di
lingue straniere e simboli grafici.
(v. anche Unicode).
Base terminologica
Database terminologico, in una o più lingue
straniere. Il record di ciascun termine presenta
campi
che ne definiscono il concetto associato, forniscono
traduzioni adatte all'area tematica, informazioni
sulle fonti, utilizzo del lemma, ecc.
Browser
Software in grado di interpretare i tag presenti
nei file HTML e di formattare tali file come
pagine Web, visualizzandoli all'utente finale.
Alcuni browser consentono inoltre agli utenti
finali di inviare e ricevere posta elettronica,
leggere newsgroup e riprodurre file audio e
video incorporati nei documenti Web.
Carattere
Un concetto unitario di tipo fonetico,
sillabico o ideografico. Ad esempio, una q minuscola
e una
Q
maiuscola sono due caratteri diversi (vedi glyph).
Possiamo dividere i caratteri in 4 grandi famiglie
(serif, sans-serif,
calligrafici e simbolici o fantasia). Sicuramente
le più importanti
sono le prime due, che a loro volta si suddividono
in innumerevoli sottocategorie. I principali formati
dei caratteri utilizzati in sistemi informatici sono
TTF, Type1, PostScript, ATM e OpenType
Il formato PostScript
Il formato PostScript é un formato
vettoriale di immagine creato per la stampa; questo
formato è stato il primo - nei sistemi informatici
- a permettere di descrivere in modo vettoriale
e quindi
più
preciso e meglio scalabile un font, un riempimento
od una immagine al tratto ad una stampante PostScript
in grado di comprenderlo e passarlo su carta.
Il formato Type1
Il formato Type1 è un formato vettoriale
di font, basato sulla tecnologia Postscript e rivolto
inizialmente alla sola stampa. Il sistema è
stato integrato subito da Apple; i Macintosh sono
quindi i primi computer ad aver avuto a disposizione
un così potente e versatile mezzo di stampa.
Il formato TrueType
Il formato TrueType è un formato
vettoriale; nella sua versione per Mac è
nato per contrastare il monopolio di Type1. Microsoft
lo ha integrato nei suoi sistemi operativi, rendendone
possibile anche la visualizzazione corretta sullo
schermo. Il supporto TrueType in Windows è
infatti in grado di gestire il font, convertendolo,
a seconda dell'uso a cui è destinato, nei
formati più adatti per essere visualizzato
al meglio, sia su schermo che in stampa.
Il formato ATM
Il formato ATM (che prende il nome da Adobe
Type Manager, il software che lo gestisce) è
un'evoluzione di Type1 che, tramite un'ulteriore
file, permette una visualizzazione di qualità
sullo schermo di tutti i font Type1 che, prima d'allora,
erano visibili correttamente solo in stampa. ATM
va quindi a braccetto con Type1 su tutti i Mac,
e verrà rilasciato per Windows solo molto
tempo più avanti. Type1, rispetto a TrueType
ha alcuni vantaggi nella precisione e nella rapidità
di stampa verso stampanti PostScript,
Il formato OpenType
Il formato OpenType
è un formato vettoriale, nato prima di tutto
dall'idea di unificare finalmente i due formati
Type1 e TrueType. Capace di essere visualizzato
e stampato correttamente sia dalle stampanti PostScript
che da quelle di altro tipo, il formato OpenType
ha inoltre meccanismi di 'intelligenza' (simili
al sistema di hinting) che scelgono la versione
più adatta del carattere a seconda del testo
circostante, o si occupano di convertire o meno
una serie di caratteri in un unico simbolo (ad esempio,
sostituire 1/2 con ½). Fortunatamente, con
il crescere del supporto OpenType nelle moderne
applicazioni di grafica, la lunga guerra di formati
che ha caratterizzato la storia della tipografia
digitale sembra essere finalmente terminata, grazie
alla creazione di un unico standard, OpenType.
Caratteri estesi
Ognuno dei 128 caratteri aggiuntivi
del set di caratteri estesi ASCII a 8 bit. Tali caratteri
includono quelli di numerose lingue diverse dall'inglese,
ad esempio i caratteri accentati e i simboli speciali
utilizzati per la creazione di immagini.
CSS
Acronimo di Cascade Style Sheets (Fogli di Stile
a Cascata).
Sono delle regole di definizione e modifica dello
stile (grafico, visivo, di stampa, vocale, etc) di
un documento HTML e dei suoi componenti strutturali.
Consentono in pratica di definire e modificare lo
stile di un font, di uno sfondo, la posizione di
un
testo, una tabella, un'immagine etc. senza "sporcare" il
codice HTML.
Code page
Tabella caratteri; insieme ordinato di caratteri
in cui a ciascun carattere è associato un
indice numerico.
Deliverable
Il risultato, misurabile e verificabile,
di un progetto o di una fase di esso. Elenco terminologico
Elenco di termini, di norma bilingue, con coppie di
termini nella lingua di partenza e di arrivo. File
di testo di o TBX di strumenti di gestione terminologica.
Di norma in formati di file con valori separati da
virgola o tabulazione utilizzabili con un foglio elettronico.
Enabling
Predisposizione di un prodotto software alla localizzazione.
Exact match
v. full match
Font
v. caratteri
Full match
Frase conservata in una memoria di traduzione che
corrisponde esattamente a una stringa di ricerca.
Fuzzy match
Frase conservata in una memoria di traduzione che
corrisponde solo parzialmente a una stringa di ricerca.
Glyph
Variante particolare di un carattere. Ad
esempio: Q e Q sono lo stesso carattere Q maiuscola,
ma sono glyph diversi.
Globalizzazione
Processo di sviluppo, produzione e distribuzione
del software su scala mondiale. Combinazione dei
processi
di internazionalizzazione (enabling) e localizzazione.
Glossario
Elenco alfabetico di termini con significati e interpretazioni
corrispondenti in una serie di contesti. Nella traduzione/localizzazione,
può trattarsi semplicemente di un elenco terminologico
bilingue o multilingue; spesso confuso con "dizionario".
GUI
Acronimo di Graphical User Interface. E’ il
componente software che l’utente vede sul
monitor del PC e che consente di dialogare ed utilizzare
un sistema operativo o un applicativo.
Help online
Una documento elettronico generalmente associato
ad applicativi e programmi software, visualizzabile
online. Gli Help online (aiuti in linea) sono sensibili
al contesto e consentono agli utenti di ottenere informazioni
sulla funzione che stanno utilizzando. L’accesso
avviene sia facendo clic con il mouse sia premendo
un tasto specifico.
HTML
HTML è l'acronimo di Hypertext Markup Language "Linguaggio
di contrassegno per gli Ipertesti".
Si tratta di un linguaggio di contrassegno o 'di
marcatura', che permette di indicare come disporre
gli elementi all'interno di una pagina: le indicazioni
vengono date attraverso degli appositi marcatori,
detti "tag".
IME
Acronimo di Input Method Editor.
Metodo per l’immissione di un carattere nel
computer. Normalmente implica l’uso di una tastiera,
ma può anche implicare un sistema di riconoscimento
di testi manoscritti o vocale.
Consente - ad esemoio - di digitare le migliaia di
caratteri di cui si compongono le lingue asiatiche
tramite una tastiera standard con 101 tasti.
Internazionalizzazione (I18N)
Anche globalizzazione o enabling; progettazione
e sviluppo di un prodotto software in modo da renderne
possibile il funzionamento locale.
Installazione
Con riferimento al software, aggiungere
file e cartelle di programma al disco rigido e i
relativi dati al
Registro di sistema in modo che il software venga
eseguito correttamente. L'installazione è diversa
dall'aggiornamento, in quanto quest'ultimo si riferisce
a file di programma, cartelle e voci del Registro
di sistema che vengono aggiornati a una versione
più recente.
Con riferimento all'hardware, collegare
fisicamente una periferica al computer, caricare i
driver di
periferica nel computer e configurare le impostazioni
e le proprietà della periferica.
Kit di localizzazione
Comprende tutti gli strumenti, i file
sorgente e binari e il materiale verificato con
il cliente,
ogni tipo di supporto utile (tra cui glossari
e memorie di traduzione) e la documentazione di
progetto
(istruzioni,
checklist, ecc.).
Script latino
I caratteri usati dall’inglese e da tutte le
altre lingue dell’Europa occidentale. Da non
confondersi con caratteri a 1 byte, dato che molte
altre lingue quali quelle dell’Est europeo,
o i caratteri di tipo cirillico, arabo, ebraico e
indiano usano anch’essi codifiche a 1 byte.
Locale
Insieme di convenzioni prodotte o interessate da
lingua e costume di una particolare area geo-politica.
Località
L’impostazione di un computer che definisce
le convenzioni utilizzate in un determinato paese.
Può comprendere la lingua usata per IME e sillabazione,
il formato di data, ora, valuta, numeri radicali e
separatori, eccetera.
Localizzabilità
Livello di localizzazione cui è possibile condurre
un prodotto software.
Localizzazione (L10N)
Modifica di un prodotto software in modo da adattarlo
alla cultura e alle convenzioni del paese di destinazione.
MARTIF
Machine-Readable Terminology Interchange Format; formato
aperto di scambio per basi terminologiche basato su
SGML.
Memoria di traduzione
Database di stringhe di testo (dette segmenti)
associate in coppie linguistiche estratte dai documenti
elaborati con le relative applicazioni e conservate
in funzione di un loro riutilizzo. I documenti da
tradurre vengono segmentati e i vari segmenti messi
a confronto con quelli conservati nel database.
PostScript
Linguaggio di descrizione della pagina (PDL, Page-Description
Language) sviluppato da Adobe Systems per la stampa
su stampanti laser. Il linguaggio PostScript offre
funzionalità flessibili di gestione dei
tipi di carattere e per la riproduzione grafica
di alta qualità. Il linguaggio PostScript è lo
standard nel settore del desktop publishing, in
quanto è un formato supportato dalle fotounità,
ovvero le stampanti ad alta risoluzione utilizzate
nei servizi tipografici commerciali.
Programma
Set di istruzioni completo e indipendente utilizzato
per eseguire un'operazione specifica, quale l'elaborazione
di testo, la contabilità o la gestione di
dati. I programmi vengono anche denominati applicazioni.
Risorsa
Parte di un programma visualizzabile, modificabile
o configurabile dall'utente.
RTF
Acronimo di Rich Text Format, un metodo
per codificare testo e grafica studiato per semplificare
il trasferimento di informazioni tra le applicazioni.
In sostanza si tratta di una specifica ideata dalla
Microsoft molto simile come contenuti alla specifica
PostScript per la definizione della pagina.
L'RTF è un tipo di codifica del testo "tagged",
cioè il documento viene codificato come del
testo "semplice" e dei "marcatori"
o "identificatori" (tag) che indicano.
Script
Il set di caratteri usato per immettere testo
in una lingua. Tutte le lingue dell’Europa occidentale
usano lo stesso alfabeto latino. Ognuna delle lingue
orientali – giapponese, coreano, cinese semplificato
e cinese tradizionale- usa un alfabeto diverso.
Segmento
Parte di documento, solitamente delimitata da segni
di interpunzione o marcatura, che costituisce l'unità
di informazione fondamentale di una memoria di traduzione
con una corrispondenza in un'altra lingua.
Strumenti CAT (Computer Aided/Assisted
Translation)
Strumenti di traduzione assistita; dispositivi e
programmi che svolgono tre funzioni principali: tradurre,
fornire
un sistema di editing e, infine, archiviare la memoria
di traduzione per utilizzi futuri. I moderni strumenti
CAT comprendono anche applicazioni analitiche, generatori
di glossari e indici e applicazioni di text mining.
Questi programmi sono in grado di esaminare un documento
e restituire un file con elenchi e conteggi di parole
e segmenti per l'elaborazione preliminare di un documento
e la valutazione della sua idoneità alla traduzione
da parte di macchine o traduttori professionisti.
Strumenti di gestione terminologica
Applicazione software per la gestione di una base
terminologica.
Tabella codici
Sistema per il supporto di set di caratteri e layout
di tastiera di paesi diversi. La tabella codici mette
in relazione i codici di carattere binari utilizzati
da un programma con i tasti della tastiera o con
i caratteri sullo schermo.
Per
i caratteri latini, l’ASCII è il più comune.
Tra gli altri ci sono Shift-JIS per il giapponese,
KSC 5601 per il coreano, GB per il cinese semplificato
e Big 5 per il cinese tradizionale (v. Unicode).
Molti sistemi operativi dispongono di tabelle di
conversione delle tabelle codici.
TBX
TermBase eXchange; formato aperto di scambio per
basi terminologiche basato su XML.
TMX
Formato aperto di scambio per memorie di traduzione
basato su XML, a perdita limitata o senza perdita
di dati critici.
Text mining
Estrazione del testo; ricerca, analisi,
strutturazione e categorizzazione automatica di
informazioni testuali
all'interno di una dati (file di grandi dimensioni,
manuali elettronici, ecc.)
XML
Acronimo di Extensible Markup Language
Linguaggio
di codifica basato su tag che definisce un formato
per la descrizione di dati strutturati.
Tale linguaggio consente di definire dichiarazioni
più accurate del contenuto e di ottenere risultati
di ricerca più significativi su piattaforme
diverse. Il linguaggio XML consentirà inoltre
lo sviluppo di una nuova generazione di applicazioni
Web per la visualizzazione e la modifica dei dati.
UCS
Acronomo di
Unicode Character System.
Sistema di riferimento per i set di caratteri standard
internazionali incluso nello standard Unicode. La
versione esistente più utilizzata di questo
standard è UCS-2, con cui vengono specificati
valori di carattere a 16 bit attualmente accettati
e riconosciuti per la codifica della maggior parte
delle lingue del mondo.
Unicode
Standard di codifica dei caratteri sviluppato
da Unicode Consortium per la rappresentazione di
tutte le lingue scritte internazionali. Il set
di caratteri Unicode
viene
rappresentato
in numerosi
formati, tra i quali UTF-8, UTF-16 e UTF-32. La
maggior parte delle interfacce Windows utilizza
il formato UTF-16.
Lo standard attuale fa uso
di
un codice di lunghezza di 2 byte e copre oltre
20 alfabeti tra cui quello latino, cirillico,
arabo, ebraico, svariati indiani e quattro orientali.
Unicode è
alla base di molti moderni standard, come XML, Java,
ECMAScript (JavaScript), LDAP, CORBA 3.0, WML eccetera,
e costituisce l'implementazione ufficiale dello standard
internazionale ISO/IEC 10646.
Unicode è supportato
da molti sistemi operativi, da tutti i più
moderni web browser e da molti altri prodotti. L'emergere
dello standard Unicode, unito alla recente disponibilità
di strumenti che lo supportano, è fra i più
significativi sviluppi della tecnologia della globalizzazione
del software. Unicode consente che un'unica versione
di un software o di un sito web siano fruibili con
piattaforme, lingue e paesi diversi, evitando la necessità di
reingenierizzare il prodotto per ogni situazione
specifica. Permette, inoltre, il trasporto del testo
fra sistemi diversi senza che abbia luogo alcuna
corruzione
dei dati.
UTF-8 (Unicode Transmission Format
8)
Set di caratteri per protocolli che rappresenta
un'evoluzione rispetto all'utilizzo di ASCII.
Il
protocollo UTF-8
supporta i caratteri estesi ASCII e la conversione
del set UCS-2, un set di caratteri Unicode a 16 bit.
Il formato UTF-8 consente l'utilizzo di un intervallo
di nomi molto più esteso di quello che può essere
raggiunto utilizzando l'ASCII o la codifica ASCII
estesa per i dati carattere.
Variabile
Nell'ambito della programmazione, posizione di
archiviazione denominata in grado di contenere
un certo tipo di dati che possono essere modificati
durante l'esecuzione del programma.
Le variabili di
ambiente di sistema sono definite da Windows
2000 Server e rimangono immutate indipendentemente
dall'utente connesso al computer. I membri del
gruppo Administrators possono tuttavia aggiungere
nuove variabili o modificare i valori delle variabili
esistenti.
Le variabili dell'ambiente utente
possono variare anche in base al computer utilizzato
dai singoli
utenti. Includono tutte le variabili di ambiente
che si desidera definire o le variabili definite
dalle applicazioni, ad esempio il percorso in
cui si trovano i file delle applicazioni.
Variabile di ambiente
Stringa costituita da informazioni sull'ambiente,
ad esempio l'unità, il percorso o il nome
di file, associata a un nome simbolico che è possibile
utilizzare con Windows. Per definire le variabili
di ambiente è possibile utilizzare Sistema
nel Pannello di controllo oppure il comando set
dal prompt dei comandi.
|