Architetture II - De Biase 2001/2002

Appunti presi durante le lezioni di Architettura degli Elaboratori II, nell’anno accademico 2001/2002. Attenzione: non mi assumo nessuna responsabilità per informazioni errate o imprecise eventualmente presenti.

Sito del corso: http://twiki.dsi.uniroma1.it/twiki/view/Architetture2/WebHome
Sito di questi appunti: http://twiki.dsi.uniroma1.it/twiki/view/Users/AlbertoRocca
E-mail docente: debiase@dsi.uniroma1.it .

Buono studio.

A - RICHIAMI

1. VELOCITA' DELLE PORTE

Per velocità di una porta si intende il tempo che questa impiega per adattare il suo output agli input che riceve.

La porta più veloce è la NAND.
Se assumiamo che essa inpiega un tempo T per adattarsi agli input, si può tracciare il seguente schema:

Porta	Tempo
Nand Not And Xor	T T 2 T 3 T

2. LA WORD

Le stringhe binarie su cui i calcolatori lavorano devono avere lunghezza finita e fissata.
Tali stringhe sono dette parole o word.
La loro lunghezza condiziona tutta l'architettura del calcolatore: ogni circuito sarà in grado di manipolare (addizionare, memorizzare, decodificare, ecc.) solo stringhe di quella lunghezza.

B - BLOCCHI BASE

1. INTRODUZIONE

Utilizzeremo blocchi (insiemi) di porte logiche già studiati ad Architetture I.
Di ciascuno di questi blocchi non ci interessa più lo schema circuitale, ma la sua funzione logica (deducibile dalla tabella di verità).

2. BLOCCHI COMBINATORI

Blocchi di porte logiche connesse in modo aciclico t.c. i segnali in uscita in un dato istante dipendono solo dai segnali in ingresso in quello stesso istante.

2.1 Codificatori

2.1.1 Codificatore

Schema a blocchi:

N ingressi >> n=log₂N uscite
Tabella di verità: come quella del decodificatore, ma con input ed output invertiti.
Funzione logica: creazione della tabella di codifica.
Questa stabilisce una corrispondenza biunivoca fra stringhe di bit (gli OUTPUT) ed il loro significato (gli INPUT).
La tabella di codifica corrisponde alla tabella di verità del codificatore.

2.1.2 Decodificatore

Schema a blocchi:

n ingressi >> N=2ⁿ uscite
Tabella di verità (per n=3):

Input
e₀ e₁ e₂

Output
u₀ u₁ u₂ u₃ u₄ u₅ u₆ u₇

0 0 0
0 0 1
0 1 0
0 1 1
1 0 0
1 0 1
1 1 0
1 1 1

1 0 0 0 0 0 0 0
0 1 0 0 0 0 0 0
0 0 1 0 0 0 0 0
0 0 0 1 0 0 0 0
0 0 0 0 1 0 0 0
0 0 0 0 0 1 0 0
0 0 0 0 0 0 1 0
0 0 0 0 0 0 0 1

L'uno è sull'uscita indicata dal numero binario in input.

Funzione logica: riconoscimento.
Riconosce un certo input riassegnandogli il suo significato.

2.1.3 Transcodificatore

Schema a blocchi:

Collegamento di un decodificatore con un codificatore scambiando i fili.
Tabella di verità:
Funzione logica: cambiare codifica.
I segnali in input entrano codificati in un certo modo ed escono codificati in un altro modo.

2.1.4 Rom

Schema a blocchi:

n ingressi >> N=2ⁿ uscite
Tabella di verità (per n=3):

Input e₀ e₁ e₂	Output u₀ u₁ u₂ u₃ u₄ u₅ u₆ u₇
0 0 0 0 0 1 0 1 0 0 1 1 1 0 0 1 0 1 1 1 0 1 1 1	valori stabiliti dal costruttore

Funzione logica: la ROM può essere vista come una particolare implementazione di un transcodificatore.
Se, infatti, si pensa allo schema circuitale della ROM, si vede che rispetto al transcodificatore realizzato con decodificatore + codificatore, il decodificatore rimane inalterato, il codificatore viene sostituito dalle celle di memoria.

2.2 Commutatori

2.2.1 Multiplexer

Schema a blocchi:

N ingressi, n=log₂N linee di indirizzamento >> 1 uscita
Tabella di verità (per N=4):

Input
e₀ e₁ e₂ e₃ i₀ i₁

Output
u

x y z w 0 0
x y z w 0 1
x y x w 1 0
x y z w 1 1

x
y
z
w

Le linee di indirizzamento i₀ ed i₁ specificano quale entrata connettere all'uscita.

Funzione logica: interruttore variabile, ovvero nel quale si può scegliere quale degli ingressi deve essere mandato in output tramite le linee di indirizzamento.

2.2.2 Demultiplexer

Schema a blocchi:

1 ingresso, n=log₂N linee di indirizzamento >> N uscite
Tabella di verità: come quella del multiplexer, ma con input ed output invertiti.
Funzione logica: interruttore variabile inverso.
Qualunque sia il segnale in ingresso, esso si ripropone sull'uscita identificata dalle linee di indirizzamento.

2.2.3 Multiplexer + demultiplexer

Schema a blocchi:

Collegamento di un multiplexer con un demultiplexer.
Tabella di verità:
Funzione logica: trasferimento di informazioni.
Nei calcolatori viene usato per portare stringhe di bit da un punto ad un altro.
Il principio di funzionamento è il seguente: tramite le linee di indirizzamento viene stabilito quale degli ingressi del multiplexer può passare attraverso il multiplexer stesso, fino ad arrivare al demultiplexer ed uscirne.
Viene utilizzato questo metodo perchè:
a) diminuisce il numero di cavi necessari (per unire N punti, invece di N cavi, bastano un cavo per l'uscita del multiplexer più log₂N cavi per le linee di indirizzamento);
b) mittente e destinatario sono variabili (vengono stabiliti tramite linee di indirizzamento).

2.3 Sommatori aritmetici

2.3.1 Half adder

Schema a blocchi:
Tabella di verità:

Input
a b

Output
r s

0 0
0 1
1 0
1 1

0 0
0 1
0 1
1 0

r rappresenta il riporto.

Funzione logica: somma aritmetica di due bit.

2.3.2 Full adder

Schema a blocchi:
Tabella di verità:

Input
a b r_in

Output
r_out s

0 0 0
0 0 1
0 1 0
0 1 1
1 0 0
1 0 1
1 1 0
1 1 1

0 0
0 1
0 1
1 0
0 1
1 0
1 0
1 1

Funzione logica: somma aritmetica di tre bit.

2.3.3 Addizionatore aritmetico

Schema a blocchi:

Catena di full adder.
Tabella di verità:
Funzione logica: somma aritmetica di due stringhe binarie rappresentanti numeri interi.
Sfruttando l'addizionatore aritmetico, si possono anche eseguire sottrazioni aritmetiche grazie alla proprietà della rappresentazione in complemento a due dei numeri interi per il calcolo dell'opposto.

2.4 Comparatori

2.4.1 Comparatore aritmetico

Schema a blocchi:
Tabella di verità:
Funzione logica: confronto fra stringhe di bit rappresentanti numeri interi.
Funzionano nel seguente modo: si fa l'opposto di uno dei due numeri in input (tramite la proprietà della rappresentazione in complemento a due dei numeri interi) e poi il risultato viene sommato con l'altro input. Se la somma è zero, i due numeri sono uguali. Se la somma è maggiore o minore di zero (cioè il primo bit della somma è 0 o 1), uno dei due numeri è maggiore o minore dell'altro.

2.4.2 Comparatore logico

Schema a blocchi:
Tabella di verità:
Funzione logica: confronto fra stringhe di bit rappresentanti una qualsiasi cosa che abbia senso comparare.
Dà soltanto l'eguaglianza.

3. BLOCCHI SEQUENZIALI

Blocchi di porte logiche t.c. i segnali in uscita in un dato istante NON dipendono solo dai segnali in ingresso in quello stesso istante (c'è una memoria finita degli input passati, che può influenzare gli output attuali).

3.1 Flip-Flop

3.1.1 Tipo JK

Schema a blocchi:
Tabella di verità:

Input in t
J K Clk

Output in t
Q

0 0 |
0 1 |
1 0 |
1 1 |
x x _

Q(t-1)
0
1
¬Q(t-1)
Q(t-1)

Funzione logica: memorizzazione di un bit: lettura, scrittura, mantenimento, toggle.

3.2 Contatori

3.2.1 Contatore binario

Schema a blocchi:
Tabella di verità:
Funzione logica: conta i cicli di clock passati a partire dalla stringa nulla: ad ogni colpo di clock incrementa di uno la stringa in uscita.

3.2.2 Contatore binario preselezionabile

Schema a blocchi:
Tabella di verità:
Funzione logica: conta i cicli di clock passati a partire dalla stringa che riceve in input: ad ogni colpo di clock incrementa di uno la stringa in uscita.
'Ab' abilita l'input.

3.3 Registri o buffer

3.3.1 Registro di memorizzazione

Schema a blocchi:

Insieme di FF JK (tanti quanto è lunga la parola).
Tabella di verità:
Funzione logica: memorizza una certa stringa. La stringa da memorizzare è mandata come input al circuito e viene mantenuta in memoria fino al colpo di clock successivo. Dunque si fa arrivare il clock solo quando si vuole leggere il contenuto memorizzato.

3.3.2 Registro a scorrimento (shift register)

Schema a blocchi: shift left seriale-parallelo; shift left parallelo-seriale; shift right seriale-parallelo; shift right parallelo-seriale;
Tabella di verità:
Funzione logica: esistono essenzialmente tre funzioni per questi registri, una aritmetica, una logica ed una "di servizio".
La funzione aritmetica consiste nel moltiplicare / dividere per due o suoi multipli (shift a dx divide, shift a sn moltiplica). In questo caso, se si ha uno scorrimento a destra, i bit che entrano da sinistra sono gli stessi dell’ex MSB, per mantenere il segno. Se si ha uno scorrimento a sinistra, a destra entrano zero.
La funzione logica consiste in una semplice rotazione a destra o a sinistra, dove i bit che escono da un lato rientrano dall’altro lato. Questo tipo di operazione è utilizzata nei calcoli bit a bit.
Un ultimo utilizzo dei registri a scorrimento consiste nel convertire seriale in parallelo e parallelo in seriale (si veda il paragrafo "C - 2. Sistemi di interconnessione").

C - MACCHINE DI VON NEUMANN
È consigliato lo studio di "D - Dati e Istruzioni" e di "E - Interruzioni ed Eccezioni" parallelamente a questo capitolo.

1. Introduzione

La maggior parte dei calcolatori attualmente in uso sono macchine di Von Neumann, dal nome dell'ideatore dell'architettura (struttura logica) con cui sono costruiti.

Una macchina di Von Neumann è costituita da un sistema di interconnessione tramite cui vengono collegati 4 tipi di unità logiche (ognuna con un certo compito logico):

CU (Control Unit - Unità di Controllo)
ALU (Unità Logico-Aritmetica)
RAM (Memoria Centrale)
I/O (Input/Output)

Queste unità logiche sono ottenute combinando i blocchi di cui si è parlato nel capitolo precedente, a creare circuiti più complessi.

CU e ALU sono quasi sempre integrate su un unico chip che prende il nome di CPU (Central Processing Unit).
Per questo, CU e ALU sono in genere connessi tramite multiplexer. CPU, memoria centrale, I/O, invece, sono in genere connessi tramite bus.
Architettura

2. Sistemi di Interconnessione

Per spostare una stringa da un punto ad un altro in un calcolatore esistono due metodi di trasmissione: seriale e parallelo.

Parallelo:

Ogni uscita del mittente viene collegata con una entrata del destinatario.
Più semplice, più veloce, più costoso.
Seriale:

Una sola linea collega mittente con destinatario. Su questa linea viaggiano: la stringa da inviare (i bit vengono inviati uno dopo l'altro), il clock (mittente e destinatario devono avere lo stesso clock), un segnale di sincronismo (segnala l'inizio della trasmissione della stringa).
Più lento (i bit si devono mettere in fila - il tempo che si impiega è proporzionale alla lunghezza della stringa da inviare), più economico (un solo filo).

In genere, per connettere componenti all'interno di uno stesso chip (registri, ...) si usa la trasmissione parallela, per connettere componenti esterni al calcolatore (tastiera, monitor, modem,...) si usa la trasmissione seriale.
I registri a slittamento si occupano di convertire una trasmissione parallela in seriale e viceversa, come si evince facilmente dalla figura seguente.

Per realizzare questi due metodi di trasferimento esistono tre modi.

Tramite multiplexer e demultiplexer:
come visto in precedenza, si possono usare multiplexer e demultiplexer per trasportare dati con pochi fili.

Si supponga ad esempio che A debba comunicare con B. A, tramite le linee di indirizzamento, attiva l'uscita B del suo demultiplexer. Manda quindi serialmente all'ingresso del suo demultiplexer la stringa binaria da inviare. Questa viene ricevuta dal multiplexer di B, insieme alle linee di indirizzamento che A ha mandato al suo demultiplexer. In questo modo, l'ingresso A del multiplexer di B viene attivano. La stringa quindi passa attraverso il multiplexer di B e raggiunge B.

Possono comunicare fra loro più di due registri alla volta, ma se si vuole cambiare il numero di elementi che compongono la rete (nell'esempio sono tre, A,B,C), va rifatto tutto da capo (struttura rigida), nel senso che bisogna usare multiplexer e demultiplexer con un numero di ingressi o uscite adeguato.
Affiancando più linee si può effettuare un trasferimento parallelo.

Tramite bus.

Il BUS è un semplice conduttore. Il "trucco" è nelle porte utilizzate per connettere i vari elementi, che sono porte tristate.
Queste hanno la seguente tabella di verità:

Input a c	Output b
x 0 x 1	disconnesso x

Dunque, quando ricevono un segnale basso su c, qualunque sia il valore di a, esse introducono una resistenza tale che non c'è alcun segnale sull'uscita b. Questo significa disconnesso. Quando c vale 1, invece, mandano in output lo stesso segnale che ricevono in input.
Inizialmente tutte le unità sono disconnesse; quando due di esse vogliono colloquiare, un opportuno circuito di controllo connette le loro porte tristate. I segnali del mittente transitano sul bus e, pur raggiungendo tutte le unità, vengono captati solo dal ricevente.
Il circuito di controllo è detto arbitratore del bus e cede il bus a chi lo richiede solo quando questo è libero, utilizzando una certa gerarchia di priorità (ad es. la CPU ha precedenza sugli altri componenti).
La capacità di trasferimento del bus è misurata in byte al secondo e viene detta troughput.

NON possono comunicare fra loro più di due registri alla volta, ma se si vuole cambiare il numero di elementi che compongono la rete (nell'esempio sono tre, A,B,C), non è necessario rifare tutto da capo.
Affiancando più BUS si può effettuare un trasferimento parallelo.

Combinando i due metodi precedenti.

3. Unità Aritmetica e Logica

3.1 Introduzione

Schema a blocchi:
ALU
Funzione logica: operazioni logiche (not, and, or, ..., comparazione logica, ...) e operazioni aritmetiche (somma, differenza, shift, complementazione, opposto, comparazione aritmetica,...).

La ALU non è in grado di eseguire direttamente nè moltiplicazioni, nè divisioni. Inoltre può lavorare direttamente solo su numeri naturali o interi e su stringhe con significato logico.

3.2 Funzionamento

Operandi: ingressi ai quali mandare le stringhe binarie su cui compiere l'operazione scelta.
Funzione: ingressi su cui mandare il codice che identifica l'operazione da compiere. Ad esempio:

Codice	Operazione
0 0 0 0 0 1 0 1 0 0 1 1 1 0 0 1 0 1 1 1 0 1 1 1	AND OR NOT COMPARAZIONE logica e aritmetica TEST B ADD SHIFT LEFT SHIFT RIGHT

Risultato: uscite su cui si ottiene la stringa risultante, in caso di operazioni aritmetiche.
Flag: uscite che segnalano determinati eventi logici.

Flag	Evento
Z	segnala se il risultato dell'operazione logica o aritmetica compiuta ha come risultato la stringa nulla
N	segnala se il risultato dell'operazione compiuta è un numero negativo; questa segnalazione ha senso solo per operazioni aritmetiche, cioè quando le stringhe operando hanno significato numerico; tuttavia la ALU segnala comunque come negative anche le stringhe con significato logico, perchè si preoccupa soltanto di rilevare se il MSB è 1, quasiasi sia la natura della stringa.
C	segnala il trabocco di un uno sul MSB o LSB (trabocchi di zero non contano visto che il numero non cambia: 00214 è uguale a 214).
V	segnala un overflow o underflow.

Il trabocco segnala che una stringa rappresentante un numero naturale o un valore logico (cioè in base due "standard" - senza bit segno e NON in complemento a due) ha oltrepassato le dimensioni della word e quindi non rappresenta più il valore voluto. Per fare ciò la ALU controlla che l'uscita di trabocco dei vari circuiti da cui proviene la stringa sia attiva.
L'overflow segnala invece che una stringa rappresentante un numero intero (cioè in complemento a due) ha oltrepassato la dimensione della word e quindi non rappresenta più il valore voluto. Per fare ciò la ALU controlla il MSB degli operandi: se entrambe gli operandi hanno MSB pari ad uno, c'è stato overflow e il flag V viene attivato.
Il trabocco non ha senso per numeri rappresentati con stringhe in complemento a due
(ad es. 1100_Ca2+1010_Ca2 da un risultato errato 0110_Ca2, mentre 1100_Ca2+1100_Ca2 da un risultato giusto 1000_Ca2, dunque il trabocco non dà alcuna indicazione sulla correttezza del risultato),
così come l'overflow non ha senso per numeri naturali e valori logici rappresentati in base due con metodo "standard".
La ALU, tuttavia, segnala entrambe le condizioni senza occuparsi del significato delle stringhe che elabora.

4. Memoria Centrale

4.1 Introduzione

Schema a blocchi:
MemoriaCentrale
Insieme di registri di memoria di capienza pari alla lunghezza della word; ogni registro prende nome di cella di memoria.
Funzione logica: scrittura di stringhe in memoria e lettura di stringhe precedentemente memorizzate.

4.2 Funzionamento

A: ingressi a cui va mandata la stringa da memorizzare
B: ingressi a cui va mandato l'indirizzo del registro su cui si vuole memorizzare A / da cui si vuole leggere C. Per semplicità progettuale e per comodità, anche questo ingresso accetta solo stringhe lunghe una word
C: uscita su cui si può leggere la stringa in memoria
Funzione: specifica se si vuole leggere o scrivere sulla memoria

Il programmatore assembly vede la memoria centrale come vettore unidimensionale il cui indice, detto indirizzo, identifica univocamente ogni cella e permette di accedervi sia in lettura che in scrittura.

L'entrata B teoricamente dovrebbe essere gestita da un decodificatore che riceve in input l'indirizzo del registro e con tante uscite quante sono le celle di memoria, così da poter mandare ad ognuna di esse un opportuno segnale. Si vedrà che in pratica ciò non è possibile. Ad ogni modo si può ragionare come se ciò fosse fattibile, poiché vengono usati trucchi trasparenti al programmatore assembly.
Dunque, se ad es. la memoria avesse 8 registri e lavorasse con parole da 4 bit, il decodificatore che gestisce B dovrebbe avere 8 uscite e quindi 4 ingressi, di cui soltanto tre realmente utilizzati:

ingressi = log₂8 2^ingressi = 2^log₂⁸ 2^ingressi = 8 2^ingressi = 2³ ingressi = 3

I 4 ingressi sono necessari perché, come già specificato, per semplicità progettuale e per comodità, B accetta solo stringhe lunghe una word.

La memoria centrale è una memoria ad accesso casuale: per raggiungere un registro non è necessario scorrere tutte le celle precedenti, come succede invece per le memorie dette ad accesso sequenziale. Per questo la memoria centrale viene spesso chiamata RAM (Random Access Memory).

Caratteristica delle macchine di Von Neumann è che la memoria centrale contenga sia istruzioni che dati. Questo aumenta le possibilità di commettere errori. Per proteggersi da ciò, la RAM viene spesso organizzata in "compartimenti stagni", ognuno atto a contenere solo un tipo di stringa. In genere esiste una parte dedicata alle istruzioni del programma, un'altra atta a contenere i dati, una parte riservata al sistema operativo [ad es. per il vettore delle interruzioni e per tutto il codice del S.O.] ed infine una riservata allo stack. Si noti che questa non è una suddivisione hardware, ma logica.

È da notare, infine, che prima che una operazione di lettura o scrittura venga completata, trascorre un certo tempo detto tempo di accesso, dovuto alla lentezza delle porte che costituiscono registri e decodificatori.

4.4 Accorgimenti pratici

4.4.1 Frazionamento degli Indirizzi

L'entrata B della memoria dovrebbe essere gestita da un decodificatore con input l'indirizzo del registro e con tante uscite quante sono le celle di memoria, così da poter mandare ad ognuna di esse gli opportuni segnali. Se si considera che B, sugli attuali computer, è in genere di 32 bit, si capisce che il decoder dovrebbe avere 4 miliardi di piedini di uscita (2³²). Attualmente, però, il massimo numero di piedini che si riesce ad inserire in un chip è dell'ordine di qualche centinaio.
Diventa quindi necessario usare un "trucco" a livello hardware (invisibile al programmatore assembly, che continua a vedere la memoria come un vettore unidimensionale) per poter indirizzare un tale quantitativo di celle.
Il trucco consiste nel frazionare l'indirizzo B.

Si prenda, ad esempio, il caso di indirizzi di 32 bit. B viene diviso in pezzi da 8 bit ciascuno. Ogni pezzo è considerato idealmente come una coordinata: x, y, z, w. In questo modo, la memoria non viene più pensata come un vettore unidimensionale, ma viene pensata scomposta come in figura.
Schema
Ogni pezzo da 8 bit è gestito da un decodificatore con otto ingressi e quindi 256 uscite (che è un numero di piedini accettabile). Le uscite dei 4 decodificatori vengono poi messe insieme per ottenere l’indirizzo finale.
Frazionamento
Si ricorda che tutto ciò avviene a livello hardware e non logico e pertanto risulta trasparente al programmatore assembly.

4.4.2 Assemblamento di Chip

In commercio si trovano chip di memoria costruiti come visto con registri, input, input per indirizzo, uscite. Essi hanno capacità prestabilita, nonché ingressi e uscite in grado di accogliere stringhe di lunghezza fissata.
Assemblando tali circuiti si ottengono i banchi di memoria veri e propri, in grado di gestire stringhe dalla lunghezza e dalla capienza che si vuole.

Si consideri il caso in cui si abbiano a disposizione chip in grado di contenere 4 parole da 4 bit e quindi con 4 linee di indirizzamento di cui solo 2 relamente utilizzate, 4 linee di input, 4 linee di output e 4 celle di memoria:
Schema

Come prima eventualità, si supponga di voler costruire con essi una memoria con capacità identica a quella dei chip disponibili, ma che possa lavorare su parole lunghe il doppio. Ecco come effettuare le connessioni:
Schema
Aggiungendo altri chip si possono gestire parole più lunghe.

Si supponga ora di voler costruire con essi una memoria che lavori con parole di lunghezza identica a quella dei chip disponibili, ma con capacità doppia (otto parole invece di quattro). Ecco come effettuare le connessioni:

Per gestire 8 parole servono 4 linee di indirizzamento, di cui solo 3 reamente utilizzate. Di queste, due vanno connesse a quelle dei chip, una viene usata come segnale abilitatore degli input dei chip (stabilisce quale dei due chip utilizzare).
Le uscite dei chip vengono gestite da porte OR: basta che da parte di un chip arrivi un uno ad una porta OR perchè l'output sia uno.
Aggiungendo altri chip si può ulteriormente aumentare la capacità.

Si possono combinare i due precedenti metodi per ottenere banchi di memoria di capacità doppia ed in grado di gestire parole lunghe il doppio.

4.4.3 Pagine di Memoria

L'ingresso B è lungo una parola. Questa è una limitazione alla quantità di memoria indirizzabile dalla macchina. Se ad es. la parola è di 16 bit, si possono indirizzare al massimo 2¹⁶ (circa 65000) celle: come si usa dire, il campo di indirizzamento va da 0 a 2¹⁶-1.
Può essere necessario disporre di più indirizzi, ovvero può essere necessario avere una memoria centrale di dimensioni maggiori rispetto a questo limite.

A tal proposito si usa un registro di memoria speciale detto registro di estensione, che si trova in una zona della RAM di nome MM (Memory Managment). Tale registro contiene i bit in più rispetto alla lunghezza della parola che bisogna utilizzare per indirizzare la memoria.
Si può pensare in questi termini: la memoria viene divisa in pagine e ogni pagina è direttamente indirizzabile tramite la word che arriva all'ingresso B. Nel registro, invece, viene memorizzato il numero di pagina che si stà considerando.

Per quanto illustrato, la memoria centrale viene divisa in memoria fisica - quella realmente presente "on board" - e memoria indirizzabile - quella parte di memoria fisica direttamente indirizzabile tramite una parola.

Introdurre una struttura a pagine ha i seguenti svantaggi: occorrono nuove istruzione per gestire il registro di estensione (ad es l'istruzione "salto di pagina"); si ha un aumento del tempo di accesso; un programma non può occupare più di una pagina e i salti fra moduli di programma in pagine diverse sono più complicati [le istruzioni di salto hanno uno spazio per l'offset o indirizzo che non può gestire il registro di estensione, dunque occorre usare anche istruzioni speciali].

5. Control Unit

5.1 Introduzione

La Control Unit è costituita dai seguenti elementi di base:

PC - Programm Counter - Contatore di Programma
Decodificatore di istruzioni
Codificatore dei comandi

e dai seguenti elementi non di base:

Generatore di fase
Registri di memorizzazione interni

5.2 Program Counter

Il PC è un contatore preselezionabile.
Il suo compito è di gestire la memoria centrale: le sue uscite sono collegate agli ingressi di indirizzamento della memoria centrale.
Essendo un contatore, scandisce la memoria in modo sequenziale. Se, però, è necessario interrompere la sequenzialità del conteggio per saltare ad un certo indirizzo, si può usare l'ingresso preselezionabile, collegato al codificatore di comandi.

Caratteristica delle macchine di Von Neumann è di avere un solo PC. Ciò è equivalente ad affermare che le macchine di Von Neumann sono macchine sequenziali: possono eseguire una sola istruzione alla volta.
Dall'unicità del PC si deduce anche l'unicità della memoria centrale: solo il PC ha accesso alla memoria e se esso è unico, anche la memoria lo deve essere.

5.3 Decodificatore di Istruzioni

La stringa letta dalla memoria tramite il PC viene inviata al decodificatore di istruzioni.
Questo decodifica i vari campi dell'istruzione e li manda al codificatore di comandi.

5.4 Codificatore di Comandi

Questo circuito riceve le istruzioni decodificate e fa tutto il necessario per eseguirle.
Ad es. si connette all'ingresso "funzione" della ALU e le comunica che operazione fare; connette quindi la memoria centrale o i registri interni alle entrate della ALU; connette poi l'uscita della ALU con la memoria centrale o i registri interni per memorizzare il risultato.
Si fa presente che non tutte le istruzioni richiedono l'uso della ALU.

Si noti la differenza fra istruzioni e comandi: le istruzioni sono comandi codificati, i comandi sono istruzioni decodificate.
A onor del vero, si potrebbero costruire macchine che abbiano solo comandi e non istruzioni. Così facendo non sarebbe più necessaria le fase di decodifica, aumentando velocità, economicità ed affidabilità dei calcolatori. Questo però non avviene perchè i comandi occuperebbero troppa memoria (esistono molti comandi, ognuno può avere molti modi di indirizzamento degli operandi). La codifica è una sorta di compressione e per questo in memoria si trovano soltanto comandi codificati - ovvero istruzioni - e non comandi veri e propri.

5.5 Microprogrammazione

Visto il gran numero di istruzioni e indirizzamenti possibili, il decodificatore di istruzioni risulta essere un circuito combinatori estremamente complesso e quindi anche costoso da progettare e costruire.

Talvolta, per risparmiare, esso viene sostituito da una micromacchina, ovvero una macchina di Von Neuman "in miniatura", con micro-PC, micro-CPU e ROM al posto della RAM.

L'istruzione da decodificare arriva al micro-PC che controlla la ROM. Nella ROM, al contrario delle macchine di Von Neumann vere e proprie, ci sono sia istruzioni che comandi. Nel caso che il micro-PC trovi direttamente il comando corrispondente all'istruzione ricevuta, il comando viene subito inviato in output. Se, invece, l'istruzione non ha un comando associato direttamente, significa che le è associato un micro-programma , anch’esso presente nella ROM, che,una volta eseguito dalla micro-CPU, da in output il comando corrispondente all'istruzione.
Ovviamente ci sarà un registro di memorizzazione sull’uscita della micromacchina che accumula i vari pezzi del comando via via ottenuti dall’elaborazione dalla micro-CPU. Solo quando tutta l’istruzione è decodificata, viene abilitata l’uscita ed il comando ottenuto arriva al codificatore di comandi.

L'insieme dei microprogrammi viene detto firmware. Le microistruzioni con cui scrivere questi programmi sono molto poche.

Tutti questi passaggi sono trasparenti al programmatore assembly, tranne per il fatto che introducono un rallentamento nell'esecuzione dei programmi, a fronte, però, di una maggiore economicità.
Questo rallentamento può essere più o meno marcato a seconda del numero di microistruzioni e del numero di comandi direttamente presenti nella ROM. È possibile espandere il set di microistruzioni e comandi semplicemente cambiando la ROM (o utilizzando una EPROM - tipo di memoria di cui non parleremo).

5.6 Generatore di Fase

Perché una macchina di Von Neumann possa fare quello che le è richiesto tramite un’istruzione sono necessarie le seguenti fasi:

caricamento: il PC e la memoria centrale si mettono in comunicazione su richiesta del PC; l'indirizzo che PC conta raggiunge l'ingresso "Indirizzi" della memoria, la quale manda in output la stringa trovata; memoria centrale e decodificatore di istruzione si connettono su richiesta del PC; la stringa trovata in memoria raggiunge il decodificatore di istruzione.

decodifica (riconoscimento): il decodificatore di istruzione oppure la micromacchina decodificano l'istruzione ("vedono cosa fa l'istruzione e dove sono i suoi operandi").

esecuzione: il codificatore dei comandi interagisce con tutte le unità che servono (ad es. fa saltare il PC alla locazione di memoria dove si trova un certo operando, ecc.).

Il generatore di fase conosce la fase nella quale ci si trova e la segnala al decodificatore di comandi.
Vedremo che sapere in quale delle tre fasi si trova la macchina, in alcuni casi, si rivela molto utile (ad es. canalizzazione).
Per ora basta sapere che se ci si trova nella prima o nella seconda fase il calcolatore deve fare le stesse operazioni qualsiasi sia l'istruzione; se, però, ci si trova nell'ultima fase, i compiti che il decodificatore di comandi deve svolgere variano da istruzione ad istruzione. Utilizzando una micromacchina, sia nella seconda che nella terza fase i compiti variano da istruzione ad istruzione. Appare evidente, quindi, che serve sapere in quale delle tre fasi il sistema si trova.

5.7 Registri Interni alla CPU

Sono normali registri di memorizzazione lunghi una parola.

Il loro compito è identico a quello delle celle di memoria centrale: memorizzare i dati su cui si sta operando.
Da un punto di vista logico, quindi, risultano superflui, ma la pratica mostra che è molto comodo averli.
Rispetto alla memoria centrale, infatti, essi sono più vicini e meno numerosi. Questo significa che sono più velocemente accedibili e più facilmente indirizzabili della memoria centrale.

Si usa dividere tali registri in due gruppi:

registri ad uso speciale (special purpose): sono riservati a contenere dati particolari, stabiliti dal progettista della macchina;
registri ad uso generico (general purpose): sono liberamente utilizzabili dal programmatore assembly per memorizzare i dati che servono.

Fra quelli ad uso speciali ci sono:

registri accumulatori: usati per il referenziamento implicito delle istruzioni
registri indice:contengono indirizzi di memoria per indirizzamento indicizzato o chiamata a funzioni, ecc.
un registro stato della macchina (psw): contiene i risultati logici della ALU (le uscite flag) ed altre informazioni rilevanti
un registro puntatore a catasta (sp): contiene l'ultima locazione di memoria usata nello stack.
La nozione di stack / pila / catasta è già nota al lettore. Vediamo quindi soltanto dettagli relativi alla sua implementazione.
Allo stack si accede sequenzialmente con filosofia LIFO, proprio grazie al registro sp. L'indirizzamento usato, infatti, è ad autoincremento o decremento: incremento se si inserisce un elemento, decremento se lo si toglie.

6. Input \ Output

6.1 Introduzione

Questa unità logica permette al calcolatore di comunicare con l’uomo e con l’ambiente esterno.

La comunicazione avviene tramite opportuni dispositivi detti periferiche.

Nella comunicazione con l’ambiente esterno, tramite opportune periferiche, il calcolatore riceve segnali che misurano grandezze fisiche e manda segnali per modificare tali grandezze.

Nella comunicazione con l’uomo, tramite opportune periferiche, l’operatore può inserire dati ed istruzioni nel calcolatore, mentre il calcolatore può mostrare all’operatore il risultato delle sue elaborazioni.

Si può avere, infine, anche una comunicazione fra calcolatore e calcolatore.

6.2 Realizzazione

Ci sono due metodi per implementare l'unità di I\O.

Tramite un insieme di registri visibili sia dall'esterno che dall'interno della macchina.
In questo caso, sia le periferiche esterne, che le componenti interne del calcolatore possono leggerli e/o scriverci.
Questo metodo non è più usato visto che ha i seguenti svantaggi: servono opportune istruzioni per operare su questi registri, dette istruzioni di I/O; il numero di registri è fisso e spesso o è troppo elevato o è troppo basso per le proprie esigenze.
Tramite registri presi in prestito dalla memoria centrale.
Un certo numero di indirizzi di memoria viene dedicato all'identificazione dei registri visibili sia all'interno che all'esterno del calcolatore. Ogni periferica avrà un certo numero di indirizzi di memoria riservati, su cui sarà possibile leggere e/o scrivere come se fossero normali celle di memoria. Il programmatore assembly quindi vede i registri delle periferiche come se fossero celle di memoria, mentre in realtà questi si trovano nelle periferiche stesse. Sebbene logicamente e fisicamente separato, in questo caso l'I/O viene identificato con la RAM. Tutti i difetti del precedente metodo scompaiono. Per operare su questi registri, infatti, si usano le normali istruzioni utilizzate per operare sulla memoria; si possono inoltre riservare molti indirizzi, cosicchè essi non siano mai troppo pochi (essendo la memoria centrale molto grande, la perdita di indirizzi è praticamente trascurabile). Questo metodo prende il nome di estenzione all'esterno della memoria centrale oppure memory mapped I\O.

6.3 Funzionamento

Il problema principale nel colloquio fra periferiche e CPU risiede nella differenza di velocità fra questi componenti.
Per riuscire a farle comunicare, quindi, bisogna usare vari accorgimenti.
Innanzitutto è necessario che le periferiche bidirezionali (periferiche su cui si può leggere e scrivere) abbiano almeno i seguenti tre registri:

registro di stato: contiene tutte le informazioni correnti della periferica; ad es. se è pronta o meno, se c'è stato un errore, più in generale se ci sono situazioni patologiche o fisiologiche, generando eventualmente interruzioni;
di questo registro di stato, tre sono i bit che interessano: un bit che segnala la situazione di pronto in lettura; un bit che segnala la situazione di pronto in scrittura; un bit che abilita o meno la possibilità di quella periferica di lanciare interruzioni;
registro di dato in ingresso: contiene il prossimo dato che la periferica sta per leggere;
registro di dato in uscita: contiene il dato che la periferica sta inviando al calcolatore.

La comunicazione consiste nel trasferimento di dati fra memoria centrale o registri interni e registri di dato in ingresso o di dato in uscita della periferica.

Esistono i seguenti tre metodi per realizzare lo scambio di dati:

metodo programmato:
un programma assembly che utilizzando questo metodo voglia accedere ad una periferiferica - ad es. in lettura, per la scrittura è analogo - deve avere la seguente struttura:

1: istruzioni del programma che non richiedono I\O

2: inizializzazione:
caricamento in una variabile dell'indirizzo di memoria centrale da cui scrivere i dati trasferiti;
caricamento in una variabile della condizione di fine: o il numero di word da trasferire o la particolare word che appena letta fa terminare il trasferimento;

3: test:
se il bit di pronto in lettura del registro di stato della periferica è basso, ripete questo test finchè non diventa alto, altrimenti continua


4: istruzione che trasferisce la word dal registro di dato in uscita della periferica alla RAM o ad un registro interno alla macchina;

5: test:
se la condizione di fine non è verificata ripete da 3, altrimenti continua


6: parte restante del programma

Riassumendo: la CPU cicla finchè la periferica non è pronta; appena la periferica è pronta, la CPU cicla leggendo un dato alla volta, finchè non li legge tutti.
Rispetto agli altri metodi, il programmato è molto inefficiente perchè tiene occupata la CPU a ciclare per trasferire una word alla volta, pertanto è ormai abbandonato

metodo ad interruzioni:
un programma assembly che utilizzando questo metodo voglia accedere ad una periferiferica - ad es. in lettura, per la scrittura è analogo - deve avere la seguente struttura:

1: abilitazione di quella periferica a lanciare interruzioni, alzando l'apposito bit del suo registro di stato 
2: dichiarazione della posizione di memoria in cui si trova il programma di servizio di quella interruzione, inserendo l'indirizzo nel vettore delle interruzioni 
3: istruzioni del programma che non richiedono I\O

4: inizializzazione:
caricamento dell'indirizzo di memoria centrale da cui scrivere i dati trasferiti (qui o nel programma di servizio?)
caricamento della condizione di fine: o il numero di word da trasferire o la particolare word che appena letta fa terminare il trasferimento (qui o nel programma di servizio?)

6: istruzione di lettura da periferiferica:
o il programma ha un'istruzione di attesa - il calcolatore si ferma ad aspettare che la periferiferica sia pronta in lettura senza poter fare niente - o ha un'istruzione di trap verso il sistema operativo - il sistema operativo cede il controllo della CPU ad altri programmi finchè non arriva il segnale di pronto - quando il bit di pronto in and con il bit di abilitazione delle interruzioni della periferica è alto, la periferica lancia una interruzione e viene attivato il programma di servizio, che trasferisce la word dal registro di dato in uscita della periferica alla RAM o ad un registro interno al calcolatore; ciò si ripete finchè non viene raggiunta la condizione di fine; a questo punto, il programma di servizio ritorna e cancella l'interruzione


7: parte restante del programma

Riassumendo: la CPU aspetta l’interruzione di periferica pronta; il programma di servizio legge un dato e ritorna; questo avviene finchè tutti i dati non sono esauriti.
Il metodo ad interruzioni è utilizzato per le periferiche che non trasferiscono molti dati (ad es. la tastiera)

metodo del DMA (Direct Memory Access):
un programma assembly che utilizzando questo metodo voglia accedere ad una periferiferica - ad es. in lettura, per la scrittura è analogo - deve avere la seguente struttura:

1: istruzioni del programma che non richiedono I\O 
2: caricamento nel registro di indirizzo del controllore di DMA dell'indirizzo di memoria centrale da cui scrivere i dati trasferiti 
3: caricamento nel registro di dato del controllore di DMA della condizione di fine: o il numero di word da trasferire o la particolare word che appena letta fa terminare il trasferimento
4: abilitazione di quella periferica a lanciare interruzioni, alzando l'apposito bit del suo registro di stato 
5: dichiarazione della posizione di memoria in cui si trova il programma di servizio di quella interruzione, inserendo l'indirizzo nel vettore delle interruzioni

6: istruzione di avvio del trasferimento:
o il programma ha un'istruzione di attesa - il calcolatore si ferma ad aspettare che la periferiferica abbia trasferito tutti i dati, senza poter fare niente - o ha un'istruzione di trap verso il sistema operativo - il sistema operativo cede il controllo della CPU ad altri programmi finchè non arriva l'interruzione di fine trasferimento - quando l'interruzione di fine trasferimento arriva, o finisce l'attesa o arriva un'istruzione di trap al sistema operativo che decide se far ripartire il programma


7: parte restante del programma

E’ un metodo pensato per liberare la CPU dall'incombenza di gestire lo scambio di dati fra periferiche e calcolatore: la differenza con gli altri due metodi, infatti, sta nell'inviare una interruzione non per ogni word trasferita, ma per ogni blocco di word trasferito; in questo modo la CPU non deve eseguire un'istruzione di move da un indirizzo ad un altro per ogni dato da scambiare.

Questo è possibile perchè alle periferiche viene permesso di accedere alla memoria centrale direttamente, senza l'intervento della CPU. Ciò avviene tramite un opportuno circuito detto controllore di DMA, unico e a cui si possono collegare più feriferiche e che è a sua volta collegato al bus. Questo componente ha (almeno) tre registri, che vengono usati al posto dei registri delle periferiche: un registro di stato, un registro contatore di indirizzo, un registro contatore di dato. Il programmatore assembly specifica, tramite un opportuno bit del registro di stato, se la periferica deve leggere o scrivere sulla memoria centrale. Specifica quindi nel registro contatore di indirizzo l'indirizzo di partenza della memoria centrale, su cui leggere o scrivere. Nel registro contatore di dato mette il numero delle informazioni da leggere o scrivere, ovvero il numero di celle di memoria da usare. Avvia quindi il trasferimento alzando un opportuno bit nel registro di stato. Eseguite queste poche istruzioni, la CPU non viene più chiamata in causa e può svolgere altri compiti. Durante il trasferimento, il registro contatore di indirizzo viene incrementato ed il registro contatore di dato decrementato. Quando il registro contatore di dato arriva a zero, la periferica segnala la fine del trasferimento alzando un opportuno bit del registro di stato per mandare un'interruzione alla CPU.
Alla luce di quanto esposto sinora, appare evidente che il metodo del DMA non è trasparente al programmatore assembly: egli deve fare in modo che il sistema operativo imposti correttamente il controllore di DMA.
Un'altra importante cosa da notare è che il registro contatore d'indirizzo svolge le veci del program counter della CPU. L'unica differenza è che il PC è un contatore preselezionabile, mentre il registro del controllore di DMA non lo è.
Ci si potrebbe poi chiedere come facia il controllore di DMA a colloquiare con la RAM se in quel momento il BUS è già occupato dalla CPU. Ebbene, esso sfrutta i buchi di tempo in cui la CPU non utilizza il bus. Come già visto, infatti, l'esecuzione di istruzioni da parte della CPU implica tre fasi distinte: caricamento, decodifica o elaborazione della micromacchina ed esecuzione. Durante la decodifica, la CPU sicuramente non usa il BUS. Questo potrebbe accadere anche durante l'esecuzione, dipende dal tipo di istruzione. E' in queste fasi che il controllore di DMA può usare il bus. Il tutto è ovviamente gestito dall'arbitratore del BUS.
Il metodo del DMA viene usato solo per le periferiche che scambiano grandi quantità di dati col calcolatore. Ciò avviene a causa del suo costo sia hardware, che software (impostazione dei suoi tre registri). Inoltre, se le periferiche che utilizzano un controllore di DMA fossero troppe, si avrebbe la saturazione del bus, ovvero gli spazi lasciati liberi dalla CPU non sarebbero sufficienti per accontentare tutte le richieste di trasferimento, ottenendo un'esplosione dei tempi di attesa.

7. ALTRO

7.1 Introduzione

ALU, CU, memoria centrale e I\O sono le unità logicamente essenziali per le macchine di Von Neumann.
Tramite queste, un calcolatore può svolgere tutte le operazioni che normalmente i calcolatori sanno fare.

Spesso, però, a queste unità logiche essenziali, vengono affiancate altre unità, specializzate in vari compiti.
Tali unità non sono logicamente essenziali, dato che i compiti che esse svolgono potrebbero venire svolti anche soltanto da ALU, CU, memoria centrale e I\O via software (ovvero combinando varie istruzioni).
Ad es.: la ALU non sa calcolare direttamente il prodotto di due numeri, ma per fare un prodotto basta fare una serie di somme, cosa che la ALU sa fare. Basta quindi scrivere un programma che faccia ciò. Ad es.: per operare con numeri di lunghezza doppia al normale basta spezzare manualmente questi numeri su due word.
Vengono tuttavia aggiunte perchè velocizzano queste operazioni, dato che sanno eseguirle direttamente, con una sola istruzione - via hardware, come si dice - perchè hanno circuiti in grado di farlo. In questo modo si risparmiano tempo e fatica.

Di queste unità aggiuntive vedremo soltanto l'unità aritmetica.

7.2 AU (Unità Aritmetica)

L'unità aritmetica (altrimenti detta coprocessore aritmetico o unità a virgola mobile) si occupa di moltiplicare e dividere numeri interi, nonchè di operare sui numeri reali rappresentati in virgola mobile e sui numeri in lunghezza doppia (lunghi cioè due word anzichè una).

D - DATI ED ISTRUZIONI

1. Introduzione

Le stringhe binarie che i calcolatori usano si possono dividere in due grandi classi, in base a ciò che esse rappresentano:

istruzioni
dati

Le istruzioni dicono al calcolatore cosa fare. I dati sono le entità su cui tali istruzioni possono agire.

Si noti che istruzioni e dati, in una macchina di Von Neumann, convivono nello stesso luogo: la memoria centrale. Ciò rappresenta una debolezza di questi calcolatori, poichè non c'è alcuna protezione fra i due tipi (stringhe di dati possono essere scambiate per istruzioni e viceversa). Sta ai programmatori scrivere programmi sufficientemente corretti da non creare problemi in questo senso. La sintassi dei linguaggi di alto livello (controlli sui tipi, ecc.) serve proprio a questo.

2. Istruzioni

2.1 Introduzione

[da migliorare]Un programma scritto in linguaggio macchina (cioè direttamente comprensibile dal calcolatore) è un insieme di istruzioni binarie. Un programmatore è la persona che scrive tali stringhe. In realtà i programmatori scrivono programmi in linguaggi che usano codici mnemonici al posto di sequenze binarie. Queste sequenze vengono poi tradotte da appositi programmi in stringhe binarie.

2.2 Tipi di Istruzione

Esistono 4 classi di istruzioni:

istruzioni di trasferimento: permettono lo spostamento di una stringa rappresentate un dato da un posto ad un altro, senza modificarla (ad es. spostamento da un registro della CU ad un altro registro della CU, da una cella di memoria ad un’altra cella di memoria, da una cella di memoria ad un registro della CU e viceversa).
Le più comuni hanno i seguenti nomi:
move: sposta una stringa (è la più generale e può sostituire le prossime due, che comunque vengono tenute per comodità)
load: carica una stringa da una cella di memoria ad un registro della CPU
store: memorizza una stringa da un un registro della CPU ad una cella di memoria.
istruzioni aritmetiche e logiche: istruzioni che coinvolgono la ALU (and, or, xor, not, comparazione, addizione - NON ci sono moltiplicazioni e divisioni perchè la ALU non le sà eseguire).
istruzioni di salto: permettono di saltare da un punto all'altro del programma in esecuzione, interrompendone la sequenzialità (tramite l'entrata preselezionabile del PC); queste sono molto importanti perché differenziano le macchine di Von Neumann dalle altre macchine programmabili non in grado di saltare.
Ne esistono quattro tipi:
salti incondizionati: jump (salta) e branch (vai a), che differiscono solo per l’ampiezza del salto che permettono di operare; return, che comunica la fine di una subroutine; ecc.;
salti condizionati: bne (salta se non sono uguali), ecc. Rappresentano la capacità di prendere decisione delle macchine di Von Neumann. Le condizioni da cui dipendono sono i flag della ALU
salti a subroutine: jsr (salta a subroutine). Salta a un pezzo di programma che, siccome verrà spesso usato, è stato definito a parte. Prima di saltare, salva in un registro interno alla CU la posizione in cui si trova (indirizzo della cella di memoria contenente la istruzione corrente, preso dalla CU), così da poterci ritornare alla fine della subroutine (dunque dovrà esistere un'istruzione che segnala la fine di una subroutine e che, però, fa parte della successiva categoria di istruzioni).
salti per eccezioni: verranno trattate nel prossimo capitolo (trap).
istruzioni di comando: cose che il programmatore chiede alla macchina di fare. Agiscono sulla CPU e non hanno operandi.
Alcuni esempi sono le istruzioni reset e halt per resettare (azzeramento di tutti i registri) e per fermare la macchina.

2.3 Campi delle Istruzioni

Le stringhe binarie rappresentanti istruzioni sono divise idealmente in due campi logici: (esempio fittizio a 32 bit)

16 bit: codice istruzione

16 bit: referenziamento operandi

Il primo campo contiene il codice dell'istruzione: ogni istruzione è identificata univocamente tramite un numero binario di massimo 16 bit (verrà interpretato dal decodificatore di istruzione).
Il secondo campo contiene il referenziamento degli operandi: ogni istruzione agisce su un certo numero di dati (eventualmente zero); la loro posizione nel calcolatore viene indicata in questa parte dell'istruzione (verranno recuperati dal PC tramite preselezione inviata dal codificatore dei comandi).

Il referenziamento degli operandi può essere di due tipi: esplicito ed implicito.
Nel caso di referenziamento esplicito, nel campo "referenziamento degli operandi" viene effettivamente indicato dove si trovano gli operandi (memoria centrale o registri di memorizzazione interni alla CPU) oppure viene messo direttamente il loro valore.
Nel caso di referenziamento implicito, il campo "referenziamento degli operandi" non esiste. In questo caso, infatti, ci si aspetta di trovare gli operandi in posizioni fisse, prestabilite dal progettista della macchina (determinati registri della CU detti accumulatori).

Parlando del referenziamento esplicito, sorge un altro problema: se si decide di usare operandi che si trovano nella memoria centrale, lo spazio di 16 bit non basta neanche per indirizzarne uno (servono 32 bit per ogni indirizzo).
Esistono due soluzioni.
La prima consiste nell'utilizzare istruzioni più lunghe di una parola, dette istruzioni a lunghezza variabile poichè si possono avere istruzioni di 1, 2, 3, ecc. parole; ogni parola in più contiene l'indirizzo di un operando oppure l’operando stesso.
La seconda consiste nell'usare i registri di memorizzazione interni alla CU. Questi, essendo in numero esiguo, sono indirizzabili tramite stringhe molto corte, che riescono quindi a stare nei 16 bit disponibili. In questo caso si possono usare istruzioni a lunghezza fissa.

Sempre riguardo l'indirizzamento esplicito, esistono le seguenti possibilità di referenziamento degli operandi (vengono evidenziati i principali):

immediato

16 bit: codice istruzione

16 bit: operando

assoluto

16 bit: codice istruzione

16 bit: indirizzo

Indirizzo della memoria centrale in cui si trova l'operando.

a registro

16 bit: codice istruzione

16 bit: registro

Numero del registro di memorizzazione interno alla CU in cui si trova l'operando.

differito a registro

16 bit: codice istruzione

16 bit: registro

Numero del registro di memorizzazione interno alla CU in cui si trova l'indirizzo della memoria centrale in cui si trova l'operando.

indiretto

16 bit: codice istruzione

16 bit: indirizzo

Indirizzo della memoria centrale in cui si trova l'indirizzo della memoria centrale in cui si trova l'operando.

differito indiretto

16 bit: codice istruzione

16 bit: registro

Numero del registro di memorizzazione interno alla CU in cui si trova l'indirizzo della memoria centrale in cui si trova l'indirizzo della memoria centrale in cui si trova l'operando.

relativo

16 bit: codice istruzione

16 bit: offset

Numero che sommato al contenuto del PC, dà l'indirizzo della memoria centrale in cui si trova l'operando (di quanto bisogna spostarsi dalla posizione corrente in memoria centrale).

indicizzato

16 bit: codice istruzione

16 bit: offset

Numero che sommato al contenuto di un opportuno registro di memorizzazione interno alla CU che sia indice (cioè che contenga un indirizzo di memoria centrale), dà l'indirizzo della memoria centrale in cui si trova l'operando (di quanto bisogna spostarsi, non dalla posizione corrente in memoria centrale, ma da una certa posizione memorizzata).

indiretto ...

16 bit: codice istruzione

16 bit: registro

Numero del registro di memorizzazione interno alla CU in cui si trova l'indirizzo della memoria centrale in cui si trova l'operando.

relativo differito a registro

16 bit: codice istruzione

16 bit: indirizzo

Indirizzo della memoria centrale in cui si trova l'indirizzo di un registro locale alla CU che contiene l'offset che sommato al PC da l'operando.

relativo differito a registro indiretto

16 bit: codice istruzione

16 bit: indirizzo

Indirizzo della memoria centrale in cui si trova l'indirizzo di un registro locale alla CU che contiene l'offset che sommato al PC da l'indirizzo di memoria centrale in cui si trova l'operando.

relativo non a PC ma ad indirizzo base