Un sistema perfetto (ma complicato da realizzare) per la codifica delle domande multiple nei questionari e il loro inserimento in matrice dati: l'uso del codice binario.
Non si tratta di una nota “estiva” e per questo leggera e necessariamente divertente, ma dell’approfondimento di un elemento solo accennato in una vecchia nota (Elaborare un questionario, del 12 Marzo 2010).
In quella nota scrivevo che le domande a risposta multipla inserite in questionario possono dare problemi di codifica e imputazione in matrice; prima di suggerire la soluzione più veloce e semplice al problema (riservare una distinta colonna per ogni risposta, con valori di cella pari a 1 – ha dato quella risposta – e 0 – non ha dato quella risposta) ne ricordavo due più complessi dei quali però non fornivo spiegazioni. Una di tali soluzioni più complesse riguarda l’uso del codice binario nella codifica (ne parlo in questa nota) mentre l’altra propone codifiche qualitative di sintesi (che vedremo in una successiva nota).
Considerando lo stile e la dimensione media di queste noterelle non avrò modo di spiegarvi approfonditamente cosa sia il codice binario e perché funzioni come effettivamente funziona. Sulla Wikipedia c’è un’ottima voce Sistema numerico binario alla quale vi rimando per ogni approfondimento; qui ve lo faccio capire in pratica.
Partiamo dal classico sistema decimale, quello che avete imparato alle elementari e che usate abitualmente: 1, 2, 3, … fino a 10, poi i suoi multipli (100, 1.000, …). Aprite le vostre mani di fronte a voi e contate: pollice sinistro = 1, indice sinistro = 2… fino a mignolo destro = 10. Giusto? Con le vostre due mani potete contare fino a 10 e – alzando e abbassando abilmente le dita potreste arrivare (per somma “di dita”) fino a 55 (la somma di tutte le vostre 10 dita).
Col sistema binario, invece, la sequenza si basa su potenze di 2, in questo modo: 20 = 1, 21 = 2, 22 = 4, 23 = 8 e così via.
Naturalmente tutti i numeri mancanti sono realizzati per somma di questi, quindi “3” è la somma di 1+2 (pollice più indice della mano destra), “54” è la somma di 32+16+4+2 (mignolo mano sinistra più mignolo, medio e indice della destra).
In realtà vi ho parlato del codice binario utilizzando ancora un sistema di notazione decimale, perché nel binario “1” si dovrebbe scrivere 00001, “2” 00010, “3” 00100 e così via, e quindi, negli esempi poco sopra fatti, “3” si scrive 00011, “54” si scrive 110110 etc. (se non vi è chiarissimo con un po’ di pazienza, e guardando la figura delle mani, sono certo che ci arriverete).
Bene: cosa c’entra tutto questo con la codifica di domande a risposta multipla? Se avete commesso l’imprudenza di mettere in questionario un lungo elenco di elementi (se l’elenco è breve questo sistema non serve), per esempio gli elettrodomestici e aggeggi elettronici posseduti (entro un’indagine in cui questo serve per costituire un indice indiretto di benessere, o più banalmente in un’indagine di mercato) e avete conseguentemente e necessariamente lasciata la possibilità di inserire quante risposte servono, potreste alla fine avere una domanda con – poniamo – una ventina di possibili risposte (televisore, radio, radiosveglia, stereo, iPod, …) e un bel pacco di questionari ciascuno con ogni possibile permutazione di quelle venti risposte (chi possiede certe cose, chi altre, chi tante, chi poche).
Se voi allora date a ciascuna singola possibile risposta, anziché i classici valori di codifica decimali (1, 2, 3, 4…), dei valori binari (1, 2, 4, 8…) e imputate in matrice il solo valore corrispondente alla somma di tali codici, con una sola informazione (una sola cella occupata in matrice) voi saprete esattamente quanti e quali risposte siano state fornite; lo potete verificare semplicemente: chi avrà in matrice il valore, p.es., “4”, significa che ha scelto una sola risposta, la terza; chi avrà invece “5”, significa che avrà scelto due risposte, ed esattamente quelle corrispondenti ai codici “1” (la prima risposta) e “4” (la terza). E così via.
Il sistema è perfetto, perché ogni specifico valore può corrispondere a una sola risposta o a un solo aggregato di risposte; in questo modo non si perde alcuna informazione (gli altri due sistemi fanno perdere molta informazione) ma, come capire, è molto complicato e farraginoso da gestire, salvo una vostra almeno discreta conoscenza del codice binario e l’uso di sistemi automatizzati di calcolo dei codici e di loro ritraduzione successiva.
Non so se mai l’utilizzerete per la codifica di risposte multiple, ma suppongo che vi divertirete almeno a stupire gli amici in spiaggia mostrando loro come sia possibile contare fino a 1.023 con le dieci dita.


Urbino 2004/12
Questionari per la valutazione
Feed RSS