Metodologia d'indagine 2016: Il disegno campionario

L’indagine Excelsior fa riferimento a un campione di imprese fino a 50 dipendenti e considera invece l’universo delle imprese con oltre 50 dipendenti. Per queste ultime si avrebbero infatti notevoli difficoltà ad applicare procedure inferenziali, dato che tali imprese presentano mediamente una maggiore variabilità in termini di assunzioni o risoluzioni di contratti di lavoro rispetto alle piccole imprese e dato che i comportamenti di una medio/grande impresa non sono necessariamente assimilabili a quelli di un’impresa con caratteristiche (attività economica, dimensione, territorio) simili.

In particolare per la definizione del piano campionario si è operato secondo le variabili di seguito indicate:

  • 69 settori di attività economica;
  • 2 classi dimensionali (1-9, 10-49 dipendenti);
  • 105 province

individuando 14.490 "celle" rappresentanti altrettanti universi di riferimento.

In realtà è più corretto definire tali "celle" come potenziali universi di riferimento, in quanto numerosi insiemi risultano vuoti oppure numericamente insufficienti per un campionamento. Questo è il motivo per cui la definizione dei settori di attività economica per ciascuna provincia segue una procedura che privilegia settori tipici, specifici dell’economia provinciale, che vanno a costituire celle per le quali ci si propone di ottenere risultati significativi, mentre settori meno rilevanti per l’economia provinciale vengono tra loro aggregati. La soluzione scelta è motivata dal fatto che le province italiane sono caratterizzate da profili economici e occupazionali differenti, per cui uno schema di campionamento rigido, che definisse tali profili in una matrice unica, pur consentendo una discreta comparabilità tra territori, avrebbe condotto ad una inevitabile perdita di informazione.

Si è preferito pertanto rendere dinamica questa matrice, costruendola sulla base di una classificazione gerarchica di codici di attività, concettualmente simile all’ATECO 2007, e attribuendo a ciascun territorio il livello di dettaglio corrispondente, nel rispetto di due criteri: :

  • superamento di una soglia di numerosità minima dei soggetti appartenenti al dominio individuato dal singolo codice di attività;
  • superamento di una soglia convenzionale del valore del quoziente di specializzazione calcolato in termini di addetti.

Considerando le rilevanti differenze di dimensione e di struttura economica esistenti tra le regioni italiane, si è scelto di rendere “dinamici”, cioè esporre secondo elenchi differenti, anche i settori di esposizione dei risultati a livello regionale.

Il metodo esposto ha un doppio vantaggio: da un lato evita inutili frammentazioni del campione, per settori economici definiti a priori ma di scarso interesse per la provincia o la regione presa in esame; dall’altro, evidenziando i settori di maggiore interesse, favorisce l’interpretazione e l’analisi finale dei risultati dell’indagine.

Per ogni dominio così determinato la numerosità campionaria è calcolata in funzione della numerosità N della popolazione inclusa nel dominio in modo da garantire, per ciascuno di essi, una significatività pari al 95% con un errore massimo standard ε pari a 0,1 per la stima delle seguenti variabili:

  • una qualitativa bimodale relativa al fatto che l’impresa assume o non assume;
  • una quantitativa relativa al numero delle assunzioni previste

Il disegno campionario finora descritto è pensato comunque per garantire che a livello nazionale si ottengano dati significativi per 28 settori standard, per il cui dettaglio si rinvia alla Appendice 1 del presente volume.
Dopo aver definito la numerosità campionaria per ciascuno dei domini, l’estrazione casuale dei nominativi da sottoporre a intervista e delle relative riserve avviene rispettando i rapporti di composizione interni alla cella risultanti da una ulteriore sub-stratificazione che considera una serie di variabili maggiormente disaggregate. In relazione ai diversi strati, per ogni dominio si opera l’estrazione di un campione casuale proporzionale secondo la formulazione:


dove ni rappresenta la numerosità campionaria nell’i-esimo strato della popolazione, ni la numerosità campionaria totale nel dominio, Ni e N, rispettivamente, la numerosità della popolazione nell’i-esimo strato della popolazione stessa e la numerosità totale della popolazione.

La stratificazione della popolazione, che porta a trattare un numero elevato di celle campionarie, può comportare alcune difficoltà nella sostituzione delle imprese non rispondenti, non essendo reperibili altre imprese aventi le stesse caratteristiche. Tale problema viene superato sostituendo le posizioni dei non rispondenti con unità che presentano la minima “distanza” dall’unità campionata valutata sulla base delle variabili di stratificazione. Grazie al ricorso a queste tecniche di sostituzione delle imprese-base, il tasso di risposta effettivo che si ottiene al termine dell'indagine, rispetto alle numerosità campionarie fissate a priori, cresce di alcuni punti percentuali, rispetto a tecniche di sostituzioni rigide vincolate all’appartenenza alla stessa cella del disegno campionario. Per il dettaglio delle coperture campionarie si faccia riferimento alle Tavole 1 e 2 ( Le tavole non comprendono le imprese del comparto agricolo.)