ESTADÍSTICA ESTRUCTURAL D'EMPRESES: SECTOR COMERÇ
RESULTATS PER A LA COMUNITAT VALENCIANA

NOTES METODOLÒGIQUES



1. Introducció

Les estadístiques estructurals d' empreses (EEE) tenen com a fi proporcionar informació sobre les principals característiques estructurals i econòmiques de les empreses. L'Institut Nacional d'Estadística (INE) elabora anualment aquestes estadístiques per als sectors d'indústria, comerç i serveis, les quals es regeixen pel Reglament 295/2008 del Parlament i del Consell de la Unió Europea sobre les estadístiques estructurals d'empreses.

Les EEE presenten un desglossament per comunitats autònomes per a unes certes variables (nombre de locals, xifra de negocis, sous i salaris, inversió en actius materials i personal ocupat) considerant la ubicació dels establiments o locals que les empreses tinguen en diferents emplaçaments geogràfics. Per a obtindre aquesta distribució es requereix a les unitats informants que desglossen les variables anteriorment esmentades segons on es troben els establiments des dels quals es realitza l'activitat econòmica.

L'Institut Valencià d'Estadística (IVE), a partir de les microdades facilitades per l'INE, elabora l'Estadística estructural d'empreses: Sector comerç. Resultats per a la Comunitat Valenciana.

Amb la publicació de l'Estadística estructural d'empreses: Sector comerç. Resultats per a la Comunitat Valenciana, es proporciona informació complementària a la proporcionada per l'INE per a la Comunitat Valenciana. D'una banda, s'ofereix informació sobre un conjunt més ampli de classificacions que serveixen per a establir tipologies més concretes i, d'altra, s'aporten resultats sobre un conjunt de variables molt més extens que el considerat per l'INE tant per a les empreses amb seu a la Comunitat Valenciana, com per als establiments o locals situats en aquesta. En aquest últim cas, els resultats es basen en una metodologia d'estimació les característiques de la qual s'exposen en el segon apartat d'aquest document.

1.1. Breu descripció cronològica de les principals variacions de les EEE

Fins a l'any 2014, l'INE elaborava les enquestes estructurals d'empreses mitjançant processos i calendaris separats segons el sector estudiat (enquesta endustrial d'empreses, enquesta enual de eomerç i enquesta enual de serveis). En 2015 va començar l'execució del Projecte d'integració de les enquestes econòmiques estructurals qque ha suposat una reforma de les tres enquestes esmentades en els següents aspectes:

1. Qüestionaris pràcticament uniformes per als tres sectors i adaptats, en el cas de les empreses persones jurídiques, als models normalitzats dels comptes anuals.
2. Homogeneïtzació del pla de difusió de resultats que facilita la comparació dels tres sectors.

A partir de l'exercici de referència 2016, la EEE ha experimentat una sèrie de millores:

1. Dissenys mostrals més eficients els objectius dels quals són reduir la càrrega dels informants i millorar l'aprofitament dels registres administratius.
2. Millores metodològiques relacionades amb el tractament de les empreses que causen alta o baixa de la població objectiu durant l'any de referència, així com la imputació de la falta de resposta i amb l'estimació de les variables relatives a l'ocupació utilitzant per a això fonts administratives.

A causa de les millores metodològiques implementades per a l'exercici de referència EEE-2016, l'evolució reflectida en relació a anys anteriors obeeix no sols a possibles canvis reals produïts en aquest període sinó també a aquest efecte de les millores esmentades.

A causa de les millores metodològiques implementades per a l'exercici de referència EEE-2016, l'evolució reflectida en relació a anys anteriors obeeix no sols a possibles canvis reals produïts en aquest període sinó també a aquest efecte de les millores esmentades.

L'INE va informar sobre la incidència que els canvis introduïts en 2016 van tindre en els resultats mitjançant el document titulat "Mesura de l'efecte dels canvis metodològics en les estadístiques estructurals d'empreses 2016".

L'exercici 2017 va incorporar unes certes millores o canvis menors que permeten parlar de continuïtat respecte a l'any anterior en la producció d'aquestes estadístiques estructurals integrades.

A partir de l'any de referència 2018 s'introdueix una novetat rellevant en la definició d'empresa a efectes estadístics. Fins a l'any 2017 s'havia identificat empresa amb unitat legal, però d'ara en avant sorgeix el concepte d'"empresa estadística" amb la finalitat de reflectir en les estadístiques oficials la creixent complexitat en la forma interna d'operar dels grups empresarials. Efectivament, les unitats legals que formen part d'un grup empresarial a vegades venen els seus productes o presten els seus serveis exclusivament o principalment a l'interior del grup, sense estar orientades al mercat ni tindre poder de decisió sobre el conjunt del procés productiu. L'enfocament basat en l'"empresa estadística" és per tant implementat per primera vegada en l'estadística estructural d'empresa amb any de referència 2018.

Aquest canvi no afecta l'explotació de les dades relatives a la Comunitat Valenciana, que continua oferint resultats sobre les unitats legals amb seu a la Comunitat Valenciana d'una banda, i d'una altra, sobre els establiments situats a la Comunitat. Per això, en el que segueix, els termes "empresa" i "unitat legal" s'utilitzen de manera indistinta per a fer referència al mateix concepte.

A partir de l'any de referència 2021, la realització de les estadístiques estructurals es regeix pel Reglament 2019/2152 del Parlament Europeu i del Consell relatiu a les estadístiques empresarials europees (Reglament EBS) i pel seu Acte d'Implementació 2020/1197. Els nous requeriments associats a aquest canvi han portat a una major utilització de les fonts administratives en la generació de la mostra augmentant significativament la proporció de mostra procedent d'aquestes fonts i simplificant els qüestionaris destinats a un bon nombre de Persones Jurídiques. D'altra banda, la nova regulació defineix la variable nombre d'empreses actives. S'estableix que una unitat legal (ULE) és activa en funció d'una sèrie de criteris basats en informació administrativa i el resultat d'altres operacions estadístiques. El recompte de les empreses actives dona lloc al NUE (nombre unificat d'empreses) que serveix com a referència comuna tant a les estadístiques estructurals d'empreses com a la demografia empresarial. Aquesta novetat implica una ruptura de la sèrie en 2021 quant a la variable 'Nombre d'empreses'. Una altra aportació de la la nova regulació és la clarificació dels sectors institucionals coberts per l'EEE conformat pel conjunt de les 'unitats productores de mercat', segons es defineix en el Sistema Europeu de Comptes Nacionals i Regionals (SEC 2010): societats no financeres (S.11), institucions financeres (S.12), llars com a empresaris individuals (S.14). Queden explícitamente fora de cobertura les administracions públiques (S.13) i les institucions sense fins de lucre al servei de les llars (S.15). Aquest canvi en la cobertura produeix diferències en relació amb la consideració del marc general existent en 2021 que estan reflectides en punt III de la metodologia publicada per l'INE.

Per a aprofundir en els aspectes metodològics i definicions d'aquesta operació pot recórrer-se a la metodologia publicada per l'INE, que exposa, de manera conjunta i uniforme per als tres sectors d'estudi, les principals línies metodològiques, els seus conceptes i definicions. No obstant això, a continuació, es fa referència als més importants.


2. Principals característiques metodològiques


2.1 Àmbit territorial, sectorial i temporal

La unitat estadística bàsica d'aquesta operació és l'empresa estadística, definida en els termes indicats en el punt anterior, encara que la informació bàsica s'obté a partir de les unitats legals (unitats informants), que, pel fet de disposar de les dades comptables i d'ocupació, proporcionen informació homogènia. La informació sobre una empresa estadística concreta es construeix a partir de la proporcionada per les unitats legals que la conformen mitjançant la metodologia profiling o delineació d'empreses.

La població a la qual es dirigeix l'Estadística estructural d'empreses (EEE) en els diferents sectors és la següent:

Sectors Seccions de la CNAE-2009 Divisions
Sector industrial B. Indústries extractives 05-09
C. Indústria manufacturera 10-33
D. Subministrament d'energia elèctrica, gas vapor i aire condicionat 35
E. Subministrament d'aigua, activitats de sanejament, gestió de residus i descontaminació 36-39
Sector comerç G. Comerç a l'engròs i al detall, reparació de vehicles de motor i motocicletes 45-47
Sector servicis H. Transport i emmagatzematge 49-53
I. Hostaleria 55-56
J. Informació i comunicacions 58-63
L. Activitats immobiliàries 68
M. Activitats professionals, científiques i tècniques 69-75
N. Activitats administratives i servicis auxiliars 77-82
P. Educació 85
Q. Activitats sanitàries i de servicis socials 86-88
R. Activitats artístiques, recreatives i d'entreteniment 90-93
S. Altres servicis 95-96

La EEE es realitza amb periodicitat anual, és el període de referència de les dades, amb caràcter general, l'any natural. L'excepció la constitueixen les empreses que funcionen per temporades o campanyes que comprenen diversos anys i comptabilitzen les seues dades amb aquesta premissa. Aquestes empreses proporcionen la informació de la temporada o campanya que va acabar l'any de referència de l'enquesta.

2.2 Disseny mostral

La mostra d'empreses-unitats legals s'obté utilitzant com a marc el Directori Central d'Empreses (DIRCE) mitjançant un mostreig aleatori estratificat i l'establiment d'una part exhaustiva en la mostra formada per unitats rellevants d'acord amb determinats criteris: les unitats legals amb 50 o més persones assalariats, les unitats més rellevants per persones assalariats o per xifra de negocis donades d'alta en el marc en el mateix any de referència, filials a Espanya d'empreses estrangeres i les unitats amb menys de 50 persones assalariats, però amb grans xifres de negocis. A més, s'incorporen com a unitats exhaustives altres unitats legals necessàries per a elaborar la informació en l´àmbit nacional en termes de l'empresa estadística. A la mostra d'empreses estadístiques s'arriba mitjançant mostreig indirecte.

Els estrats es formen per l'encreuament de diverses variables: comunitat autònoma, activitat econòmica principal, grups de grandària, segons el nombre de persones assalariades, xifra de negocis i naturalesa jurídica encara que aquesta última només intervé en el cas dels sectors de serveis i comerç. Aquestes variables es combinen de diferent manera en funció del sector investigat.

En general, dins de cada estrat, es calcula la grandària mostral mitjançant afixació òptima. La mostra s'obté mitjançant una selecció aleatòria usant tècniques de coordinació negativa, a fi de reduir el nombre d'enquestes que una empresa del DIRCE realitza al llarg de l'any.

2.3 Estimació

Les dades mostrals que serveixen com a punt de partida en aquesta operació contenen informació sobre el conjunt d'empreses o unitats legals que tenen seu a la Comunitat Valenciana i també sobre el conjunt de locals situats en la Comunitat amb independència d'on estiga la seu de l'empresa a la qual pertanyen.

La informació mostral proporcionada sobre les empreses amb seu a la Comunitat està formada per un conjunt extens de variables que permet obtindre una visió àmplia del seu acompliment. No obstant això, la informació disponible sobre els locals consisteix en un conjunt de quatre variables denominades variables regionalitzades: xifra de negocis, nombre mitjà de persones ocupades, sous i salaris i inversió en actius materials. En el sector industrial les empreses que formen la mostra han d'especificar les anteriors variables en cadascun dels locals en els quals desenvolupen la seua activitat, si és que en tenen més d'una. En el cas dels sectors serveis i comerç, aquestes variables s'especifiquen per comunitat autònoma, és a dir, es proporciona per a cada comunitat autònoma l'agregat corresponent a tots els locals de l'empresa que operen en aquesta.

L'IVE publica des de 2015 les enquestes estructurals sota un doble enfocament. D'una banda, es generen resultats sobre les empreses amb seu social a la Comunitat, i d' una altra, dels locals situats en aquesta. Fins a l'any de referència 2018 els resultats publicats sobre els dos àmbits esmentats es basaven fonamentalment en les principals variables comunes en els dos. A partir de l'any de referència 2019, la publicació de les enquestes estructurals proporciona l'estimació d'un nombre molt més ampli de variables tant de les empreses com dels locals situats a la Comunitat organitzades en sis blocs:

Els resultats sobre les empreses amb seu a la Comunitat Valenciana són obtinguts mitjançant estimadors d'expansió simple, ajustats per la falta de resposta i els canvis d'estrat. Així, l'estimador del total de la variable I per a un estrat h està donat per la següent expressió:

\(\hat{Y} _{h} = \hat{F}_{h}{\sum\limits_{i=1}^{n^e_h}{y_{hi}}} \)

On \(\hat{F}_h\) és el factor d'elevació estimat en l'estrat h

\(n_h^e\) és el nombre d'empreses mostrals que responen o s'imputen en l'estrat h

\(y_{hi}\) és el valor que pren la variable I en l'empresa i de l'estrat h.


L'estimador del total \(\hat{Y} _{m} \) per a un domini 'm' qualsevol (subgrups de la població que no tenen per què coincidir amb els estrats ni amb la unió d'alguns d'ells) és la suma dels totals estimats per al domini dins de cada estrat, és a dir:

\(\hat{Y} _{m} = \sum\limits_{h}\hat{F}_{h}{\sum\limits_{i=1}^{n_h^e}{y_{hi}Z_{mhi}} } \)

On \(\hat{F}_{h}\)és el factor d'elevació final associat a l'estrat h

\(Z_{mhi}\)és una variable indicadora que pren el valor 1 si l'empresa pertany al domini m i 0 en cas contrari.

Els resultats dels locals situats a la Comunitat s'obtenen de manera anàloga a l'anterior quan es proporciona la informació relativa a les variables disponibles per local o variables regionalitzes, és a dir, quan s'estima el nombre de locals, la xifra de negocis generada per aquests, el personal mitjà d'ocupats, els seus sous i salaris o la inversió material. Per a proporcionar estimacions del conjunt ampliat de variables en l'àmbit dels locals s'ha recorregut a una metodologia pròpia el fonament de la qual s'exposa a continuació.

2.4 Estimació regionalitzada del conjunt ampliat de variables

La metodologia incorporada per l'IVE en aquesta operació consta de dues fases. En la primera d'aquestes, es calcula un factor de grandària o d'escala que, aplicat a qualsevol variable mesurada en una empresa multilocalitzada , proporciona una estimació preliminar del valor d'aquesta variable en la part de l'empresa situada dins de la Comunitat desenvolupada per un o diversos dels seus locals. Per a construir el factor de grandària s'ha utilitzat el procediment de les components principals utilitzant com a variables explicatives les variables disponibles en la mostra de locals i utilitzant la norma L1. Els càlculs s'han realitzat mitjançant el paquet "pcaL1"(1) d'R(3). El factor de grandària d'un local donat ha sigut calculat com el quocient del valor de la primera component principal en el local respecte al seu valor en l'empresa a la qual pertany. La contribució d'un local a l'estimació del total d'una variable s'obtindrà com el valor que aquesta variable pren en l'empresa de la qual forma part, multiplicat pel factor de grandària i pel factor d'elevació inicial. D'aquesta manera, es construeix un nou factor d'elevació inicial que s'aplica no al valor que la variable pren en el local, sinó al valor d'aquesta variable en l'empresa a la qual pertany.

La segona fase consisteix en un calibratge de la mostra de locals a partir del concepte d'estimació de regressió generalitzada (GREG), que usa com a variables auxiliars les variables disponibles d'aquesta mostra. Per a una descripció del mètode, pot consultar-se l'article "Methodological Principles for a Generalized Estimation System at Statistics Canada"(2), la qual permet passar dels factors d'elevació de la mostra, que, en el nostre cas, han sigut adaptats, com a producte del factor d'elevació inicial i el factor de grandària, a uns nous factors d'elevació o g-factors que milloren la coherència de les estimacions, ja que reprodueixen els totals de les variables auxiliars en determinades tipologies d'activitat rellevants tant en el mostreig com en l'explotació de resultats. Els nous factors d'elevació, als quals es farà referència com a "factors de regionalitzaciò", obtinguts, permeten calcular estimacions relatives a la població de locals a la Comunitat sobre variables que no han sigut proporcionades en la seua mostra, ja que aquests factors s'apliquen als valors d'aquestes variables registrats en les empreses corresponents.

En la implementació d'aquest mètode s'han seleccionat com a classificació de referència les divisions de la CNAE-2009. En aquest àmbit, el nou sistema de factors d'elevació reprodueix els totals de les variables regionalitzades proporcionades en la mostra de locals, excepte problemes de multicolinealitat detectats en determinades divisions d'activitat els quals generen diferències lleus amb els totals estimats mitjançant els factors d'elevació originals. A causa d'aquesta característica del mètode, els resultats proporcionats per als locals situats a la Comunitat Valenciana, excepte els principals resultats, es basen exclusivament en la classificació segons divisió de la CNAE-2009.

Amb la finalitat de dotar d'una major estabilitat al procediment utilitzat, s'ha revisat l'operació de regionalització de resultats implementada fins a l'any 2020 en el que afecta el recalibrat de la mostra de locals. A partir de l'any 2021, el recalibrat s'aplica a la mostra sencera de locals i no a la submostra de locals pertanyent a empreses multilocalitzadas com ha sigut la pràctica en edicions anteriors. Aquest canvi ha reduït les incoherències detectades en algunes estimacions.

Amb aquesta metodologia s'ha ampliat l'explotació realitzada fins ara en la sèrie d'enquestes estructurals disponibles, això sense perjudici de futures revisions que eventualment puguen millorar la qualitat o quantitat dels resultats oferits.

2.5 Càlcul d'errors

L'explotació de l'Enquesta estructural d'empreses inclou el càlcul d'errors mostrals en l'estimació de les variables que formen part dels principals resultats, tant si els resultats són dels locals situats en la Comunitat com si són de les empreses amb seu en aquesta. En el primer cas es proporcionen coeficients de variació segons la sectorització pròpia especificada en aquesta metodologia i, en el segon, es proporcionen els errors mostrals obtinguts tant en la classificació segons secció i divisió de la CNAE-2009, com en la sectorització pròpia abans esmentada.

Els errors mostrals publicats fins a l'any de referència 2016 van ser calculats mitjançant la fórmula de Raulin . A partir de l'any de referència 2017, els errors mostrals inclosos en aquesta publicació són obtinguts mitjançant linealització de Taylor i, per a això, s'utilitza el paquet "Survey"(4) d'R(3).

(1) Sapan Jot, J. Paul Brooks, Andrea Visentin, Young Woong Park (2020). "pcaL1: L1-Norm PCA Methods". R package version 1.5.4.

(2) "Methodological Principles for a Generalized Estimation System at Statistics Canada". V. Estevao, M.A. Hidiroglou, and C.E. Särndal. Journal of Official Statistics, Vol. 11. No.2, 1995, pp. 181-204

(3) R Core Team (2018). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL https://www.R-project.org/.

(4) T. Lumley (2018) "survey: analysis of complex survey samples". R package version 3.35.

3. Variables

3. Variables

Les principals variables de l'enquesta poden agrupar-se en variables de classificació i d'estudi. Les variables de classificació són:

Les principals variables objecte d'estudi i publicació per la l'IVE són:


4. Tabulació de resultats

L'IVE ofereix una explotació de resultats organitzada en dos apartats:

En el primer apartat es proporcionen tabulacions d'un conjunt ampli de variables sobre les empreses amb seu en la Comunitat. Els resultats proporcionats sobre els locals són més reduïts ja que es basen en les variables disponibles per local o variables regionalitzades obtingudes mitjançant el qüestionari. En tots dos casos, els resultats s'ofereixen segons diferents tipologies d'empreses i locals basades en l'activitat que desenvolupen, en funció de la CNAE-2009, en la seua condició jurídica o en la grandària (en personal ocupat o xifra de negocis).

L'estructura d'aquest apartat és:

El segon apartat conté l'estimació regionalitzada segons el procediment descrit en el punt 2.4 de diferents variables econòmiques i de personal sobre els locals situats a la Comunitat Valenciana. Els resultats són proporcionats per grup, divisió i secció d'activitat de la CNAE-2009, segons el sector estudiat, i estan organitzats com segueix:

Amb aquesta tabulació es pretén proporcionar informació complementària a la proporcionada per l'INE sobre locals situats a la Comunitat Valenciana i consistent en la tabulació a nivell de divisió de la CNAE-09 de les cinc variables regionalitzades proporcionades en la mostra d'establiments.