Firs-tyve

firstyve

Af og til hører jeg om “80/20”-reglen. Det anslås at 80 procent af alle køretidsfejl i Microsofts software skyldes 20 procent af fejlene i koden. Jeg kan også læse, at det i USA er 20 procent af de kriminelle, der begår 80 procent af al kriminalitet.

Jeg tør ikke sætte tal på, men jeg har også selv en fornemmelse af at det til offentlige møder oftest er en lille andel af de tilstedeværende, der taler suverænt mest (ved de foredrag, jeg har givet om gruppebaseret projekteksamen har det hver gang været sådan) og af at det både i studerendes projektarbejde og i egen og andres forskning så godt som altid er tilfældet at det meste og det mest spændende sker i den sidste måned – så der bliver brugt uforholdsmæssigt meget tid i starten på noget, der senere viser sig at være af begrænset værdi.

80/20-reglen blev formuleret i 1906 af den italienske økonom Vilfredo Pareto (1848-1923), der bl.a observerede at 20 procent af hans ærteplanter leverede 80 procent af udbyttet og at 80 procent af al jord i Italien, da Pareto levede, blev ejet af 20 procent af befolkningen. Den tid, hvor Pareto var aktiv, var i øvrigt også den tid hvor en anden italiener, Corrado Gini, gav sit bud på et kvantitativt mål for økonomisk ulighed, den såkaldte Gini-koefficient. Også Ginis arbejde er baseret på studiet af fordelingsfunktioner.

Reglen hænger sammen med en antagelse om at mange fænomener følger det, man nu kalder en Pareto-fordeling. En stokastisk variabel $latex X$ er Pareto-fordelt med parametre $latex \alpha$ og $latex x_m$ hvis dens fordelingsfunktion er givet ved

$latex F_X(x) = \begin{cases} 1 – (\frac{x_m}{x})^{\alpha} & \mbox{for } x \geq x_m \\ 0 & \text{for } x < x_m \end{cases}$

Så $latex x_m$ angiver en minimumsværdi, som $latex X$ kan antage. Hvis man sætter $latex \alpha = \log_4 5 \approx 1.16$, får vi netop 80/20-reglen.

Er Pareto-fordelingen “naturlig”? Det ved jeg ikke – jeg er ikke matematikøkonom (læser du min blog, Esben?) – men der findes en samling resultater som giver tilstrækkelige betingelser for hvornår en stokastisk variabel er Pareto-fordelt. På den måde er de vel en slags pendanter til den centrale grænseværdisætning.

Hvis arbejdsindsats også er Pareto-fordelt og følger 80/20-loven, skulle man tro at man kunne effektivisere sin arbejdsplanlægning. Men hvis man udvælger 20 procent af opgaverne og nøjes med at koncentrere sig om dem, betyder det kun, at man stadig vil ende med at bruge 80 procent af sine resurser på 20 procent af dette udvalg. Fordelingskurven er nemlig selv-similær i matematisk forstand!

80/20-reglen er under alle omstændigheder ikke en universel lov, og det er vigtigt at huske. I bedste fald er 80/20-reglen vel en beskrivelse af bestemte situationer, hvor man ikke regulerer det, man måler. Tallene er ikke naturkonstanter. I samfund med stor social ulighed ser det som bekendt ganske anderledes ud – for eksempel er det i nogle lande i verden en meget lille procentdel af befolkningen, der ejer næsten al jord. Hvis vi vil forhindre at 80 procent af jorden ejes af 20 procent af befolkningen, kan det ske gennem en jordreform. På tilsvarende vis kan man påvirke fordelingen af den tid, man bruger på bestemte arbejdsopgaver.

Desuden er det vigtigt at huske, at vi har en tendens til at hæfte os ved de tilfælde, der bekræfter vores hypotese – nemlig de tilfælde, der opfylder 80/20-reglen. I virkeligheden er de interessante tilfælde jo de mange tilfælde, hvor det ikke sker!

Flattr this!