Samtale på en bænk

Det har været et underligt forårssemester, og den erkendelse strejfer mig stadigt oftere. Her til formiddag tilbragte jeg en god time sammen med en fagkollega fra en anden uddannelsesinstitution end den, hvor jeg er ansat. Vi havde ikke set hinanden siden COVID-19-pandemien begyndte i Danmark, og jeg havde set frem til at vi skulle ses igen. Dér sad vi i hver sin ende af en bænk bag Aalborghus Slot med ansigterne godt gemt bag mundbind. Undervejs i samtalen fik vi vendt vores undervisning, bøger vi har læst, Baruch Spinozas gudsbegreb og alt for tidlige død, den italienske fascisme, situationen i Brasilien, sociopater, vi har mødt, principperne i COVID-19-vaccinekandidater og alt mulig andet – herunder et fælles labour of love i form af et bogprojekt om matematikkens filosofi. Vi havde nogle bøger til hinanden, til låns og til gave. Jeg glæder mig til at vi kan ses igen.

En god institutleder

Foto: Erik Kjær Pedersens hjemmeside (http://web.math.ku.dk/~erik/)

Erik Kjær Pedersen var professor og institutleder ved Institut for Matematiske Fag på Københavns Universitet fra 2007 til 2016. Han døde i maj i år på et hospital i USA efter længere tids sygdom. Inden han blev institutleder, arbejdede han med algebraisk og geometrisk topologi (og var også en overgang institutleder på SDU), så nogle, jeg kender, har kendt ham.

Jeg kan faktisk ikke rigtig huske om jeg selv har mødt Erik, men mindeordene i Universitetsavisen fra Københavns Universitet gør indtryk også på mig. Søren Eilers skriver

Fra det øjeblik Erik Kjær Pedersen blev institutleder ved Institut for Matematiske Fag, og så længe han havde den opgave, levede og åndede han for at gøre instituttet bedre i enhver tænkelig forstand. Hans engagement var så grænseløst, at det kostede ham en hospitalsindlæggelse, da instituttet gennemlevede en eksistentiel krise i 2014 i forbindelse med nogle (senere opgivne) fusionsplaner, som Erik og alle medarbejdere opfattede som ekstremt skadelige.

Fra Søren Eilers: Mindeord over Erik Kjær Pedersen, matematikkens fyrmester (https://uniavisen.dk/mindeord-over-erik-kjaer-pedersen-matematikkens-fyrmester/)

Planerne om et megainstitut, der heldigvis ikke blev til noget, er grundigt omtalt på bloggen Forskningsfrihed i 2011. De var del af en trang til centralisering og trang til omstrukturering, man har set meget af rundt omkring på danske universiteter. Matematik har altid været et af de fagområder, hvis selvstændighed ofte har været truet og også blev det her, netop fordi det på den ene side er så tydeligt anvendeligt i naturvidenskab og ingeniørfag, på den anden side er et grundfag præget af, nå ja, grundforskning og derfor af udenforstående desværre ofte ikke set som “anvendeligt i sig selv”. Også senere har vi set ubehagelige eksempler på at matematiske institutter har været truet på deres selvstændighed.

Nekrologer gør mig ofte trist til mode, og det gør denne også. Jeg tænker også på noget mere alment, nemlig på hvordan institutledere bliver udpeget oppefra (af dekaner) og på hvem og hvad institutlederen først og fremmest skal tjene – er det instituttet og fagligheden, eller er det et abstrakt krav om vækst? Søren Eilers skriver

Nøgternt set var det et modigt valg af daværende dekan Nils O. Andersen at vælge Erik til institutleder. Erik var en internationalt anerkendt forsker og havde institutledererfaring både fra Odense og Binghamton, men han var meget tydeligt autodidakt i lederrollen og havde ekstremt stærke meninger om de internationale akademiske dyders ukrænkelighed, på en måde der ikke altid flugtede med styrelsesloven, som den så ud i 2007.

Erik Kjær Pedersen var god til at fejre sine succeser, men ikke til at hvile på sine laurbær, og som enhver anden god universitetsleder tabte han aldrig af syne, at han ikke ville være noget uden sine VIP og TAP. Alligevel må man formode, at han fik nydt sit alt for korte otium i vished om, hvor vellidt og beundret han var, og hvor stor taknemmelighed matematikmiljøet ved KU skylder ham for at skabe et fyrtårn der vil lyse stærkt længe efter, at Eriks egen flamme nu er gået ud.

Fra Søren Eilers: Mindeord over Erik Kjær Pedersen, matematikkens fyrmester
(https://uniavisen.dk/mindeord-over-erik-kjaer-pedersen-matematikkens-fyrmester/)

Erik må have været en god institutleder.

Dårligt nyt fra artikelfabrikken

Den rigtige artikel er til venstre, fup-artiklen med plagieret indhold er til højre. (fra https://forbetterscience.com/2020/06/15/beggers-test-for-schrodingerean-predator-prey-system/)

Nej, det er ikke en historie fra et sted, hvor der bedrives forskning. Faktisk tværtom.

På webstedet forbetterscience.com kan man se eksempler på artikler, der er blevet publiceret selv om indholdet i stort omfang er plagiat og selv om ganske mange af forfatterne er fiktive. Det er første gang, jeg har set eksempler på dette inden for ren matematik. Og de kommer fra tidsskrifter hos Springer, nemlig Journal of Inequalities and ApplicationsAdvances in Difference Equations og Fixed Point Theory and Applications. Og de er siden blevet trukket tilbage igen. Mange af hovedforfatterne på artiklerne er fra Kina, men deres fiktive medforfattere kommer fra rundt om i verden (blandt andet mindst ét universitet i Danmark!).

Og ikke bare er artiklerne resultat af plagiat, de bruger også hjemmelavet terminologi og ser ud til ikke rigtig at hænge sammen rent indholdsmæssigt.

Den nemmeste måde at opdage svindelen på er faktisk denne (som en af kommentarerne til artiklen da også gør opmærksom på): Forskningsartikler inden for matematik har kun sjældent en konklusion; indledning og konklusion er normalt slået sammen som artiklens første afsnit. Det er anderledes i datalogi, hvor det er sædvane at have en konklusion til sidst. I fup-artiklerne, der skal forestille at være bidrag til matematisk forskning, er der faktisk konklusioner!

Der er ganske meget at tænke over i en sag som dette.

  • For det første er det bekymrende, at der er opstået “artikelfabrikker”, der systematisk producerer falske publikationer – og mit gæt er, at mange af dem findes i Kina.
  • For det andet er det bekymrende, at de pågældende artikler slap igennem en form for fagfællebedømmelse og forbi en redaktion. “Bedømmerne” kan ikke have læst artiklerne særlig grundigt eller også kender de ikke områdets bidrag ret godt. Og hvor meget kan man så faktisk fæste lid til det, der står i forskningsartikler?
  • For det tredje er det bekymrende, at artikelfabrikkerne helt åbenlyst skyldes et krav om kvantificerbare veje til akademisk succes, nemlig hvor meget man har publiceret og hvor snarere end hvad man har fundet ud af. Man bør spørge sig selv, om den akademiske kultur i de lande, der især benytter sig af “artikelfabrikkerne”, er sund. Det tror jeg nemlig ikke, den altid er.

Det genetiske isopunkt

Min fjerne slægtning Marie Krarup fra Dansk Folkeparti. Blandt hendes forfædre er arabere, sydasiater og maorier.

I genetik taler man om det genetiske isopunkt for en population. Det er det tidspunkt i fortiden, hvor hver enkelt af de daværende medlemmer af populationen enten ikke har forfædre i den nuværende population eller er forfar/formor til alle medlemmer af den nuværende population. Hvis man husker, at antallet af forfædre (mænd og kvinder under ét) vokser eksponentielt med antallet af generationer, man ser bagud, kan man ud fra det velkendte skuffeprincip i kombinatorik se, at der må være et sådant isopunkt, for menneskeheden har endeligt mange medlemmer fordelt over tid. Og det er fascinerende at tænke på at al den genetiske variation, der findes i menneskeheden i vor tid stammer herfra, og derfor også er forbløffende begrænset. Selvfølgelig er mange forfædre nogen, der voksede op i nærheden. En japaner fra vor tid har 88,4% af sine forfædre fra Japan, og de fleste af resten fra Kina og Korea med kun 0,00049% fra Norge. En nordmand fra vor tid har over 92% af sine forfædre fra Norge og kun 0,00044% from Japan. Men alligevel: Isopunktets eksistens fortæller os, at mennesker må være kommet vidt omkring og at at vi alle har nogle forfædre, der kom meget langt væk fra. I sidste ende kommer være forfædre fra Østafrika, men det er 70.000 år siden – også et lille blip i den store evolutionssammenhæng.

Hvornår indtraf isopunktet så? Det afhænger af hvilken model for migration, man vælger. De amerikanske forskere Douglas L. T. Rohde, Steve Olson og Joseph T. Chang publicerede en model i Nature i 2003, hvor de estimerede at det genetiske isopunkt lå for omkring 5000 år siden. Andre modeller sætter isopunktet senere, så sent som år 1400 f.v.t.

Rohde, Olson og Chang skriver i deres artikel at

…no matter the languages we speak or the colour of our skin, we share ancestors who planted rice on the banks of the Yangtze, who first domesticated horses on the steppes of the Ukraine, who hunted giant sloths in the forests of North and South America, and who laboured to build the Great Pyramid of Khufu.

Fra Douglas L. T. Rohde, Steve Olson og Joseph T. Chang, “Modelling the recent common ancestry of all living humans”, Nature, vol. 431, 30 september 2004 (https://www.nature.com/articles/nature02842.pdf)

Netop dét er værd at tænke over.

Norbert Wiener

Jeg sidder for tiden og er ved at lægge sidste hånd på kursusmateriale om etik i datalogi og softwareudvikling i forbindelse med et kursus i videnskabsteori. Det er underligt, at jeg først i dette forår er blevet opmærksom på de tanker, som den amerikanske matematiker og filosof Norbert Wiener (1894-1964) har gjort sig her.

Mange, der har læst matematik, kender Wiener som en vigtig skikkelse i det 20. århundredes anvendte matematik, og en del, der har læst datalogi, ved at Wiener er ophavsperson til ordet kybernetik, der lever videre i populærudtryk som cyberspace. Nogle ved også, at Norbert Wiener var særdeles fremmelig som ung. Han fik sin bachelorgrad i matematik fra Harvard som 14-årig, studerede derefter zoologi og filosofi (på Cornell) og brugte så et år på en PhD i matematik. Den blev han færdig med i en alder af 18. (Norbert Wieners far Leo Wiener er faktisk også en interessant skikkelse; han forlod sit hjemland Polen for at stifte et vegetarisk kollektiv i Britisk Honduras, men havnede i USA – og lærte sig efterhånden at tale tredive sprog og blev professor i filologi, selv om han ikke havde nogen formel uddannelse.)

Norbert Wiener ville gerne have været soldat i 1. verdenskrig, men han blev kasseret. I 2. verdenskrig arbejdede han med udvikling af antiluftskytskanoner. Men efter krigen blev Wiener pacifist. Og det var vel her, hans filosofiske virke begyndte. Han tænkte over problemstillinger som konsekvenserne for mennesket af øget automatisering og over mennesket som informationsbehandler. Det er nu tydeligt for mig, at han på mange måder var langt forud for sin tid, og han fortjener at blive genopdaget. Prøv at se dette citat fra hans bog The Human Use of Human Being fra 1950 og tænk på de kriser, menneskeheden står i lige nu.

Hvad mange af os ikke har indset, er, at de sidste fire hundrede år er en meget speciel periode i verdenshistorien. Det tempo, hvormed ændringer i disse år har fundet sted, har intet modstykke i tidligere historie, ej heller selve ændringernes natur. Dette er til dels resultaterne af øget kommunikation, men også af en øget mestring af naturen, som på en begrænset planet som Jorden på sigt kan vise sig at være et øget slaveri af naturen. For jo mere vi kommer ud af verden, jo mindre efterlader vi, og i det lange løb bliver vi nødt til at betale vores gæld på et tidspunkt, der kan være meget upraktisk for vores egen overlevelse.

Fra The Human Use of Human Beings (1950) (min oversættelse)

Kornene på skakbrættet og COVID-19

Skakbræt med hvedekorn.

Hvis jeg endelig skal kritisere noget ved den igangværende håndtering af COVID-19-epidemien, er det at kommunikationen af, hvorfor vi har at gøre med et problem, først nu her til sidst blev klar – og så alligevel ikke. De allerfleste borgere forstår vel nu, at COVID-19 kan belaste sundhedsvæsenet voldsomt, men mange oplever stadig situationen som paradoksal. Det er jo i de fleste tilfælde ikke alvorlige sygdomsforløb, vi har med at gøre (og personligt er jeg da heller ikke bekymret for mit helbred). Den korte forklaring er, at når der er rigtig mange smittede, er der, selv når antallet af alvorligt behandlingskrævende patienter er en lille procentdel, mange alvorligt behandlingskrævende patienter.

Hvorfor bliver der så så mange smittede? Problemet er netop, at COVID-19-sygen så ofte har et mildere forløb end influenza. For da kan da de smittede gå rundt blandt andre i længere tid og føre smitten videre, inden de selv opdager, at der er noget galt og lægger sig syge. Hvis hver enkelt COVID-19-smittet person i løbet af 2 dage når at smitte 2 personer, bliver antallet af nye smittede fordoblet i løbet af 2 dage. Og det lyder ikke slemt for lægfolk, men det er det – thi hvis hver ny smittet person smitter nogen på denne måde, er der i et godt stykke tid tilnærmelsesvis tale om eksponentiel vækst i antallet af nye tilfælde.

Den bedste illustration af eksponentiel vækst er måske historien om hvedekornene på skakbrættet fra 1256; den skyldes den kurdiske historiker Ibn Khalikan. En vismand opfandt skakspillet og bad kongen om at få en lille belønning for at have opfundet dette gode brætspil, nemlig nogle hvedekorn på et skakbræt. På felt 1 skulle der være 1 hvedekorn, og på hvert efterfølgende felt skulle der lægges dobbelt så mange korn som på det foregående. Det lyder som et beskedent forlangende, men er det ikke. Allerede på felt 24 er der ca. 8 millioner hvedekorn, og kongen måtte da også til sidst give fortabt.

Lad os så genfortælle historien om skakbrættet som en historie om COVID-19-tilfælde, hvor felterne er perioder på 2 dage og smitten får lov at sprede sig frit. Felt nummer 24 svarer så til dag 48, og da er alle 5,6 millioner borgere i Danmark blevet smittet. Selvfølgelig er det ikke sådan; antagelsen om eksponentiel vækst er kun korrekt på kortere sigt. Rigtig mange er efter knap to måneder for længst blevet raske igen da og er derefter immune. Andre kan ikke blive syge, fordi de har mistet livet. Men selv hvis kun 2 procent er alvorligt behandlingskrævende (det tal er meget lavt sat), vil det betyde, at 280.000 borgere har skullet modtage behandling i løbet af knap to måneder. Den slags ville sundhedsvæsenet i Danmark selvfølgelig ikke kunne håndtere. Jeg håber, de nye og meget vidtgående foranstaltninger kan fjerne hvedekornene fra skakbrættet.

Min første datalogibog

I dag kom jeg til at snakke med nogen om lærebøger om algoritmer og datastrukturer, der er et af de helt grundlæggende fag på datalogiuddannelser. En udbredt lærebog om dette emne er i vore dage blevet Introduction to Algorithms af Cormen, Leiserson, Rivest og Stein. Det er en grundig og præcis bog, der også tager videregående emner op, men den er også på nogle måder ved at blive en encyklopædi. Den udgave, jeg selv ejer, er en mursten på 1180 sider.

Selv blev jeg introduceret til algoritmer og datastrukturer af en bog på sølle 427 sider, Data Structures and Algorithms af Aho, Hopcroft og Ullman. Jeg kom dengang lige fra matematikstudiet og syntes, at denne bog var en “underlig matematikbog”. I dag har jeg en noget mere positiv opfattelse af den – og den er rar at slå op i. Men om denne klassiker ville være en god introduktion i dag, ved jeg ikke.

Engang var mange lærebøger kortfattede; jeg mindes Principles of Mathematical Analysis af Walter Rudin, den første kortfattede bog, jeg stødte på. Der var et hav af mellem-ræsonnementer, som læseren selv skulle opdage, og det kunne sagtens tage en time eller mere at læse en side. Som lærebog betragtet var Rudins bog noget af en mundfuld. Til gengæld var mange af mine medstuderende glade for A First Course in Abstract Algebra af John B. Fraleigh. Den var (selvfølgelig) helt stringent, men noget mere “snakkende” end Principles of Mathematical Analysis. I dag er jeg lidt mere forbeholden over for den og noget mere positiv over for Rudins bog.

En datalogibog, der virkelig delte vandene i min studietid, var Introduction to Automata Theory, Languages and Computation fra 1979 af Hopcroft og Ullman. Bogen var forholdsvis kortfattet, men nåede meget langt omkring inden for automatteori, beregnelighed og kompleksitetsteori. En senere udgave havde Motwani som medforfatter og var meget mere “snakkende” og havde skåret en del stof væk. De fleste foretrækker at henvise til 1979-udgaven, og sådan har jeg det også.

Alt dette tyder på, at man i virkeligheden har brug for to forskellige fremstillinger af det grundlæggende stof – en indledende, der er grundigt forklarende og er målrettet begyndere, og en fremstilling beregnet på den erfarne fagperson, der har brug for et godt opslagsværk. Men der er samtidig ikke nogen grund til at den indledende fremstilling skal være så lang, som indledende fremstillinger ofte har en tendens til at være.

Kun én artikel om året?

Tasawar Hayat – vor tids største matematiker? Han er i al fald den mest publicerende.

I går fik jeg besked om at jeg har fået en artikel optaget til en konference, der finder sted i februar 2020, så næste års publikationsrunde er allerede i gang. Artiklen dokumenterer resultater, som stammer fra et speciale som jeg vejledte i foråret. Men én artikel er ikke meget, og de sølle fire artikler, jeg fik publiceret sidste år, er bestemt heller ikke noget imponerende antal.

I den akademiske verden er det vigtigt at publicere så meget som muligt i så gode tidsskrifter og ved så gode konferencer som overhovedet muligt. Den mest publicerende forsker i årene fra 2016 til 2018 er Tasawar Hayat, der er professer i matematik ved Quaid-i-Azam University i Pakistan. Han publicerede hele 996 artikler i den periode, dvs. næsten én publikation om dagen. Så vidt jeg kan se, er en stor del af hans forskningsområde inden for matematisk fysik i den mest anvendelsesorienterede ende og har berøringsflader til maskinintelligens. Lødigheden af Hayats bidrag tør jeg ikke udtale mig om. Men det er forbløffende med denne ekstreme publikationsfrekvens; mange matematikere inden for den rene matematik publicerer kun 1-2 artikler om året.

Den tyske kognitionsforsker Uta Frith, der er professor med University College London, har en lidt anden tilgang. I en helt ny artikel i tidsskriftet Trends in Cognitive Sciences anbefaler hun faktisk, at det bliver et krav, at man kun publicerer én artikel om året. Hun skriver endda

When I look at my CV, I see papers that I wish I had not published, because they are either not sufficiently original or methodologically robust. I think it is important to tell younger researchers about this regret and make them aware that in time they might feel similarly. There are plenty of examples to show that a scientist’s reputation in the long run will be built on their best publications and lessened or even undermined by their weaker ones.

(fra Frith, Fast Lane to Slow Science, Trends in Cognitive Sciences (2019), https://doi.org/10.1016/j.tics.2019.10.007)

Det er en betragtning, jeg deler. Som Frith nævner, er det i virkeligheden et spørgsmål om at have et godt ry som forsker, der er det væsentlige, og om at kvalitet ikke nemt lader sig “fortynde”. Mange konferencerækker i datalogi har nu indstiftet en Test of Time Award, som bliver givet til 10 år gamle publikationer fra samme konference, der senere har vist sig at være særligt indflydelsesrige. Og når jeg ser på prisvinderne fra den lille del af datalogi, som jeg selv beskæftiger mig med, er jeg helt enig med udnævnelserne. Problemet er selvfølgelig, at dette gode ry på længere sigt ikke kan måles med det kortsigtede her-og-nu-fokus, som man i være dage bruger for at måle forskningens kvalitet, men i virkeligheden i mindst lige så stort omfang måler dens kvantitet.

Hvordan man løser det

Flere gange på det seneste har jeg anbefalet nogen at læse klassikeren How To Solve It af den store ungarsk/amerikanske matematiker George Pólya (ungarsk: Pólya György). Bogen, der udkom i 1975. har gjort et stort indtryk på mig; jeg købte den i 1982, ugen inden jeg begyndte at studere. I lang tid var jeg mest fascineret af alle bogens snedige opgaver, men i dag er jeg optaget af alle Pólyas indsigtsfulde, erfaringsbaserede råd til løsning af (især, men vel ikke kun) problemer fra matematikkens verden.

Hans bud på de fire trin i god problemløsning er

  • Trin 1: Forstå problemet
  • Trin 2: Udarbejd en plan (oversæt)
  • Trin 3: Udfør planen (løs)
  • Trin 4: Kig tilbage (tjek og fortolk løsningen)

På denne måde er der klare paralleller til problemorienteret projektarbejde, selv om fokus i How To Solve It er på små/mindre opgaver. Tænk, hvis de, der skal lære at løse matematiske problemer i forbindelse med deres uddannelse, kunne læse Pólyas lille klassiker på et tidspunkt – og tænk hvis de, der skal undervise andre i at løse problemer, kunne med dem om at sammenligene deres proces med de fire forholdsvis veldefinerede skridt ovenfor. Og tænk, hvis nogen en dag ville sørge for at How To Solve It kunne blive oversat til dansk. Det er nemlig stadig en bog, mange uddannelsessøgende kunne have glæde af at læse.

At aksiomatisere det hele

Det kommutative diagram for et pullback.

En person fra mit fagområde sagde engang i al venskabelighed, at han ligesom jeg gerne ville kunne aksiomatisere det hele, men at det jo langt fra er alle inden for datalogi, der har det på den måde. Han havde og har ret. En del af mine publikationer fra de seneste år er netop forsøg på at give en generel teoretisk forståelse af en bestemt slags typesystemer, og på den måde har jeg netop haft som formål at aksiomatisere, om ikke det hele, så dog et lille hjørne.

Det er fascinerende at læse om mere ambitiøse anstrengelser i matematisk regi. Quanta Magazine har nu en artikel (også udgivet hos Wired) om kategoriteori – eller rettere toposteori – som et bud på matematikkens grundlag. Her er det interessant at læse forsøgene på at forklare toposteori for lægfolk med interesse for matematik; jeg er ikke sikker på at det helt er lykkedes.

Jeg ville selv ønske, at jeg havde et mere naturligt forhold til kategoriteori. Selv om jeg engang har fulgt et kursus i kategoriteori, da jeg var PhD-studerende i Edinburgh, har jeg haft en ærgerlig fornemmelse af at skulle gen-lære kategoriteori, de få gange jeg har haft brug for det senere. Det er desværre stadig ikke et sprog, jeg taler flydende, selv om jeg er sådan én, der gerne ville aksiomatisere det hele. Min eneste trøst (og den er en underlig én) er, at jeg ikke er den eneste, der har det sådan. Selv blandt “rigtige” matematikere er det ikke alle forundt at beherske sproget flydende. Mit håb er nu at kunne genbesøge kategoriteori ud fra en forståelse af den som en visualisering af begreber inden for funktionel programmering – men det er en anden snak.