U moet echt weten wat het Andrew-bestandssysteem is

Toen ik zag dat de makers van het Andrew File System (AFS) waren benoemd tot ontvangers van de $ 35K ACM Software System Award, zei ik tegen mezelf: "Dat is cool, ik herinner me AFS uit de tijd van bedrijven als Sun Microsystems ... 't vraagt ​​me om uit te leggen wat het in hemelsnaam is.'

Vraag het ook niet aan mijn collega's. Een snel rondlopen-het-kantoor-onderzoek van een half dozijn van hen bleek meestal blanco blikken bij de vermelding van het Andrew File System, een technologie die begin jaren tachtig werd ontwikkeld en vernoemd naar Andrew Carnegie en Andrew Mellon. Maar zoals de prijs van de Association for Computing Machinery zou aangeven, is AFS inderdaad de moeite waard om te weten als een fundamentele technologie die de weg vrijmaakte voor veelgebruikte cloud computing-technieken en -toepassingen.

MEER: Razendsnelle rondleiding door de belangrijkste prijzen, onderscheidingen en prijzen van tech

Mahadev "Satya" Satyanarayanan, een Carnegie Mellon University Computer Science professor die deel uitmaakte van het AFS-team, beantwoordde een handvol van mijn vragen via e-mail over de oorsprong van dit schaalbare en veilige gedistribueerde bestandssysteem, de betekenis ervan en waar het staat vandaag. Satyanarayanan werd erkend door ACM samen met John Howard, Michael Leon Kazar, Robert Nasmyth Sidebotham, David Nichols, Sherri Nichols, Alfred Spector en Michael West, die als team werkten via het Information Technology Center-partnerschap tussen Carnegie Mellon en IBM (de laatste van die deze ACM-prijs overigens financierde).

Is er een manier om te kwantificeren hoe wijdverbreid AFS-gebruik werd en welk soort organisaties het het meest gebruikten? Elk gevoel van hoeveel het nog steeds wordt gebruikt en waarvoor?

AFS is in een periode van ongeveer 25 jaar gebruikt door veel Amerikaanse en niet-Amerikaanse universiteiten. Veel nationale laboratoria, supercomputingcentra en soortgelijke instellingen hebben ook AFS gebruikt. Bedrijven in de financiële sector (bijvoorbeeld Goldman Sachs) en andere industrieën hebben ook AFS gebruikt. De paper "An Empirical Study of a Wide-Area Distributed File System", die verscheen in ACM-transacties op computersystemen in 1996. In dat artikel staat:

"Oorspronkelijk bedoeld als een oplossing voor de computerbehoeften van de Carnegie Mellon University, is AFS uitgebreid met ongeveer 1000 servers en 20.000 klanten in 10 landen. We schatten dat meer dan 100.000 gebruikers dit systeem wereldwijd gebruiken. Zowel in geografische als in aantal gebruikers en machines is AFS het grootste gedistribueerde bestandssysteem dat ooit is gebouwd en serieus wordt gebruikt. "

Figuur 1 in dat artikel laat zien dat AFS ten tijde van de momentopname 59 educatieve cellen, 22 commerciële cellen, 11 overheidscellen en 39 cellen buiten de Verenigde Staten omvatte. Naast deze grote federatieve implementatie van AFS met meerdere organisaties, waren er veel niet-federatieve implementaties van AFS binnen individuele organisaties.

Wat is de grootste impact van AFS op de huidige cloud- en enterprise-computeromgevingen?

Het model van het opslaan van gegevens in de cloud en het leveren van delen ervan via on-demand caching aan de rand is iets dat iedereen vandaag als vanzelfsprekend beschouwt. Dat model is voor het eerst bedacht en gedemonstreerd door AFS en is misschien wel de grootste impact. Het vereenvoudigt de beheercomplexiteit voor operationeel personeel, terwijl de prestaties en schaalbaarheid voor eindgebruikers behouden blijven. Vanuit het oogpunt van eindgebruikers biedt de mogelijkheid om naar elke machine te lopen en deze als uw eigen machine te gebruiken, enorme flexibiliteit en gemak. Alle gegevens die specifiek zijn voor een gebruiker, worden op aanvraag via het netwerk geleverd. Alle machines die u gebruikt synchroon houden, wordt triviaal. Gebruikers van organisaties die AFS gebruikten, vonden dit een verslavende mogelijkheid. Het was inderdaad dit vermogen dat de oprichters van DropBox inspireerde om hun bedrijf te starten. Ze hadden AFS bij MIT gebruikt als onderdeel van de Athena-omgeving en wilden op grotere schaal dit moeiteloze vermogen mogelijk maken om alle machines die door een persoon worden gebruikt synchroon te houden. Ten slotte hebben veel van de architectonische principes en implementatietechnieken van AFS de afgelopen decennia veel andere systemen beïnvloed.

Hoe is AFS in de eerste plaats ontstaan??

In 1982 ondertekenden CMU en IBM een samenwerkingsovereenkomst om een ​​"gedistribueerde personal computing-omgeving" te creëren op de CMU-campus, die later door IBM op de markt zou worden gebracht. De daadwerkelijke samenwerking begon in januari 1983. Een goede referentie voor informatie over deze begindagen is de CACM-paper uit 1986 van [James H.] Morris et al, getiteld "Andrew: A Distributed Personal Computing Environment". De context van de overeenkomst was als volgt. In 1982 had IBM zojuist de IBM-pc geïntroduceerd, die zeer succesvol bleek te zijn. Tegelijkertijd was IBM zich er terdege van bewust dat het gebruik van personal computing op bedrijfsniveau de technische vaardigheid vereiste om informatie gemakkelijk, veilig en met passende toegangscontroles te delen. Dit was mogelijk in de timesharing-systemen die begin jaren tachtig nog dominant waren. Hoe dit te bereiken in de versnipperde en gefragmenteerde wereld van een pc-onderneming was in 1982 niet duidelijk. Een groot deel van de samenwerkingsovereenkomst tussen IBM en CMU was het ontwikkelen van een oplossing voor dit probleem. Meer dan de helft van het eerste jaar van het Informatie Technologie Centrum (1983) werd besteed aan het brainstormen over hoe dit doel het beste kan worden bereikt. Door dit brainstormproces ontstond rond augustus 1983 een gedistribueerd bestandssysteem als het beste mechanisme voor het delen van informatie op ondernemingsniveau. Hoe we een dergelijk gedistribueerd bestandssysteem konden implementeren, werd toen de focus van onze inspanningen.

Wat zouden de AFS-makers anders hebben gedaan bij het bouwen van AFS als ze het opnieuw moesten doen?

Ik kan ten minste twee dingen bedenken: een klein en een groot.

Het kleine ding is dat het ontwerp en de vroege evolutie van AFS plaatsvonden voordat de op netwerkgebaseerde vertaling (NAT)] gebaseerde firewalls in netwerken ontstonden. Deze worden tegenwoordig op grote schaal gebruikt in huizen, kleine ondernemingen, enz. Hun aanwezigheid maakt het voor een server moeilijk om contact met een cliënt te initiëren om een ​​terugbelkanaal tot stand te brengen. Als we AFS hadden ontwikkeld na het wijdverbreide gebruik van NAT-gebaseerde firewalls, hadden we zorgvuldig nagedacht over hoe we callbacks het beste kunnen implementeren in aanwezigheid van NAT-firewalls..

Het grotere heeft te maken met het World Wide Web. De Mosaic-browser verscheen begin jaren negentig en Netscape Navigator iets later. AFS bestond toen al vele jaren en werd op veel plaatsen op grote schaal gebruikt. Als we ons hadden gerealiseerd hoe waardevol de browser uiteindelijk als hulpmiddel zou worden, hadden we er veel meer aandacht aan besteed. Een browser kan bijvoorbeeld in AFS worden gebruikt door "file: //" te gebruiken in plaats van "http: //" in adressen. Alle krachtige machines voor caching en consistentieonderhoud die in AFS zijn ingebouwd, zouden dan toegankelijk zijn geweest via een gebruiksvriendelijke tool die uiteindelijk enorm waardevol is gebleken. Het is mogelijk dat de browser en AFS een veel symbiotischer evolutie hadden kunnen doormaken, zoals HTTP en browsers uiteindelijk deden.

Het lijkt erop dat er misschien restanten van AFS in de open source-wereld leven?

Inderdaad. OpenAFS blijft een actief open source-project. Veel instellingen (waaronder CMU) blijven AFS gebruiken voor productiegebruik en deze code is nu gebaseerd op OpenAFS.

Ook werkte mijn werk aan het Coda-bestandssysteem af van de november 1986-versie van AFS. Coda was halverwege de jaren negentig open source. Die codebasis blijft vandaag de dag levend en functioneel. Begraven in Coda zijn ideeën en daadwerkelijke code van vroege AFS.

Heeft een van jullie spectaculaire plannen voor wat ze met het prijzengeld zullen doen?

Nog niets concreets. We hebben gesproken over het mogelijk doneren van het geld aan een goed doel.

Word lid van de Network World-gemeenschappen op Facebook en LinkedIn om commentaar te geven op onderwerpen die voorop staan.