World Wide Web

Henrik Ahlgren,
Lauri Laitinen

Internet-verkko on vuodesta 1994 lähtien ollut lähes jokaisen lehden otsikoissa ja aikaansa seuraavien ihmisten huulilla. Netin suosiota on vauhdittanut ehkä eniten sveitsiläisen Cernin tutkimuskeskuksen suojissa kehitetty World Wide Web eli WWW tai W3. Netti toimii vihdoinkin kuten useimmat käyttäjät haluavat: koko maailma on hiirikäden ulottuvilla.

Työasemahypermedia ja CD-ROMit ovat PC-maailmassa tällä hetkellä kuumia sanoja. Kyseessä voi kuitenkin olla ohimenevä ilmiö. Maailmanlaajuiseen verkkoon kytkemätön, fyysisellä WORM-medialla staattista tietoa säilyttävä kone on lähes yhtä vanhakantainen lähestymistapa tietoon, kuin paperille painettu, hyllymetrin mittainen tietosanakirjasto. CD-ROMin kaltaista ylimenokauden järjestelmää tietenkin tarvitaan niin kauan, kuin nopeat (riittävän nopeat liikkuvan videokuvan reaaliaikaiseen siirtämiseen) verkkoyhteydet eivät saavuta käyttäjämassoja.

WWW on maailmanlaajuisesti hajautettu hypermediaverkosto, jota ei — kuten ei Internetiä yleisestikään — omista tai hallinnoi mikään yksittäinen instanssi. Alunperin internet suunniteltiin Yhdysvalloissa ydinsodan kestäväksi tietoverkoksi.

Hypermedialla tarkoitetaan hypertekstin ja multimedian yhdistelmää. Hypertekstin idea on useimmille tuttu MS-Windowsin Helpistä.

WWW-ideologia perustuu hajauttamiseen sanan äärimmilleen viedyssä merkityksessä: verkossa oleva tieto voi sijaita missä vain — sekä hallinnollisessa että fyysisessä mielessä. Toisaalta WWW on painettuun sanaan verrattuna keskittämistä: tieto sijaitsee fyysisesti vain yhdessä paikassa (tai joskus peilattuna siirtokuorman vähentämiseksi).

Jokainen WWW-palvelin on itsenäisesti hallinnoitu tietokasauma, hajautuksen muodostavat näiden tietokasaumien välille tehdyt linkit.

Dokumenttien ja linkkien tekemistä ei valvo kukaan. Näin WWW:stä muodostuu kuin itsestään valtavasti tietoa — sekä hyödyllistä että viihdyttävää, kuin myös turhaa ja hyödytöntä — sisältävä hypermediaverkosto. Tietoa jäsennetään täysin anarkistisesti.

Paperilla on ylivoimaisia ominaisuuksia, joten se ei luultavasti kuole koskaan. tietokoneverkkojen ansiosta kertakäyttöisen A4- saasteen ja muun turhan paperin kulutus tulee kuitenkin vähenemään. Etätyö vähentää myös turhaa autoliikennettä. Näin tietokoneverkot ovat eräs parhaista välineistä ympäristöystävällisemmän tulevaisuuden toteuttamiseksi.

Mitä sieltä löytyy?

Tähän kysymykseen ei enää kukaan pysty vastaamaan tyhjentävästi. WWW-palvelimen saa perustaa kuka tahansa, eikä siitä tarvitse ilmoittaa kenellekään. Mitä tahansa tietoa, jota voidaan esittää tekstinä, liikkuvana ja stillkuvana tai äänenä, voidaan jakaa Internetissä.

WWW-palvelimet voidaan jakaa karkeasti kolmeen ryhmään.

  1. Yritysten yleensä pr-mielessä ylläpitämät palvelimet. Nämä ovat yritysesitteitä elektronisessa muodossa. Yritykset voivat esimerkiksi julkaista hinnastonsa edullisesti ja nopeasti. Vähitellen Internetin kautta käytävä bisnes alkaa saada konkreettisempia muotoja. Jo nyt voi verkon kautta tilata Yhdysvalloissa mm. kirjoja, CD:itä ja Pizza Hutin takeawaypizzoja.
  2. Korkeakoulujen, aatteellisten yhdistysten ja julkisten laitoisten palvelimet. Yleishyödyllinen tieteeseen, yhteiskuntaan, harrastuksiin yms. liittyvä tieto saadaan vihdoinkin halvassa ja käytännöllisessä muodossa kaikkien ihmisten ulottuville. Nyt jo esimerkiksi hallituksen lakiehdotukset eduskunnalle ovat luettavissa WWW:n kautta. Kirjoittajat uskaltavat toivoa, että lähitulevaisuudessa kaikki julkiset asiakirjat ja lait löytyvät helposti hiiren naksautuksella. Eräs esimerkki julkisesta palvelusta on Yhdysvalloissa vasta avattu Valkoisen talon palvelin, jossa on luettavissa kaikki presidentin puheet — sekä amerikkalaiseen tyyliin kevynnyksiä, kuten Socks-kissan kuvia ja ääntä.
  3. Yksityishenkilöiden sivut. Sisältävät tyypillisesti vain yhden tai pari sivua: henkilön yhteystiedot, kenties joitakin valokuvia ja tietoa harrastuksista (linkkeinä niitä käsitteleviin tietovarastoihin). Yksityishenkilöiden sivuilta voi löytää myös kunnianhimoisempia projekteja ja isojakin elektronisia julkaisuja.

Ongelmana tiedon eläminen

Sähköinen tieto ei painetun tiedon tapaan ole pysyvää. Internetissä olevan tiedon elämisessä piilee kaksi ongelmaa.

  1. Tieto elää liikaa. Dokumentteja siirretään palvelimesta toiseen, lopetetaan tai niiden rakennetta muutetaan täysin. Muuttaneelle tai lopettaneelle sivulle voi olla virheellisiä linkkejä sadoista muista sivuista. Nettaaja voi kokonaan menettää mielenkiintoista materiaalia, jos ei ota siitä kopiota omaan koneeseensa.
  2. Tieto ei elä. WWW-sivujen ylläpitäjät usein kyllästyvät tai muusta syystä jättävät sivut oman onnensa nojaan. Vanhentunutta ajankohtaista tietoa sisältävät sivut muuttuvat karhunpalvelukseksi.

... ja sen määrä

Ihminen voi lukea ja omaksua varsin isoja määriä tekstimuodossa olevaa tietoa. Raja tulee kuitenkin aina vastaan, sillä vuorokaudessa on vain 24 tuntia. Kukaan ei pysty lukemaan murto-osaakaan edes nykyisen "information superhighwayn" esikuvan sisältämästä tekstistä. Yhtä suuri ongelma on myös haluamansa tiedon löytäminen. Internet saattaa aluksi tuntua kuin kirjastolta, jonka kaikki sadattuhannet kirjat olisi ripoteltu hyllyihin vailla minkäänlaista järjestystä.

Lukija ei halua silmilleen valtavia määriä raakadataa, vaan toimitettua, sopivan kokoisiksi paloiksi jäsenneltyä tietoa. Päivän uutiset ovat parhaimmillaan aamiaisen mittaisina: tämä on yksinkertainen syy sanomalehtien suosioon. Toisaalta yksityiskohtainenkin tieto pitää olla tarvittaessa saatavilla.

Information filtering on yksi monia Internet-aktivisteja kiinnostava ala. Päivittäisestä Usenet news -tulvasta voi jo tilata sopivilla hakusanoilla karsitun yhteenvedon sähköpostissa. Automaattisuus on tärkeä seikka, sillä pääosin talkootyöllä pyörivässä verkossa ei toistaiseksi juurikaan ole ammattitoimittajia ja maksullisia julkaisuja, joskin hyvin monet paperilehdet julkaistaan maksutta WWW:ssä.

Sopivan laskutusmenetelmän käyttöönoton myötä näitä tietenkin syntyy, mutta ongelmaksi voi muodostua tekijänoikeusrikoksien valvomisen mahdottomuus ja bittimuotoisen tiedon kopioimisen helppous. Varsinkin kun tiedon kopiointia ei Internetin "puukenkäporukassa" ole perinteisesti pidetty moraalittomana: "Information wants to be free."

Tiedon määrä tekee sen tutkimisesta helposti hätäistä pomppimista linkistä toiseen. Lopputuloksena voi olla se, ettei yhtäkään dokumenttia saada luettua kokonaisuudessaan. Kun on seurattu hakusanalinkistä sinne tänne useita pomppauksia, ei enää tulekaan palattua alkuperäiseen tekstiin. Hyperlinkit muodostavat topologialtaan täysin mielivaltaisen verkoston, johon on helppo kompastua ja eksyä.

Tiedon totuudenmukaisuus

Ihmiset ovat tottuneet luottamaan paperille painettuun sanaan — vaikkakin kirjastot ovat pullollaan väärää tietoa sisältäviä teoksia. Netissä väärän tiedon levittäminen on vaivatonta. Sensuuria on totuttu pitämään teknisenä vikana, jonka ohi reititetään tavalla tai toisella. Mitään ei siis pitäisi uskoa ehdottomana totuutena. Verkossa liikkuu mm. hengenvaarallisia psykedeelisten kemikaalien valmistukseen liittyviä kotikemistireseptejä ja kyseenalaisia lainkierto-ohjeita. Nettaajien terve epäluulo ja järjen käyttö toimii sensuuria ja holhousta sivistyneemmin.

Webin tekniikka

WWW perustuu client/server-malliin (HTTP). Kuvauskieli, jolla dokumentit kirjoitetaan, on HTML (hypertext markup language). Se on melko pelkistetty kieli, jolla voidaan kuvata tekstin ulkoasua varsin ylimalkaisesti. Tekstikappaleet rivitetään asiakasohjelmassa ikkunan levyiseksi ja tekstityylit ilmaistaan loogisella tasolla. Esimerkiksi eri pää- ja alaotsikoille on oma koodinsa (< H1> ), samoin kursivoinnille (< I> ). Tarkempi ulkoasu, kuten kirjasinlajit, riippuu käyttäjän client- ohjelmasta ja asetuksista (seikka joka ei varmasti miellytä kaikkia). Asiakasohjelmia on sekä merkkipohjaisia (Lynx, Emacs W3) että graafisia (NCSA Mosaic, Cello, Netscape).

Yksinkertaisella ja pelkistetyllä kuvauskielellä on etunsa. HTML:n oppii kuka tahansa parissa tunnissa ja HTML- dokumenttien jalostaminen vaikkapa painotuotteeksi (ja usein päinvastoin) on helppoa. Kieli kuitenkin kehittyy jatkuvasti, ja tulevassa HTML+-kielessä on ulkoasuun vaikuttamiseen enemmän komentoja. Tekstin lisäksi HTML-dokumenttiin voidaan sisällyttää kuvia inline-grafiikkana. Lomakeominaisuuksien avulla toteutettu kaksisuuntaisuus mahdollistaa interaktiiviset palvelut.

SYTYKE ry:n WWW-sivut on muodostettu Microsoftin WinWordillä erityisellä tyylipohjalla, josta kääntäminen HTML- dokumentiksi voidaan suorittaa vaivattomasti.

Linkit muodostetaan ympäröimällä avainsanat (tai kuvat) ankkurointikoodilla, johon kirjoitetaan URL (uniform resource locator). Se voi osoittaa samassa palvelimessa tai toisella puolella maapalloa sijaitsevaan toiseen HTML-sivuun, Gopher- puuhun, grafiikkakuvaan, MPEG-elokuvaan, ääninäytteeseen, Usenet news -uutisryhmään tai ftp-palvelimessa sijaitsevaan ohjelmakoodiin. URL muodostuu protokollatunnuksesta ja palvelinkoneen IP-osoitteesta. Esimerkki: http://www.pcuf.fi/.

Asiakasohjelma ottaa yhteyden suoraan linkin osoittamaan palvelimeen, joten yhteys ei turhaan kierrä useiden palvelimien kautta. HTTP on tilaton protokolla: yhteys asiakkaan ja palvelimen välillä muodostetaan jokaisen dokumentin hakemiseksi erikseen.

Haluan Internetiin!

Internet www-käyttömahdollisuuksineen on itsestään selvyys useimmille yliopistoissa, korkeakouluissa tai tutkimuslaitoksissa tai hi-tech yrityksissä työskenteleville tai opiskeleville.

Muille halvin tapa on tutustua Internetin palveluihin on hankkia tunnus netissä olevaan BBS:ään tai ns. public-access unixiin. Tietotekniikan liiton piirissä tämä onnistuu ilmaiseksi merkkipohjaisena PC-käyttäjien jäsenille heidän omassa Pcufissa, jossa myös SYTYKE ry:n www-tietosivut fyysisesti sijaitsevat. Myös Tietotekniikan liitolla ja HETKY:llä on suunnitelmia palvelun aloittamiseksi. Kohtuuhintaisia tunnuksia myyvät myös ainakin pääkaupunkiseudulla Clinet, Xgateway, Microdata ja Tampereen alueella Scifi. Yhteydet otetaan perinteisellä tavalla modeemilla, ja päätelaitteeksi lähes mikä tahansa mikrotietokone.

Pääteyhteyden rajoituksia voidaan kiertää protokollilla, joilla käyttäjä saa näennäisesti IP-yhdeydet kotimikroonsa.

Jotta Internetin todelliset ominaisuudet pääsisivät oikeuksiinsa, täytyy käyttäjän olla suoraan kiinni verkossa, eli hän tarvitsee oman IP-osoitteen koneelleen. Tämä ei sinänsä tarkoita kiinteää yhteyttä, vaan kotiinsa verkkoyhteyden voi ostaa myös dialup- SLIPinä, jolloin verkkoon ollaan yhteydessä tavallisella modeemilla puhelinverkon kautta. Sähköpostit saapuvat verkkotarjoajan palvelinkoneeseen, josta ne voidaan lukea POP- tai Imap-protokollaa tukevalla sähköpostiohjelmalla. Nykyiset yleisimmin 14,4 kbit/s nopeudella toimivat modeemit ovat tietenkin pienoinen pullonkaula: paljon grafiikkaa sisältävät sivut eivät tule ruudulle aivan silmänräpäyksessä.

SLIP- tai PPP-protokollan toteuttavat ohjelmat löytyvät ilmaisohjelmina Windowsiin, Maciin ja unixeihin. Microsoft on luvannut SLIP-tuen vakiona Windows 95:een ja IBM Warp-OS/2:een. Internetin käyttöön tarvittava softa on pääosin vapaata. Dialup-SLIPiä tarjoavat suomessa ainakin EUnet Finland Oy (Personal EUnet) ja Clinet Oy.

Yrityksillä ja muilla isommilla yhteisöillä kyseeseen tulee yleensä kiinteä kytkentä IP-yhteyksiä tarjoavalta yritykseltä yrityksen lähiverkkoon. Tälläinen verkkoyhteys on yleensä kohtalaisen nopea ja yhteydet ovat käytettävissä ympärivuorokautisesti.

Henrik Ahlgren
pablo@pcuf.fi


Lauri Laitinen lauri.laitinen@research.nokia.fi

Systeemityö-lehti - World Wide Web