Uniform Resource Identifier

Från Wikipedia, den fria encyklopedin
Hoppa till navigation Hoppa till sökning

En enhetlig resursidentifierare (förkortning URI , engelska för enhetlig identifierare för resurser ) är en identifierare och består av en teckensträng som används för att identifiera en abstrakt eller fysisk resurs . URI används för att ange resurser (t.ex. webbplatser , andra filer, uppringning av webbtjänster , men också e-postmottagare , till exempel) på Internet och där framför allt på WWW . Den nuvarande statusen för 2016 publiceras som RFC 3986 .

Tim Berners-Lee introducerade ursprungligen termen 1994 i RFC 1630 som en Universal Resource Identifier . Först senare förekom resolutionen Uniform i officiella W3C -dokument. Av denna anledning nämns Universal ibland som den första delen av namnet - även i specialistlitteratur.

URI kan integreras som en teckensträng (kodad med en teckenuppsättning ) i digitala dokument, särskilt de i HTML -format, eller skrivas ner för hand på papper. En referens från en webbplats till en annan kallas en hyperlänk eller kort sagt "länk".

Internationalized Resource Identifiers (IRI) är en förlängning av URI: erna, som endast består av utskrivbara ASCII -tecken.

Uppfattning

En URI (eller i tillägget IRI) är den abstrakta principen, syntaxen, en identifierare där en uppsättning regler ges. Detta grundläggande begrepp för URI överförs sedan till olika specifika tillämpningsområden, för vilka motsvarande regler och villkor sedan gäller. Till exempel:

  • ”URI: er kan inte innehålla mellanslag.” Or
  • "I början finns namnet på ett schema med ASCII -bokstäver och siffror, vid behov uppdelat efter punkt och bindestreck, som börjar med bokstäver, följt av ett kolon."

Det finns i princip tre typer av applikationer:

  • Efternamn
    • Innehållet i en resurs (och därmed varje kopia med samma innehåll) ges en unik identifierare.
    • Exempel: ISBN för en bok. Det finns ett obegränsat antal exemplar av den här boken.
  • Sökare
    • Platsen för en resurs definieras av dess namn. Så det identifieras av var det kan hittas; det avgör dock inte nödvändigtvis deras innehåll.
    • Exempel: Aktuell väderrapport på Internet. Det är känt var (URL) detta kan hittas; innehållet förändras ständigt.
    • Exempel: En bok beskrivs av biblioteket där den finns: där i det andra rummet, tredje hyllan, fjärde facket uppifrån, femte boken från vänster. Den nuvarande topp 5 på storsäljarlistan kan finnas där - oavsett innehåll.
  • enskild
    • URI: s regler kan också användas om något inte alls är en klassisk resurs, men ändå måste identifieras.
    • Ursprungligen förstod man att "resurs" var ungefär resurser i IT -mening, det vill säga i vid mening elektroniska filer som också kunde göras tillgängliga på Internet. RFC 1630 och RFC 1738 baserades på detta 1994. Detta koncept har dock utökats. 1998 föreskrev RFC 2396 (avsnitt 1.1): ”En resurs kan vara vad som helst som har identitet.” Människor, organisationer och tryckta böcker kan också ses som resurser. Denna övervägande syftar till att identifiera överlåtbara enheter.
    • Exempel: e-postadress, mobiltelefonnummer, pass samt legitim ägare, personnummer, fingeravtryck och personen därtill.

I januari 2005, med RFC 3986, utvidgades också begreppet resurs i URI: s mening till abstrakta begrepp:

”En resurs är inte nödvändigtvis tillgänglig via Internet; t.ex. människor, företag och bundna böcker i ett bibliotek kan också vara resurser. På samma sätt kan abstrakta begrepp vara resurser, såsom operatörer och operander i en matematisk ekvation, typerna av en relation (t.ex. "förälder" eller "anställd") eller numeriska värden (t.ex. noll, en och oändlighet ). ”

”En resurs är inte nödvändigtvis tillgänglig via Internet; till exempel kan människor, företag och inbundna böcker på bibliotek också vara en resurs. På samma sätt kan abstrakta begrepp som operatorer och operander i en matematisk ekvation, typer av relationer (t.ex. 'förälder' eller 'anställd') eller tal (t.ex. noll, en och oändlighet) vara en resurs. "

- RFC 3986 , avsnitt 1.1

konstruktion

Enligt den nuvarande RFC 3986 -standarden består en URI av fem delar: scheme (schema eller protokoll), authority (leverantör eller server), path (sökväg), query (fråga) och fragment (del), varav endast scheme och path i varje URI måste finnas. Den generiska syntaxen är:

 URI = schema ":" hier-part ["?" fråga] ["#" fragment]

hier-part (hierarkisk del) står för en valfri authority och path . Om specifikationen för en authority krävs för att slutligen hitta resursen, introduceras den med ett snedstreck och den vägspecifikation som följer måste börja med ett snedstreck. Standarden förtydligar dessa komponenter med två exempel:

 foo: //example.com: 8042 / over / there? name = iller # näsa
  \ _ / \ ______________ / \ _________ / \ _________ / \ __ /
   | | | | |
schema myndighets sökfrågefragment
   | _____________________ | __
  / \ / \
  urna: exempel: djur: iller: näsa

Schema

Schemat (delen före kolon) definierar sammanhanget och anger därmed typen av URI, som bestämmer tolkningen av följande del. Kända scheman är till exempel http och ftp protokollen och notationskoncept som urn och doi . Den första obligatoriska delen av URI slutar med kolon. Om det inte finns någon referens till en (aktiv) myndighet som organiserar namnadministrationen följs denna kolon direkt av sökvägen för att hitta resursen.

Myndighet (i bemärkelse av jurisdiktion )

Många URI -system som http eller ftp har en authority . Begreppet myndighet hänvisar till en instans som kan hantera namnen centralt i detta tolkningsutrymme (specificerat av schemat). Ett exempel på detta är Domain Name System , som administreras av globala och lokala registratorer .

authority består av valfri användarinformation (följt av en ' @ '), värden och en valfri portspecifikation (introducerad av ett kolon). Den följer två snedstreck ( // ) och avgränsas av ett enda snedstreck ( / ), ett frågetecken ( ? ), Ett pundtecken ( # ) eller slutet av URI. Värddelen kan bestå av en IP -adress , en IPv6 -adress (inom hakparenteser […] ”) eller ett registrerat namn. Giltiga värden är till exempel:

Den möjliga specifikationen av användarnamn och lösenord i användarinformationen ( user:[email protected] ) beskrivs som föråldrad i RFC 3986 (avsnitt 3.2.1) och ska inte längre användas, eftersom URI: er ofta överförs och loggas in i klartext.

Väg

Sökvägen innehåller information - ofta organiserad hierarkiskt - som tillsammans med frågedelen identifierar en resurs. Om en authority enligt beskrivningen i föregående avsnitt specificerades i URI måste path börja med ett snedstreck ( / ); authority det inte finns någon authority kan path inte börja med ett snedstreck ( // ). Detta säkerställer en tydlig tolkning. Det avgränsas av ett frågetecken ( ? ), Ett hashtecken ( # ) eller slutet av URI. Giltiga sökvägar är till exempel:

  • /over/there
  • example:animal:ferret:nose

Fråga (fråga)

Frågedelen ( frågesträng ) innehåller data för att identifiera de resurser vars plats inte kan specificeras exakt genom att ange sökvägen ensam. De måste hämtas från källan som indikeras av sökvägen med hjälp av denna fråga, till exempel en datapost från en databas. Det börjar med ett frågetecken ( ? ) Och avgränsas av ett hashtecken ( # ) eller slutet av URI. En giltig fråga för ' ? 'är till exempel:

  • title=Uniform_Resource_Identifier&action=submit

Här spelar ' & ' och ' = ' ungefär samma roll som ' . 'och' : 'i delen för authority .

fragment

fragment är den valfria fragmentidentifieraren och refererar till en position inom en resurs. Fragmentidentifieraren hänvisar alltid bara till den omedelbart föregående delen av URI och introduceras av ett hashtecken ( # ). Ett exempel på detta är ankaren i HTML.

Exempel

  • https://de.wikipedia.org/wiki/Uniform_Resource_Identifier
  • ftp://ftp.is.co.za/rfc/rfc1808.txt
  • file:///C:/Users/Benutzer/Desktop/Uniform%20Resource%20Identifier.html
  • file:///etc/fstab
  • geo:48.33,14.122;u=22.5
  • ldap://[2001:db8::7]/c=GB?objectClass?one
  • gopher://gopher.floodgap.com
  • mailto:[email protected]
  • sip:[email protected]
  • news:comp.infosystems.www.servers.unix
  • data:text/plain;charset=iso-8859-7,%be%fa%be
  • tel:+1-816-555-1212
  • telnet://192.0.2.16:80/
  • urn:oasis:names:specification:docbook:dtd:xml:4.1.2
  • git://github.com/rails/rails.git
  • crid://broadcaster.com/movies/BestActionMovieEver

Ett exempel med ett stort antal element samtidigt i URI:

  • http://nobody:[email protected]:8080/cgi-bin/script.php?action=submit&pageid=86392001#section_2

URI -referenser

Applikationer använder ofta inte hela URI, utan snarare en förkortad syntax, till exempel för att spara utrymme eller för att möjliggöra enkel flytt till andra servrar. I sin definition begränsar vissa URI -scheman också syntaxen till en viss form. Olika stavningar sammanfattas under termen URI -referenser.

Absolut URI

En absolut URI identifierar en resurs oavsett i vilket sammanhang URI används. [1] Det består åtminstone av ett scheme och hier-part (dvs. en authority och / eller en path ). Exempel är:

  • https://de.wikipedia.org
  • file://localhost/var/spool/dump.bin

Relativ referens

Till skillnad från en absolut URI beskriver en relativ URI endast skillnaden mellan en resurs absoluta URI och det nuvarande sammanhanget i ett hierarkiskt namnområde. [2]

Om en URI -referens inte börjar med ett scheme antas det vara en relativ referens. Upplösningen av en relativ referens till en absolut URI sker beroende på sammanhanget enligt standardiserade regler. En relativ referens består av en path och eventuellt en query och fragment . Det finns tre typer av relativa referenser:

  • Om sökvägen startar utan snedstreck är det en relativ sökvägsreferens , till exempel image.png , ./image.png och ../images/image.png .
  • Om sökvägen börjar med ett snedstreck ( / ) är det en absolut sökvägsreferens .
  • Om sökvägen börjar med dubbla snedstreck ( // ) är det en nätverksvägsreferens .

Referens inom samma dokument

URI -referenser kan hänvisa till samma dokument som de ingår i. Den vanligaste användningen är pundtecknet ( # ) följt av en fragmentidentifierare.

Tilläggsreferenser

Specifikationen av URI -referenser på Internet utan en beskrivning av protokollet (schemat) är utbredd, till exempel www.wikipedia.de . Om vi ​​antar att suffixet (i exemplet www , DNS -namn byggs från höger till vänster) kan användas för att utläsa protokollet (här http ), fungerar upplösningen av sådana referenser. Denna upplösning är dock beroende av motsvarande antaganden och även av respektive programvara. Därför bör suffixreferenser undvikas.

Scheman

Bland annat definieras följande scheman:

Schema beskrivning
crid TV -sändningar
data Data-URL : direkt inbäddad data
file Filer i det lokala filsystemet
ftp Filöverföringsprotokoll
geo Geografiska koordinater
gopher jordekorre
http Hypertextöverföringsprotokoll
ldap Lätt katalogåtkomstprotokoll
mailto E -postadress
news Nyhetsgrupp eller nyhetsartikel
pop Tillgång till brevlåda via POP3
rsync Synkronisering av data med rsync
sip SIP -baserad session setup, t.ex. B. för IP -telefoni
tel Telefonnummer
telnet Telnet
urn Uniform Resource Names (URN)
ws WebSocket
wss
xmpp Utökningsbart meddelande- och närvaroprotokoll för Jabber -identifierare

En fullständig lista över de officiella scheman finns på Internet Assigned Numbers Authority (IANA) webbplats. [3]

Dessutom har några inofficiella system, även kallade "preliminära" av IANA, upprättats för enskilda applikationer eller gemensamma protokoll:

Schema beskrivning
about intern webbläsarinformation [4]
afp Apples arkiveringsprotokoll [5]
apt Avancerat förpackningsverktyg
callto Telefonnummer (inklusive Skype och NetMeeting )
coffee Hyper Text Coffee Pot Control Protocol
daap Digital ljudåtkomstprotokoll
doi digital objektidentifierare
ed2k ED2k URI -schema från eDonkey2000 / Kademlia
feed Webbflöden
finger Finger [6]
fish Filer överförda via Shell -protokollet
git Git
irc / ircs Internet -relächatt [7]
itunes iTunes
javascript Exekvering av JavaScript -kod [8]
lastfm Last.fm
magnet Magnetlänk
mms Microsoft Media Server
rtmp Realtidsmeddelandeprotokoll
sftp SSH -filöverföringsprotokoll [9] [10]
skype Telefonnummer (endast Skype )
smb Servermeddelandeblock [11]
ssh Secure Shell [12] [10]
svn / svn+ssh Apache Subversion
view-source Visning av källkod för en webbplats [13]
webcal iCalendar
wyciwyg What You Cache Is What You Get, Firefox-intern skärm för visning av cachat innehåll
ymsgr Yahoo Messenger

Underarter

Man skiljer mellan följande undertyper av URI:

Uniform Resource Locator (URL)
Namnge en resurs med dess primära åtkomstmekanism som http eller ftp . Detta följs av namnet på platsen för resursen i nätverket - vanligtvis domännamnet. URL: er var ursprungligen den enda typen av URI, varför termen URL ofta används synonymt med URI.
Uniform Resource Name (URN)
URI -schemat urn identifierar en resurs med ett befintligt eller fritt urn:sha1 namn, till exempel urn:isbn eller urn:sha1 .

Ursprungligen bör varje URI delas in i en av dessa två klasser (eller andra som ska definieras). Denna strikta uppdelning har emellertid övergivits eftersom det är onödigt och vissa system (t.ex. data eller mailto som tidigare tilldelats webbadresser) inte passar in i någon av de två klasserna.

Se även

webb-länkar

Individuella bevis

  1. ietf.org
  2. ietf.org
  3. Graham Klyne: Uniform Resource Identifier (URI) -scheman. I: https://www.iana.org/ . Internet Assigned Numbers Authority (IANA), 20 mars 2016, öppnade 8 april 2016 .
  4. tools.ietf.org
  5. tools.ietf.org
  6. tools.ietf.org
  7. tools.ietf.org
  8. tools.ietf.org
  9. https://www.iana.org/assignments/uri-schemes/prov/sftp
  10. a b tools.ietf.org
  11. tools.ietf.org
  12. https://www.iana.org/assignments/uri-schemes/prov/ssh
  13. msdn.microsoft.com