DMOZ

Från Wikipedia, den fria encyklopedin
Hoppa till navigation Hoppa till sökning
Globus-Icon der Infobox
Öppna katalogprojekt
Webbplatsens logotyp
Människor gör det bättre
Webbkatalog
språk flerspråkig
Uppkopplad 1998-17. Mars 2017
www.dmoz.org [1]
Curlie -logotyp

Open Directory Project ( ODP ), även känt som dmoz (för Directory Mozilla), var den största mänskligt redigerade katalogen på World Wide Web . [2] Innehållet i projektet är gratis och har redigerats och uppdaterats av frivilliga redaktörer , de så kallade redaktörerna.

Den 28 februari 2017 meddelades att katalogen skulle stängas av operatören AOL den 17 mars 2017. [3] Inget meddelades om orsakerna. [4] [5]

Uppföljningsprojektet utvecklades under namnet Curlie och har varit online sedan slutet av 2017. [6] Domänen curlie.org har en Alexa Rank på 66 806 från och med den 2 november 2020. [7]

berättelse

Från "Gnuhoo" till "Open Directory Project"

ODP grundades ursprungligen under namnet Gnuhoo och gick online den 5 juni 1998. Namnet ändrades senare till Newhoo efter att en Slashdot -artikel visade att Gnuhoo inte var baserat på fri programvara och att Gnuhoo använde GNU -projektets varumärke utan tillstånd. [Åttonde]

Newhoo blev Open Directory Project efter att det köptes av Netscape i oktober 1998 och publicerade innehållet under en Open Content -licens. I november 1998 köptes Netscape inklusive ODP av AOL , som fusionerades med Time Warner 2000. Den korta formen "Dmoz" eller "dmoz.org" härleddes från den första webbadresskatalogen.mozilla.org.

Den 20 oktober 2006 fick ODP allvarliga tekniska problem. Funktionerna för att föreslå länkar och ändringar samt de interna redigeringsfunktionerna för att ändra katalogposter blockerades. Den 18 december 2006 släpptes åtkomst för redaktörer igen; den 13 januari 2007 det offentliga gränssnittet för att föreslå webbplatser och ändringar och den 23 februari 2007 möjlighet att ansöka om den nya redaktören.

motivering

Motiveringen för att grunda ODP var frustrationen över bristen på aktualitet, det vill säga den långa fördröjningen med att lägga till nya webbplatser och den höga andelen döda länkar i redaktionellt underhållna kataloger. Men också kritik mot att kommersialisera Internet mer och mer och reducera det till ett annonsmedium istället för att ge fri tillgång till information en högre prioritet.

Om man antar att människor är överlägsna automatiserade katalog- och söksystem, bör användaren få ett kvalitativt bättre, sammanfattat sökresultat. Uttrycket för detta var parollen Människor gör det bättre för att skilja det från automatiserade sökmotorkoncept.

Men otillräcklig aktualitet och lång handläggningstid för ODP kritiserades också. Fördröjningen av intag liknade i många kategorier det som tidigare var vanligt med Yahoo! Redigeringsgemenskapen kämpade för att hålla jämna steg med tillväxten på Internet , och många av kategorigrenarna saknade redaktörer för att hantera det stora antalet registreringar.

Efterliknare

Idén inspirerade minst två andra webbkataloger , också finansierade av privata företag och redigerade av frivilliga redaktörer: The Go Directory (tidigare drivs av Disney ) och Zeal (köpt av LookSmart ). Båda har nu avbrutits. Ingen av dessa kataloger publicerade dock sin data som öppet innehåll .

strukturera

Open Directory -projektet baserades på en klassificerad trädstruktur i hypertextsystemet. Ur ursprungssynpunkt härleddes kategorier tematiskt eller regionalt och ärvdes ner till underkategorierna på 89 språk och dialekter (från juni 2014). Varje post kan tilldelas en lämplig kategori enligt den högsta relevansen för ett ämne eller en region. Flera poster var också möjliga om de var relevanta på flera ställen.

användning av data

ODP -innehållet var fritt tillgängligt för allmänheten utan kostnad. Dessutom beviljades en fri nyttjanderätt för vidare distribution som hel eller delvis publicering. [9] Data var tillgängliga för nedladdning i en tidig form av RDF -formatet. En ny version släpptes vanligtvis varje vecka. Data för den fristående ODP-uppsättningen (dump) innehöll både URL-poster och katalogstrukturen inklusive länkar mellan kategorier.

Uppgifterna sprids under licensvillkoren för Open Directory Project. Dessa gav en synlig ODP -källa med länkar för att föreslå nya poster och för att ansöka om arbete med ODP på ​​varje sida som innehåller innehållet i ODP. [10] På grund av denna förordning togs innehållet ofta över från andra webbplatser. Bland annat använde Google Dmoz -data för sin egen webbkatalog fram till 2011. [11]

Redaktörer

ODP beskrev sig själv som ett projekt av frivilliga redaktörer som systematiskt katalogiserar information som publiceras på Internet och gör den tillgänglig för allmänheten. Redaktörer är endast ansvariga för vissa kategorier och grenar. För detta ändamål anförtrotts så många olika redaktörer som möjligt, var och en med de bästa kunskaperna inom ett särskilt område och intresseområde, genom konsensus.

Trots möjligheten att föreslå sidor växte katalogen främst genom egen forskning från redaktörer. Detta inkluderade också tvärsnittsaktiviteter som att skapa nya underkategorier, flytta poster till mer lämpliga kategorier och uppdatera poster och kommentarer.

Redaktörssamhället byggde upp

 • de offentligt tillgängliga riktlinjerna
 • Lita på individens kompetens, ansvar och tillförlitlighet
 • en multi-eye-princip, med ömsesidig samordning av tvivelfall och när man utbildar nya redaktörer
 • Hjälp från högre redaktörer (meta-redaktörer) och administratörer

på. Förutom att behålla den befintliga databasen inkluderade redaktörernas arbete främst publicering av nya poster i kategorin de arbetade med. Deltagande på fritiden var inte obligatoriskt och inte knutet till fasta tider.

Ansökningsprocessen som ny redaktör eller för nya kategorier och utvidgning av redigeringsrättigheterna omfattade tre exempellänkar och beskrivningar samt frågor om ämnet. [12] Kvalitet och förebyggande av missbruk spelar en övergripande roll, även på grund av överföring av data under öppen licens till andra dataanvändare. Minsta tidigare utbildning eller referenser eller liknande krävdes inte.

Precis som redaktörer kunde säga upp sig från sina rättigheter och lämna ODP, kunde aktiva redaktörer uteslutas från projektet med kort varsel om riktlinjerna kränktes på grund av missbruk, opålitlighet och oansvarigt beteende.

Datainsamling och underhåll

DMOZ -poster omfattade en kort titel (vanligtvis webbplatsens eller företagets namn) och en kort beskrivning av innehåll, erbjudande och specialfunktioner på en webbplats.

Inkluderingskriterierna har förblivit oförändrade sedan katalogen startades. Posten bör åtföljas av ett informativt, klassificerbart, seriöst och relevant informationserbjudande med eget innehåll på en webbplats. Informationens innehåll på en webbplats bestäms av graden av det egna innehållet i förhållande till reklam (banners, AdWords, Adlinks), externt integrerade sidor och information som kopieras från andra sidor. Webbplatser som förhärligar våld, är rasistiska, pornografiska eller uppmuntrar till kriminella handlingar har inte inkluderats eller tagits bort från databasen. [13]

Dessutom fanns det ett antal mekanismer och verktyg avsedda att förbättra datakvaliteten och kategorins relevans samt utesluta missbruk. För detta ändamål fanns ett formulär tillgängligt i varje kategori för externa inkluderingsförslag, en för uppdatering av begäranden för befintliga poster och en för kontroll av misstänkt missbruk (av meta -redaktörer).

Utöver arbetet av redaktörerna, företagets egen sökrobot utsågs Robozilla skickas över alla poster i katalogen med jämna mellanrum för att hitta döda, nedsatt eller misstänkta länkar. Robozilla tog tillfälligt bort dem från katalogen och markerade dem för granskning av redaktörer som kan vidta ytterligare åtgärder.

Inlägg från utgångna domäner togs i stort sett bort automatiskt från katalogen för att säkerställa att de var uppdaterade och för att förhindra att falskt eller vilseledande innehåll kapar och "parkerar" internetadresser.

Med tiden minskade antalet fast anställda som tilldelats projektet av Netscape och AOL. Detta kompenserades av ett antal verktyg som skapades av redaktörer och introducerades i samråd med administrationen. För att underlätta arbetet har länkcheckare, specialiserade webbsökare , stavningskontroller, förbättrade sökmotorer och ett antal bokmärken för redaktörer skapats.

Outsourcing

Under årens lopp har redaktörer startat ett antal relaterade projekt autonomt, varav några är baserade på den programvara som också används av ODP. Ingen av dessa har dock hittills varit lika framgångsrika som själva ODP.

Ett av dessa projekt integrerades direkt i ODP som en katalog i katalogen: Filialen för barn och unga, kidmoz . Där fick utvalda platser specifikt för målgruppen barn och unga lämpliga beskrivningar och åldersinformation och listades. Organisatoriskt var denna del av katalogen relativt oberoende, även om riktlinjerna gällde både kataloger och ett antal redaktörer var aktiva i båda katalogerna. Det grundades i november 2000. [14]

Ett annat projekt som specialiserat sig på att samla in all data relaterad till musik och musiker är MusicMoz . Detta finns för närvarande bara på engelska, men en tyskspråkig gren förbereds.

Fakta och siffror

Antal poster i den tysktalande delen av ODP

Den 31 januari 2014 registrerade ODP över 4,2 miljoner poster (nästan 500 000 av dem i den tysktalande delen av katalogen) sorterade i över 1 000 000 kategorier. I januari 2016 fanns det knappt 4 miljoner poster, det totala antalet redaktörer var över 90 000. I juli 2016 fanns det 3 938 044 poster från totalt 91 441 redaktörer.

Grunden för inkludering och underhåll av poster var de allmänt tillgängliga riktlinjerna och instruktionerna och om en sidinformation för ämnet är användbar och ett värdefullt tillägg. [13]

I september 2019 registrerade Curlie.org 3 444 397 sidor (426 509 varav i den tyskspråkiga delen av katalogen) på 91 språk och 1 033 965 kategorier från totalt 92 019 redaktörer. [15]

webb-länkar

Uppföljningsprojekt

Individuella bevis

 1. www.dmoz.org ( Memento den 14 november 2017 i Internetarkivet )
 2. dmoz.org ( Memento från 11 oktober 2016 i Internetarkivet )
 3. dmoz.de. Hämtad 17 oktober 2018 .
 4. Dmoz kommer att stängas - WebABC.info . I: WebABC.info . 2 mars 2017 ( webabc.info [öppnade 23 mars 2017]).
 5. ^ RIP DMOZ: Open Directory Project avslutas . I: Sökmotor Land . 28 februari 2017 ( searchengineland.com [öppnade 1 mars 2017]).
 6. Uppföljningsprojektet Curlie är online. Hämtad 9 december 2017 .
 7. Alexa Rank från curlie.org, november 2020
 8. Slashdot: The GnuHoo BooBoo ( Memento från 28 februari 2014 i Internetarkivet )
 9. ^ Artiklar i Association ( Memento i 21 Oktober 2016 i Internet Archive ) av Netscape med frivilliga åtaganden till webbforum
 10. Open Directory License ( Memento från 20 oktober 2016 i Internetarkivet )
 11. Herbert Braun: Google stänger sina labb. I: Heise Developer. 21 juli 2011, öppnad den 30 juli 2011 : ”Samtidigt stängde Google tyst sin webbkatalog för Google Directory. Denna tjänst, som lanserades för elva år sedan som en konkurrent till Yahoo -katalogen, uppgraderade data från Netscapes dmoz -katalog med en rangordning inom kategorierna. "
 12. Frågor och svar om ansökan om att bli redaktör på Open Directory Project ( Memento från 18 oktober 2016 i Internetarkivet )
 13. a b Öppen katalog: Riktlinjer för redigering ( Memento av den 18 oktober 2016 i Internetarkivet )
 14. ^ Nyhetsbrev mars 2001 ( Memento från 1 mars 2017 i Internetarkivet ) med en presentation av det nya projektet
 15. curlie.org