?

Log in

No account? Create an account

may · contain · language


Svenska Wiktionary inifrån

Recent Entries · Archive · Friends · Profile

* * *
Hej, jag heter Martin och jag är Wikiholist. Usch, just nu känner jag igen mig alldeles för väl i en del av det som står på den sidan. Men det är inte Wikipedia som är mitt gift i första hand (vilket kanske hade varit bättre - närmare relaterat till forskningen jag försöker göra) utan Wiktionary, där jag ju tidigare erkänt att jag håller till och därtill försökt lura in mina läsare i träsket.

Nå, mitt kanske främsta försvar inför mig själv när jag tycker att jag ägnat lite för mycket tid åt Wiktionary, särskilt om jag funderar på om jag kunde ha använt den tiden till jobb, är att det är jobb. Typ. Nästan. Det är språk, alltid till en del svenska, och därmed till en del vidareutbildning/självstudier för mig och samtidigt lite "tredje uppgift": svenska till folket, där jag då bidrar med min stora nordistiska och allmänlingvistiska expertis. Samtidigt, och framför allt, är det wiki-etnografi och upprätthållande av kontakter inom Wikimediaprojekten (samtidigt som jag kan hålla mig på armlängds avstånd från mitt primära studieobjekt och inte "påverka" för mycket). Strålande!

Nå. Men då kan vi ju försöka göra allvar av det där etnografiska . Hur är det egentligen att arbeta med svenska Wiktionary? Ja... det är säkert olika för olika personer. Det är roligt, vill jag säga - bland annat för att det finns så mycket att göra. Och det är ganska frustrerande, eftersom det finns så mycket att göra och vi är ganska få som gör det. Man vill ju att det ska bli färdigt, typ... att vi har alla ord på alla språk och kan ägna oss åt att diskutera formateringen på uppslaget med det klingonska ordet för ''pointillismens'' (vi har uppslag för böjningsformer, för att underlätta navigering och möjliggöra inläggande av information om bl.a. uttal). Eller ja, det skulle vi nog kunna göra nu också under rätt omständigheter... Ja, och som det är med saker som är roliga och lite frustrerande och liksom aldrig tar slut så kan det vara ganska beroendeframkallande...

Ta en titt på Wiktionary:Projekt/Frekvensordlista. Det har jag gjort, rätt många gånger, bland annat idag. Det är en lång, lång lista med (mer eller mindre) vanliga (mer eller mindre) svenska ord, mest sådana som inte har ett uppslag på svenska Wiktionary... (för sådana som har det, se Kategori:Svenska/Alla_uppslag). Sidan skapades av Användare:Jonas Wiklund (nu ej aktiv) under andra året av svenska Wiktionarys existens - april 2005. (Redigeringar i Wikimediaprojekten är offentliga genom versionshistorikerna, och det är en användares eget val att använda verkligt namn snarare än redigera under pseudonym eller oinloggad. Anonymisering blir i princip omöjligt, men också normalt sett inte nödvändigt.) Detta var dock inte den nuvarande listan. Listan över "ord som är bland de vanligaste i svenskan som vi inte har på Wiktionary ännu" kunde krympas ner efter hand som nya uppslag skapades, samtidigt som folk ändrade till stor bokstav i namn, satte ut punkt i förkortningar, ändrade böjningsformer till grundform i en del fall m.m. i listan - så att det bättre gick att se vilka ord som faktiskt redan fanns. Under tiden tillkom en källa till listan - Wiklund hade inte angett någon sådan, men en oinloggad användare kunde visa på att informationen var hämtad från PAROLE-korpusen, närmare bestämt statistikfiler tillgängliga via denna sida. Det var bra, för därmed gick det att specificera till "bland de 1000 vanligaste orden i svenskan" (även om det kanske borde stått "bland de 1000 vanligaste ordformerna i PAROLE-korpusen (beskriven här)". Och i slutet av december 2006 blev det dags för svenska Wiktionarys främsta tekniker [[Skalman]] (<--ett wikiholistsymptom: jag försöker använda wikikod på andra sidor. [[]] används för att skapa länkar.) att fylla på med ett gäng ord och skriva "bland de 2000 vanligaste" i stället. I april 2007 gjorde jag min första redigering i listan och tog bort Nils, som tydligen hade hunnit bli skapad. Det går att se vilka av orden i en sådan här länkad lista som har uppslag (under sin stavning - det kan dock vara så att det inte är det svenska ordet eftersom Wiktionary även listar ord på andra språk) eftersom länkarna då lyser blåa bland de röda länkarna till tomma sidor. Det var mer tillfälligt, men jag skulle återvända... I mars 2009 var de där 2000 vanligaste nästan slut och det blev dags för Mlari att fylla på från de 3000 vanligaste, och lite senare i samma månad kunde Mason konstatera att även dessa började ta slut och fylla på från 10 000-listan. Detta var den senaste påfyllningen, så här bör listan ha varit som längst. Den versionen tycks dock ha varit ett test för att se vilka som blev blåa. Det här skulle kunna kallas för den längsta riktiga versionen.

Så under mars och april så pillas det lite med strukturen, tacksamt nog lägger någon in rubriker så att det går att redigera delar av den stora listan, blålänkar och felstavningar plockas bort, namn får stor bokstav. Mlari är kanske mest aktiv, men det är flera inblandade - gott exempel på wikisamarbete. Så ingenting i maj-september (hade vi vett på att vara ute i solen, tro?), och så den 10 oktober börjar det komma en himla massa redigeringar av Ever wonder, d.v.s. jag. Bakgrunden var att jag från natten till den 4 i samma månad börjat ägna uppmärksamhet åt Wiktionarys allmänna och specialiserade önskelistor för svenska. (Datum m.m. får jag nu från den automatiskt genererade listan över mina "bidrag" på svenska Wiktionary.) Jag la in kommendörkapten, nobless och plattityd i den allmänna listan - vad jag nu fick just de orden ifrån. (Jag vet inte om de sedan skapats, men har de skapats kan ni ju ta en titt och om inte vore det ju kul om någon glad läsare la till dem.) Jag tyckte jag kunde göra lite mekaniskt underhållsarbete på samma gång, så jag tog bort lite blålänkar. Jag tänkte tillräckligt långt för att kolla att det svenska ordet faktiskt fanns i fall som flor och fora, och satte in kommentarer när det inte gjorde det. Jag la in saknasmallen (saknasmallen - mallar är sidor som kan "klistras in" automatiskt på andra sidor) på dessa sidor, vilket jag visste att jag kanske egentligen inte skulle göra som jag nog också senare fick påpekat för mig efter någon liknande redigering (det skulle vara den mer diskreta saknad betydelse). (Jag drog igång en liten diskussion om att skapa en "svenska saknas"-mall  och experimenterade till och med lite, men det rann ut i sanden.) Jag skapade väl lite sidor och la till betydelser och så också - alltså mer direkt innehållsinriktat arbete, som jag tycker är lättast att göra som en reaktion på att det behövs i något skede av något sådant här mekaniskt arbete eller genom att snabbt plocka något ur en existerande lista som jag ser att jag bör kunna få till något på. Jag tycker i princip att det kan vara rätt klurigt att skapa definitioner och jag lägger gärna mycket tid på det, fast en del andra säger att det är lätt... Så fanns det lite fler blålänkar att ta bort. Jag skulle tro att jag tömde den "allmänna" listan på blålänkar innan jag la mig, men det är svårt att säga (det går inte att se på ett enkelt sätt nu). Lite senare var det i alla fall uppenbart speciallistorna som fångat mitt intresse: Jag ställde en fråga om vissa instruktioner kring borttagande av "blålänkar" i djurlistan, tog bort en blålänk i fraslistan... och började sedan diskutera personnamn, så var tydligen inte helt fokuserad på det där med önskelistorna ändå. (Jag höll säkert ett öga på Senaste ändringar för att se vad som hände i ordboksskrivandet. Vi gör gärna det vi Wikimedianer... wikiholister?) Så blev det dags att plöja igenom golftermslistan, tills jag kunde summera min sista ändring -tee, ruff, utslag; spoon - "golfbetydelse saknas" (inga blålänkar kvar att kolla nu, men rätt många rödlänkar att skapa artiklar till för den som vill - definition finns ofta här). Jag hade alltså, som då jag gick igenom den allmänna listan (och väl fras- och djurlistorna) följt varje blå länk (som eagle och tee) för att kontrollera om den aktuella betydelsen på svenska fanns med och ordet kunde tas bort. Ja, timmarna gick... Här kan nämnas, för att betona det interaktionella, att ändringar jag gjort på förlåt mötte lite reaktioner. Nå, 5-8 oktober var jag igång en del på Wiktionary men mest med annat än önskelistorna (bl.a. fortsatta diskussioner om personnamn och trixande för att få in det svenska och-förkortingstecknet o i ordboken; det gick, se Övriga tecken). Men jag lyckades i alla fall tömma interjektionslistan på blålänkar. Och jag la till bäcken i den allmänna listan, eftersom det nog bara hade funnits som böjningsuppslag. Här funkade Wiktionarysamarbetet och rätt snart var det mer fullständiga bäcken-uppslaget skapat. :) 9 oktober började jag så lägga till rätt många ord ganska slumpmässigt på olika ställen i den allmänna listan. Vissa av exemplen tyder på att jag hade tittat på de sista speciallistorna jag fortfarande inte hade redigerat: Pronomen, Schacktermer, Slang och Wiktionary (eller egentligen kanske bara schacktermer och Wiktionary). Men sedan började jag bli lite mer systematisk, samtidigt som jag hittade på att när jag nämnde specifika ord som jag la till i min redigeringskommentar kunde jag länka dem och så kunde någon se det på Senaste ändringar och tänka "nej men oj, har vi inte det ordet" och genast klicka och skapa uppslaget... Vet inte om det har funkat, men jag har fortsatt använda mig av detta (framför allt då jag senare alltså kom att pyssla rätt mycket med frekvensordlistan). Jag började lägga in ord systematiskt i bokstavsordning med hjälp av sökningar i språkbanken (typ aa*... vilka grundformer av icke-namn har vi redan, ok då lägger jag in de här andra i önskelistan, så tar vi ab*...), och la in rätt många sådana under den 9e. Men så kom jag på efter ett par timmar att a, det är ju där både önskelistan och själva ordboken är som mest utbyggd - dumt att lägga fokus på förbättring där! Så då började jag göra samma sak fast med p. Och där hade jag väldigt roligt ett tag, men jag märkte också att det var omväxlande paff eller packe och parallellstorslalom, och tänkte att till slut ska vi väl ha allt det där och det är kul att lägga till det och så, men borde det inte vara bra med nån slags fokus på de förra? Så när jag lagt till parta i listan bestämde jag mig för att skapa Wiktionary:Projekt/Önskelistor/Svenska/Prioriterade med redigeringskommentaren alfabetiskt ordnat urval från första delen av Wiktionary:Projekt/Frekvensordlista, tänkt att kunna redigeras friare än den sidan. Så nu hade den sidan hamnat i mitt blickfång igen.

Ja, så jag började ta bort blålänkar för att göra listan mer hanterlig, och fyllde på i "prioriterade" av det som var kvar. Jag upptäckte efter hand att listan var rätt kaotisk. Tidigare hade folk ändrat böjda former till grundform och så, men detta hade nog blivit ohanterligt när råmaterialet blev en lista på 10 000 ord, så när jag lärde känna listan på allvar förstod jag det som det var meningen att de böjda formerna skulle få stå - och det var det kanske också. Jag var inte ens säker på om man borde ta bort eller ändra uppenbara stavfel eller låta dem stå (jag ställde en fråga en gång på frekvensordlistans diskussionssida, men den fick inget svar), eller om namn som stod med liten bokstav skulle ändras till stor. Jag lät allt sådant vara och det störde mig inte särskilt när det gällde att bygga upp "prioriterade"-listan, men... dubbletterna var jobbiga, och kunde ju uppenbarligen inte fylla någon funktion. Därmed hade jag ett stort, stort projekt att hugga in på varje gång jag hade lust att bidra lite till Wiktionary men bara orkade göra något "mekaniskt". Firefox sökfunktion: skriv in ett ord, klicka retur för att söka fler exempel, ok det fanns bara ett, skriv in nästföljande, retur, aj den hade dubblett, redigera avsnitt, ctrl-x dubbletten, använd sök igen på redigeringsfönstret så jag inte ska behöva redigera samma avsnitt igen för att ta bort en till dubblett av samma ord, redigeringskommentar -dubbel ctrl-v (så att det syns på senaste ändringarna att vi saknar ordet), spara, skriv in nästa ord i sökrutan... Först gjorde jag detta med ett avsnitt i taget för att sedan kunna använda det "rensade" avsnittet för att bygga på "prioriterade", men sedan efter ett tag kändes det som att prioriterade riskerade att bli för överväldigande för att vara användbar samtidigt som det kändes enklare att bara fortsätta med dubblettsökandet vid avsnittsgränserna. Nå, det tog några månader (men då gjorde jag i och för sig lite annat också), men häromdagen kunde jag ta bort den sista dubbletten (tills någon fyller på från de 100 000 vanligaste...). Det kom kanske lite olägligt, för det ledde till att plötsligt blev jag (vid en tidpunkt när jag kanske hellre skulle hållit mig borta från Wiktionary, eller i alla fall inte sätta igång med stora projekt där) blev intresserad av listans första avsnitt.

Ok, ta bort blålänkar, det är ju lätt... Och sedan är det de där böjningsuppslagen - det är ju automatiska "bottar" som skapar dem i första hand (ja, Doddebot närmare bestämt), men de är rätt lätta att skapa för en människa ändå, och så har man blålänkar att ta bort sedan, och så kollar man på samma gång om vi har grundformen och annars då skapa den eller kanske sätta på önskelistan. Och vad gäller grundformer av svenska ord så finns ju alla här i början i "prioriterade", men det är ju lite konstigt när de inte finns i den långa listan också, så lägga till där och samtidigt ta bort lite blålänkar... Men en del ord kommer man ju på när man ser dem att det är onödigt att ta den omvägen för man vet ungefär vad man kan skriva, så då skapar man uppslaget och så får det bli en blålänk här och på prioriterade och då var det väl ett ganska viktigt uppslag, så hurra! Och så felstavningar, eller ord som varit uppslag och diskuterats och blivit raderade... jag sätter ut en rödflagga som är en smart mall som signalerar att något är konstigt och där man kan lägga en liten kommentar, för jag är inte säker på att jag bara vill ta bort orden om de verkligen hör till 10 000 i topp i parole... Och sedan kan man då ta bort de blålänkar som skapats, och gå vidare till avsnitt 2... men så långt är jag ännu inte kommen. Och ännu längre fram blir då en del av den här processen att bygga vidare systematiskt på "prioriterade" igen. Och sedan kanske skapa uppslagen?

Ja, så arbetet går vidare... och går framåt! Svenska Wiktionary har 100 000 uppslag inklusive böjnings- och variantuppslag, och förstås inklusive alla språk...
Current Location:
Gent
Current Mood:
accomplished accomplished
* * *
* * *
On 10th March 2010 13:48 (UTC), (Anonymous) commented:
Trevligt
Trevligt att läsa en text om Wiktionary, riktad till icke-wikimedianer!

~~~~
(funkar uppenbarligen inte ;-) Skal här)
* * *

Previous Entry · Leave a comment · Share · Next Entry