Sida 1 av 1

Öppna alternativet inget alternativ... OpenOffice

Postat: 01 sep 2008, 22:44
av zebulon M
Jag har propagerat lite för att vi ska använda öppen programvara i min organisation. En demonstration jag gjorde fick dock det omvända resultatet och övertygade mig själv att Ubuntu ännu inte är redo att användas i kontorsmiljö. Problemet är OpenOffice. En person kände till programsviten och bestämde sig att för att demonstrera hur värdelös den svenska rättstavningen är. Eftersom rättstavning är ganska grundläggande för en dator, så hade jag inte mycket att komma med efter detta. Jag skickar med en skärmbild på hans demonstration, en liten nonsenstext. Framför allt klarar OpenOffice inte sammansatta ord, ibland föreslås sär skrivningar istället, något jag själv hatar. Ännu värre är att den inte ens fångar enkla stavfel, sådana som alla gör. Går det få bättre stavning än den som följer med som standard?

Här är skärmbilden:
http://i365.photobucket.com/albums/oo97 ... eorgWr.png


Här är texten om någon vill testa själv:

Komat ock kattensmat –
braenkel stavningkontroll, dåligare stavningskontroll

Komaten görs av finhö och jordpäron i en nedmalningsmaskin. Här processeras dessaingredienser enligt matgängse riktighetregler, samt riktighetsregler. Efter mjölkningstimmen skakorna matas. Matmatmatmaten intages genom komulen och transporterans därefter vidare in i kodjuret. Slutligen syns en effekt på kossans mages rondör: komaterian har ökat.

Kattensmat utserveras av tallriksapor, på katttallrikar. Gamlakatten slikkar ägggula från en knivsegg. Gammalkatten ätersammamat som gammelkatten alltidgjort.

Re: Öppna alternativet inget alternativ... OpenOffice

Postat: 02 sep 2008, 01:40
av djkmmo
Men du ser ju ut att kunna stava, vad skall du då med rättstavning till?

Skämt åsido så såg det ju onekligen inte så roligt ut. Det är ju lite så man undrar hur Hunspell (som är rättstavningen i bl.a. OO.org) rättstavar egentligen. Själva den svenska ordlistan till Hunspell underhålls här: http://www.dsso.se/ och där kan alla vara med och lägga till (riktiga) ord som man tycker fattas. Men problemet här tycks ju vara att det inte kan identifiera ord som inte finns med i ordlistan (som kattensmat etc.) som felaktiga. Jag testade med några av de konstiga orden och inga av de jag testade fanns med i ordlistan på http://www.dsso.se. Det får mig att tro att det inte är ett problem med den svenska ordlistan utan snarare i hur Hunspell tolkar ord och rättstavar. Själv har jag aldrig använt mig av stavningskontroll, varken i MS Office eller OO.org,; jag litar mer på Lexin.

Re: Öppna alternativet inget alternativ... OpenOffice

Postat: 02 sep 2008, 03:04
av ZX Spectrum
Någon som vet vilken svensk ordlista Microsoft använder sig av i MS Office?
Antar att dom betalar någon (svenska akademin?) för att få använda den.

Re: Öppna alternativet inget alternativ... OpenOffice

Postat: 02 sep 2008, 13:11
av farmfield
ZX Spectrum skrev:Någon som vet vilken svensk ordlista Microsoft använder sig av i MS Office?
Antar att dom betalar någon (svenska akademin?) för att få använda den.
Det är inte riktigt så enkelt. Rättstavning bygger på ordlistor men i kombination med en enkel AI och heuristik, det är vad vissa skulle kalla ett "expertsystem" och bristen ligger i det systemet, inte i ordlistan.

Dock tycker jag exemplet var lite överdrivet för om man stavar så dj-a dåligt sitter man väl knappast på ett kontor alls, hehe... ;D

Re: Öppna alternativet inget alternativ... OpenOffice

Postat: 02 sep 2008, 13:30
av Harlekin33
Jag har svårt att tro att MS office kan rättstava dom exempel du tar upp...

Nån som prövat?

Re: Öppna alternativet inget alternativ... OpenOffice

Postat: 02 sep 2008, 13:45
av Osprey
Jag provade samma stycke i OfficeXP och det gav inget helt strålande resultat heller. Visserligen släppte OfficeXP igenom färre felstavningar, men den bromsade också ungefär samma sammansatta ord.

Det är kanske egentligen där som problemet ligger, eller med andra ord att OpenOffice inte riktigt går efter någon bra orslista för vad som är korrekta ej sammansatta ord för det var där som OfficeXP vann.

När det gäller sammansatta ord så blir det ju betydligt krångligare att bedöma vad som är ett riktigt ord och vad som är en felskrivning. Ett ord som t.ex "komage" är visserligen helt korrekt, men knappast ett ord som används i allmänt bruk. Ska man då tolka det som ett korrekt ord eller en felskrivning (ej felstavning)..?

Det finns ju många ord som är korrekt stavade, men som är fullkomligt horribla som ord, som t.ex "kocykelpedalsgurka".

Så, som sagt var... det verkar som om det som OpenOffice måste göra är att gå striktare efter en ordlista med även de vanligaste sammansatta orden och döma ut ord som inte matchar den. Vill man sedan använda konstiga sammansättningar så får man definiera dem i en egen ordlista.

Krångligare blir det när man även ska ge sig på meningsbyggnad och sådant...

Re: Öppna alternativet inget alternativ... OpenOffice

Postat: 02 sep 2008, 13:46
av nicefinger
AbiWord ger exakt samma resultat.

Re: Öppna alternativet inget alternativ... OpenOffice

Postat: 02 sep 2008, 15:03
av djkmmo
Osprey skrev:Det är kanske egentligen där som problemet ligger, eller med andra ord att OpenOffice inte riktigt går efter någon bra orslista för vad som är korrekta ej sammansatta ord för det var där som OfficeXP vann.

Så, som sagt var... det verkar som om det som OpenOffice måste göra är att gå striktare efter en ordlista med även de vanligaste sammansatta orden och döma ut ord som inte matchar den. Vill man sedan använda konstiga sammansättningar så får man definiera dem i en egen ordlista.
Ett OO.org med stavningskontroll som jobbar på det viset tror jag inte någon vill ha. Det skulle bli något så fruktansvärt långsamt och ta så oerhört mycket systemresusrser så det skulle antagligen vara helt oanvändbart. Det enda sätt som jag kan tänka mig att det skulle fungera på, vore att sätta varje ord i författarens dokumet som en variabel och testa varje variabel mot en, inte oändlig, men väl mycket stor ordlista med alla tänkbara ord i språket. Det finns en sådan ordlista, Svenska Akademins Ordbok (SAOB). Den påbörjades 1786 och beräknas bli klar 2017. Idag är man framme på "Trivsel" och den omfattar nu 470 000 ord.

Det är precis som farmfield skriver, grunden i rättstavningskontroll är egentligen heurestik och lingvistik. Det grundläggande problemet här är ju inte att orden är felstavade, även om en del av orden också kan betraktas som felstavningar, det är ju att rättstavningsprogrammet inte fångar det svenska språkets semantik och den biten är nog svårare att lösa än att skapa en ordlista. T.ex. skulle ordet "rättstavningsprogrammet" betraktas som en felstavning om SAOB användes som ordlista och programet hade fungerat som beskrivet i förra stycket, trots att det är ett giltigt ord som alla förstår.

Det grundläggande problemet är att språket är oändligt och kan inte fångas i en ändlig lista med ord, utan måste hanteras av ett AI med lika oändligt som finurlig intelligens som den mänskliga. En grundförutsättning för att kunna skapa ett sådant AI är naturligtvis att vi ("vi" i meningen "mänskligheten") först explicit förstår hur naturliga språk fungerar och det är nog en bra bit kvar tills vi når dit.

Re: Öppna alternativet inget alternativ... OpenOffice

Postat: 02 sep 2008, 15:08
av Emil.s
Ubuntu33 skrev:Jag har svårt att tro att MS office kan rättstava dom exempel du tar upp...

Nån som prövat?
Förstår inte varför det inte skulle göra det?

OpenOffice rättstavnining suger, och det är inget man kan förneka.

Re: Öppna alternativet inget alternativ... OpenOffice

Postat: 02 sep 2008, 15:46
av Osprey
djkmmo skrev:
Osprey skrev:Det är kanske egentligen där som problemet ligger, eller med andra ord att OpenOffice inte riktigt går efter någon bra orslista för vad som är korrekta ej sammansatta ord för det var där som OfficeXP vann.

Så, som sagt var... det verkar som om det som OpenOffice måste göra är att gå striktare efter en ordlista med även de vanligaste sammansatta orden och döma ut ord som inte matchar den. Vill man sedan använda konstiga sammansättningar så får man definiera dem i en egen ordlista.
Ett OO.org med stavningskontroll som jobbar på det viset tror jag inte någon vill ha. Det skulle bli något så fruktansvärt långsamt och ta så oerhört mycket systemresusrser så det skulle antagligen vara helt oanvändbart. Det enda sätt som jag kan tänka mig att det skulle fungera på, vore att sätta varje ord i författarens dokumet som en variabel och testa varje variabel mot en, inte oändlig, men väl mycket stor ordlista med alla tänkbara ord i språket. Det finns en sådan ordlista, Svenska Akademins Ordbok (SAOB). Den påbörjades 1786 och beräknas bli klar 2017. Idag är man framme på "Trivsel" och den omfattar nu 470 000 ord.
Ungefär precis det jag menade ja... :)

För övrigt tror jag att SAOL är bättre än SAOB i det fallet eftersom den är mer "up to date". SAOB är jättetrevlig att läsa i när man vill ha reda på etymologin, men den har av förklarliga skäl inte riktigt hängt med i språkets utveckling fullt ut.

Re: Öppna alternativet inget alternativ... OpenOffice

Postat: 02 sep 2008, 16:29
av vulfgar
Det finns bättre ordlistor till OO. Det finns en tråd om det nånstans, ska se om jag hittar den.

Edit: hittade en av trådarna http://ubuntu-se.org/phpBB3/viewtopic.p ... ttstavning

Re: Öppna alternativet inget alternativ... OpenOffice

Postat: 02 sep 2008, 19:31
av Harlekin33
Emil.s skrev:
Ubuntu33 skrev:Jag har svårt att tro att MS office kan rättstava dom exempel du tar upp...

Nån som prövat?
Förstår inte varför det inte skulle göra det?

OpenOffice rättstavnining suger, och det är inget man kan förneka.
Dåså..då kanske vi ska råda bot på det?!

Och ja..jag tror SAOL är bättre..

:)

Re: Öppna alternativet inget alternativ... OpenOffice

Postat: 02 dec 2008, 21:15
av djkmmo
Jag har just fått stavningskontrollen att fungera i OO.org 3 och den klarar faktiskt av att rätta den texten som finns i första inlägget, så bra som jag tycker man kan kräva. Den t.o.m. avstavar ord som "braenkel", "dessaingredienser" och "kattensmat". Klart godkännt i mina ögon.

Här förklarar jag varför det inte funkat för mig tidigare.
http://ubuntu-se.org/phpBB3/viewtopic.p ... openoffice

Re: Öppna alternativet inget alternativ... OpenOffice

Postat: 02 dec 2008, 22:05
av CryingFreeman
Man kan installera ordlistan i OpenOffice.org 3.x genom att ladda ner OO3-versionen av ordlistan härifrån.

Sen öppnar man OOo Writer och öppnar filen i Öppna-dialogen, i skrivande stund heter den ooo_swedish_dict_1.29.oxt

Sen läser man instruktionerna och startar om Writer, så är ordlistan installerad.

Re: Öppna alternativet inget alternativ... OpenOffice

Postat: 11 dec 2008, 00:12
av zebulon M
Jag tycker också att stavningskontrollen med tilläggsordlistan är helt ok. Den borde ligga som förstahandsval egentligen. Det kanske den gör på den svenska ubuntu-skivan?