
Kommando för att radera dubletter i text
Kommando för att radera dubletter i text
Vet något ett bra kommando för att radera dubletter av ord, epostadresser etc i en textfil? 

- johanre
- Serveradmin
- Inlägg: 3888
- Blev medlem: 22 okt 2006, 09:13
- OS: Ubuntu
- Utgåva: 22.04 Jammy Jellyfish LTS
- Ort: Malmö
Re: Kommando för att radera dubletter i text
Hhhmm, det beror lite på vad du vill åstadkomma och hur innehållet i texten ser ut.... Men, om du t.ex. har en lista med ord i en fil kallad "textfil" skulle du kunna:
Det ger dig endast unikt förekommande ord i textfilen, och dessutom alfanumeriskt sorterade. Vill du dessutom ha resultatet sparat i en annan fil kan du:
Det här var bara lite grundläggande exempel, det finns såklart tonvis med varianter.
Kod: Markera allt
cat textfil | uniq | sort
Det ger dig endast unikt förekommande ord i textfilen, och dessutom alfanumeriskt sorterade. Vill du dessutom ha resultatet sparat i en annan fil kan du:
Kod: Markera allt
cat textfil | uniq | sort > resultatfil
Re: Kommando för att radera dubletter i text
Nej det funkade inte. Epostlistan har fortfarande dubletterna kvar. Är osäker på om och vad kommandona gjorde. 

- johanre
- Serveradmin
- Inlägg: 3888
- Blev medlem: 22 okt 2006, 09:13
- OS: Ubuntu
- Utgåva: 22.04 Jammy Jellyfish LTS
- Ort: Malmö
Re: Kommando för att radera dubletter i text
Som sagt, mitt exempel utgick från en lista. Du måste vara lite mer beskrivande gällande innehållet i texten annars blir det svårt att lösa.
Sent from my Redmi 3 using Tapatalk
Sent from my Redmi 3 using Tapatalk
Re: Kommando för att radera dubletter i text
Kommandot ser ut att ta bort vissa dubletter men inte andra. T.e.x i textfilen ser har bl a. dessa adresser på rad:
vilket inte borde vara fallet.
och resultatfilen har bara en av dessa vilket är som det ska. Med hos andra dubletter är det ingen skillnad. Tex. så har resultatfilen detta:
vilket inte borde vara fallet.
Senast redigerad av 2 Ainigma, redigerad totalt 17 gång.
Re: Kommando för att radera dubletter i text
uniq tar bara bort intill varandra liggande dubbletter. Pröva med att ändra ordningen tillAinigma skrev:Kommandot ser ut att ta bort vissa dubletter men inte andra.
Kod: Markera allt
cat textfil | sort | uniq
(möjligen även med flaggan -i efter uniq för att även ta bort dubbletter oavsett skiftläge)
Re: Kommando för att radera dubletter i text
Ja det blev bättre! Tack så mycket. 

- JoWa
- Global Moderator
- Inlägg: 7782
- Blev medlem: 09 jun 2012, 06:16
- OS: Ubuntu
- Utgåva: 24.04 Noble Numbat LTS
- Ort: Boo
- Kontakt:
Re: Kommando för att radera dubletter i text
Är det bra att posta dessa (eller andra) e-postadresser här? 

Noble Numbat | Firefox 125β (snap) | Privacy Badger
Re: Kommando för att radera dubletter i text
Epostadresserna är offentliga adresser till organisationer så det ska väl inte vara ett problem. 

- JoWa
- Global Moderator
- Inlägg: 7782
- Blev medlem: 09 jun 2012, 06:16
- OS: Ubuntu
- Utgåva: 24.04 Noble Numbat LTS
- Ort: Boo
- Kontakt:
Re: Kommando för att radera dubletter i text
De tar nog med glädje emot mer spam. 

Noble Numbat | Firefox 125β (snap) | Privacy Badger
Re: Kommando för att radera dubletter i text
Förstår piken fast den var fin
. . tror dock inte att spamprogram hittar epostadresserna lättare här än på de webbsidor där epostadresser ursprungligen hämtats så jag vidhåller att det inte borde vara ett problem. Men om admin tror att det kan bli ett problem eller att det är olämpligt så får han/hon gärna ta bort tråden. Jag har ju fått mitt problem löst så det spelar ju ingen roll för mig om det tas bort. Såvitt jag förstår så kan inte jag ta bort inlägget. 


- JoWa
- Global Moderator
- Inlägg: 7782
- Blev medlem: 09 jun 2012, 06:16
- OS: Ubuntu
- Utgåva: 24.04 Noble Numbat LTS
- Ort: Boo
- Kontakt:
Re: Kommando för att radera dubletter i text
Du kan redigera dina inlägg. 

Noble Numbat | Firefox 125β (snap) | Privacy Badger
Re: Kommando för att radera dubletter i text
aha, var det så enkelt . . det är alltså redigera knappen vid varje inlägg . .
, okej då fixar jag det. 

