Íslenskun bókstafa í SMS blogg fćrslum

Skrifađ 17. júlí 2003, kl. 18:26

Ég hef ákveđiđ ađ deila međ ykkur reglulegu segđunum sem ég nota til ađ búa til sér-íslenska bókstafi í SMS skeytunum mínum.

SMS Íslenskunarkóđinn minn byggist á ţví ađ notađur sé ákveđinn ritháttur fyrir tákn á borđ viđ Đ og Ţ. Öll íslensku táknin (fyrir utan Ö) má tákna međ ţví ađ setja upphrópunarmerki (!) fyrir framan viđkomandi bókstaf eđa bókstafi, en ađ auki má nota öfuga broddstafi, s.s. ŕ, ů, ě o.s.frv. Rithátturinn er frekar sveigjanlegur ţví mismunandi gerđir af farsímum hafa mis-góđan stuđning viđ íslenska stafi. Sumir hafa bara broddstafi međ öfugum kommum, sumir hafa bara danskt Ř, sumir hafa bara lágstafi međ broddi, og fćstir bjóđa upp á táknin Ţ og Đ.

Dćmi um notkun ritháttarins: !Ta!d er !ae!di a!d geta skrifa!d ěslensku ě SMS. H!urra fyrir reglulegum seg!dum!

Reynsla mín er sú ađ ţessi ritháttur er auđlćrđur og alveg merkilega ţjáll í notkun.

En svo viđ snúum okkur aftur ađ forritunarhlutanum, ţá skiptist ţýđingarferliđ upp í 4 skref:

  1. Undirbúningur textans
  2. Íslenskun tákna
  3. Stćkkun á skammstöfunum
  4. Frágangur

Eftirfarandi forritunardćmi koma beint Perl forritinu sem ég nota en tölvulćsir lesendur ćttu ađ geta ţýtt ţessar skipanir yfir í hvađa forritunarmál sem er - svo fremi sem ţađ forritunarmál býđur upp textameđhöndlun međ reglulegum segđum.

Skref 1. Undirbúa textann fyrir íslenskun

chomp $body;
$body =~ s/ /  /g;
$body =~ s/(\? |! |: |; |, |\. )/ $1/g;
$body = " " . $body . " ";

chomp klippir óţörf \n (lína endar) tákn aftan af textanum, og nćstu línur tvöfalda öll orđabil til ađ ađ ná örugglega samliggjandi smáorđum, setja bil á undan greinamerkjum, og setja bil framan og aftan á strenginn til ađ leitin nái líka til fyrsta og seinasta orđs.

Skref 2. Framkvćma íslenskunina

$body =~ s/!Ae/Ć/g;
$body =~ s/!ae/ć/g;
$body =~ s/(Ŕ|!ŕ|!A)/Á/g;
$body =~ s/(ŕ|!a)/á/g;
$body =~ s/!D/Đ/g;
$body =~ s/!d/đ/g;
$body =~ s/!E/É/g;
$body =~ s/!e/é/g;
$body =~ s/(Ě|!ě|!I)/Í/g;
$body =~ s/(ě|!i)/í/g;
$body =~ s/(Ň|!ň|!O)/Ó/g;
$body =~ s/(ň|!o)/ó/g;
$body =~ s/(Ů|!ů|!U)/Ú/g;
$body =~ s/(ů|!u)/ú/g;
$body =~ s/Ř/Ö/g;
$body =~ s/ř/ö/g;
$body =~ s/!Y/Ý/g;
$body =~ s/!y/ý/g;
$body =~ s/!Th/Ţ/g;
$body =~ s/!th/ţ/g;
$body =~ s/!T/Ţ/g;
$body =~ s/!t/ţ/g;

Ath: Ég leyfi líka styttan rithátt !T og !t fyrir Ţ og ţ

Skref 3. Skilgreina nokkrar algengar skammstafanir

$body =~ s/ & / og /g;
$body =~ s/ m / međ /g;
$body =~ s/ f / fyrir /g;
$body =~ s/ (a|A)d / $1đ /g;
$body =~ s/ eg / ég /g;
$body =~ s/ Eg / Ég /g;
$body =~ s/ (t|T)-póst/ $1ölvupóst/g;
$body =~ s/ (n|N)etf / $1etfang /g;

(Mér hafa enn ekki dottiđ neinar fleiri skammstafanir í hug. Fleiri tillögur eru ţegnar međ ţökkum)

Skref 4. Taka til eftir okkur

$body =~ s/^\s(.+)\s$/$1/;
$body =~ s/  / /g;
$body =~ s/ (\?|!|:|;|,|\.)/$1/g;

(Fjarlćgja öll auka bilin sem viđ settum inn í skrefi 1.)


Meira ţessu líkt: Farsímablogg, Forritun.


Svör frá lesendum (4)

  1. Tóró svarar:

    smsms = (Sent međ SMS).

    18. júlí 2003 kl. 00:12 GMT | #

  2. Tóró svarar:

    (eđa bćtist ţađ kannski sjálfkrafa aftan viđ SMS sendingar?)

    18. júlí 2003 kl. 00:14 GMT | #

  3. Már Örlygsson svarar:

    Já "(Sent međ SMS)" bćtist sjálfkrafa aftan á fćrslurnar.

    18. júlí 2003 kl. 13:14 GMT | #

  4. gunnare svarar:

    Frábćrt framtak!

    Eitt sem ég var samt ađ velta fyrir mér, ég var nefnilega ađ prófa mig eitthvađ áfram međ ađ senda email međ smsi og ţađ virđist ekki alveg vera ađ ganga ađ senda sér íslensku stafina đ, ţ og ö í gegnum 1415. Ég fć alltaf til baka: "Thjonustan er ekki til". Ég er kannski bara ađ gera eitthvađ rugl. Ég sendi email međ ţví ađ senda sms-iđ: "postur [netfang] [skilabođ] í 1415

    22. júlí 2003 kl. 00:42 GMT | #

Ţessum svarhala hefur veriđ lokađ. Kćrar ţakkir til ţeirra sem tóku ţátt í umrćđunni.


 

Flakk um vefsvćđiđ



 

Nýleg svör frá lesendum

  • Rich (Req.js - javascript lazy-loading and dependency managment made easy)
  • Rich (Req.js - javascript lazy-loading and dependency managment made easy)
  • Rich (Req.js - javascript lazy-loading and dependency managment made easy)
  • Már (Req.js - javascript lazy-loading and dependency managment made easy)
  • Rich (Req.js - javascript lazy-loading and dependency managment made easy)
  • Már (Req.js - javascript lazy-loading and dependency managment made easy)
  • Dinesh (Req.js - javascript lazy-loading and dependency managment made easy)
  • Már (Taubleyjur í nútímanum - lítill leiđarvísir handa hrćddri ţjóđ)
  • Ada (Taubleyjur í nútímanum - lítill leiđarvísir handa hrćddri ţjóđ)
  • notandi (Taubleyjur í nútímanum - lítill leiđarvísir handa hrćddri ţjóđ)
  • Geir (Lausnin á efnahagsvandanum)
  • Jenný (Lausnin á efnahagsvandanum)
  • Óli Jens (Lausnin á efnahagsvandanum)
  • Már (Lausnin á efnahagsvandanum)
  • Kjartan S (Lausnin á efnahagsvandanum)

 

 

Yfirlit yfir ţetta skjal

(Atriđin í listanum vísa á ákveđna kafla ofar á síđunni.)