Kako je neophodnost da se dokumenti, ili delovi dokumenata, jezički odrede, naročito u elektronskom obliku, uvdeni su odgovarajući standardi.
Ja se držim
http://www.rfc-editor.org/rfc/rfc4646.txt. Ovo je standard koji se koristi za označavanje jezika u HTML dokumentima, odavno je u upotrebi i prilično je rasprostranjen.
Označavanje je logično i primenljivo: oznaka jezika je podeljena u više delova koji su medjusobno razdvojeni znakom '-'. Prvi deo je obavezan, a ostali nisu obavezni, niti je strogo definasno njihovo značenje već postoji samo preporuka.
Preporuka je da oznaka jezika sadrzi podoznake sa sledecim znaćenjem:
jezik-pismo-region-varijanta-ekstenzija-slobodno
Kod tumačenja oznaka zanemaruje se razlika između velikih i malih slova. Neki standardi propisuju oznake koje sadrže mala i velika slova, ali se u tumačenju to zanemaruje.
Prvi deo je oznaka jezika. Koriste se oznake prema
ISO 639. Ovaj standard ima dve varijante: dvoslovne i troslovne oznake jezika. Ako za jezik postoje i dvoslovne i troslovne oznake, uzima se dvoslovna. Za srpski to je sr.
Drugi deo se obično koristi da označi pismo (u našem primeru ćirilica/latinica), državu ili region, pa i varijantu jezika. Za oznake pisma se koriste oznake po
ISO 15924 standardu. Po njemu, srpska ćirilica se oznacava sa sr-Cyrl, a srpska latinica sa sr-Latn. U svakodnevnoj upotrebi je često i sr-cir i sr-lat. Pregled usvojenih podoznaka za drugi deo oznake jezika možete videti na
http://www.iana.org/assignments/language-subtag-registryRegioni se označavaju prema
ISO_3166 (dvoslovne) i
UN M.49 (troslovne). Za Srbiju ISO oznaka je RS a UN oznaka je SRB.