Српски језик - Вокабулар форум
Srpski jezik - Vokabular forum

Наше писмо и рачунари => Ћирилица и латиница на рачунарима => Тему започео: J o e на 00.32 ч. 06.06.2010.



Наслов: Сортирање „a tergo“
Порука од: J o e на 00.32 ч. 06.06.2010.
Питање за наше информатичаре.

Како је могуће списак речи уазбучити (поређати по азбучном реду) тако да сортирање почиње од последњег слова речи ка првом, а не од првог ка последњем?? Овај посебан тип уазбучавања назива се обратно, одостражно, a tergo и има посебну сврху у лингвистици (нарочито у творби речи; в. ово (http://www.vokabular.org/forum/index.php?topic=454.0)).

Ово ми је потребно пошто имам свој мали корпус речи и морам да га овако сортирам, па се довијам — пешице, тако што у колону поред речи прекуцам ручно у обрнутом реду, онда ставим да ми то поређа по азбучном, па ми тако и прва колона остаје оригинална, само поређана a tergo. Не треба рећи да овакав посао траје годинама.

Када је М. Николић, пише у предговору, издавао свој Обратни речник, штампар Давор Палчић му је израдио „посебан програм“ за сортирање. Мени се чини да то није некаква нарочита наука, већ неколико десетина минута посла (да се направи некакав конвертор), па ме занима какве идеје имате.


Наслов: Одг: Сортирање „a tergo“
Порука од: Miki на 01.27 ч. 06.06.2010.
http://mytexttools.com/Reverse-Text-Generator.html или http://www.flipmytext.com/textreverser.html — ако већ имаш откуцан тај списак, пребаци га овде, уради одостраживање :), па га пребаци поново у Ворд (или програм са којим радиш); подржавају наша писма и дијактрике, проверио сам. Ако нећеш да се патиш са интернетским страницама, ево ти један бесплатан програмчић који ради управо то: http://www.softpedia.com/progDownload/Text-Reverser-Download-89502.html. Проблем је што не подржава неенглеска слова, па би морао да примениш опцију Пронађи и замени како би од хијероглифа поново добио наше дијактрике (то и није толико велики посао, десетак минута, за разлику од куцања сваке речи унатрашке, где се лако може догодити превид).


Наслов: Одг: Сортирање „a tergo“
Порука од: Часлав Илић на 10.41 ч. 06.06.2010.
Ако се списак речи извезе у обичну текстуалну датотеку, нпр. wordlist.txt, једна реч по реду, онда се овако може поређати одостражно:
Код:
#!/usr/bin/env python

import locale, sys
locale.setlocale(locale.LC_ALL, "sr_RS")
words = [x.decode("utf8") for x in sys.stdin.readlines()]
words_rev = [x[::-1] for x in words]
words_rev.sort(locale.strcoll)
words_srt = [x[::-1] for x in words_rev]
sys.stdout.writelines(x.encode("utf8") for x in words_srt)
Ово се сачува у датотеку нпр. revsort.py, па онда:
Код:
$ python revsort.py <wordlist.txt >wordlist-revsrt.txt
и добије се wordlist-revsrt.txt са жељеним ређањем. Претпоставка је да је списак речи ћирилички и кодиран по УТФ-8, и да на систему постоји српски ћирилички локалитет sr_RS, како би сортирање користило исправну колацију слова (да ј буде између и и к, итд).

За лаку примену овога потребан је способан оперативни систем који је добро прилагођен српском језику. Виндоуз то није. Онда, четири опције:

1) Окачити овде списак речи, у облику обичне текстуалне датотеке, и ја ћу окачити назад ову са одостражним ређањем.

2) Инсталирати систем на коме се горње да̂ лако спровести на основу датих инструкција, рецимо Убунту (http://www.ubuntu.com), Федору (http://fedoraproject.org), или ОпенСУСЕ (http://www.opensuse.org) (сви су џабе).

3) Инсталирати потребне елементе да би горње радило под виндоузом. Не знам који би то били.

4) Занемарити ово моје брбљање и наставити потрагу за „лаким“ решењем.

Допуна. Са себичне тачке гледишта волео бих да Џо изабере опцију (1), јер би и мени добро дошао један богат списак речи; између осталог, баш и такав поређан одостражно ради проверавања творбених образаца.


Наслов: Одг: Сортирање „a tergo“
Порука од: J o e на 12.29 ч. 06.06.2010.
Хвала вам обојици! Много сте ми помогли! Вероватно ћу засад користити оне Мирослављеве линкове, пошто би ми требало нешто времена, које тренутно немам, да се позабавим Часлављевим предлогом.

Иначе, није то никакав посебан корпус. Имам тек око две-три стотине примера неологизама наших песника (Змај, Костић...), па испитујем како функционишу творбени обрасци, шта одудара од система и сл. Кад сакупим бар неку хиљаду, можда ће и бити корисно.

Још једном срдачно захваљујем на брзим одговорима! :) :)


Наслов: Одг: Сортирање „a tergo“
Порука од: Miki на 12.42 ч. 06.06.2010.
Нема на чему. Раде без грешке обе оне стране при обртању текста, ево доказа (:D):

(http://i48.tinypic.com/20jkdwl.png) —> (http://i46.tinypic.com/262s4k9.png)

Мала шала, не замери. :)


Наслов: Одг: Сортирање „a tergo“
Порука од: J o e на 12.46 ч. 06.06.2010.
Знам, знам. Пробао сам, супер је. Што је најгоре, и са̑м сам два сата синоћ, без успеха, тражио нешто овако.