Српски језик - Вокабулар форум
Srpski jezik - Vokabular forum
17.16 ч. 21.09.2018. *
Добро дошли, Гост. Молимо вас пријавите се или се региструјте.
Да ли сте изгубили ваш активациони e-mail?

Пријавите се корисничким именом или имејлом, лозинком и дужином сесије

Помоћ за претрагу речника Вокабулара
Вести:
Правила форума - Речник - Правопис - Граматика - Вокатив - Језичке недоумице

 
   Почетна   Помоћ Претрага форума Календар Тагови Пријављивање Регистрација  
Странице: [1]
  Штампај  
Аутор Тема: Сортирање „a tergo“  (Прочитано 5028 пута)
0 чланова и 0 гостију прегледају ову тему.
J o e
језикословац
староседелац
****
Ван мреже Ван мреже

Пол: Мушкарац
Организација:

Име и презиме:

Струка:
Поруке: 1.688



« у: 00.32 ч. 06.06.2010. »

Питање за наше информатичаре.

Како је могуће списак речи уазбучити (поређати по азбучном реду) тако да сортирање почиње од последњег слова речи ка првом, а не од првог ка последњем?? Овај посебан тип уазбучавања назива се обратно, одостражно, a tergo и има посебну сврху у лингвистици (нарочито у творби речи; в. ово).

Ово ми је потребно пошто имам свој мали корпус речи и морам да га овако сортирам, па се довијам — пешице, тако што у колону поред речи прекуцам ручно у обрнутом реду, онда ставим да ми то поређа по азбучном, па ми тако и прва колона остаје оригинална, само поређана a tergo. Не треба рећи да овакав посао траје годинама.

Када је М. Николић, пише у предговору, издавао свој Обратни речник, штампар Давор Палчић му је израдио „посебан програм“ за сортирање. Мени се чини да то није некаква нарочита наука, већ неколико десетина минута посла (да се направи некакав конвертор), па ме занима какве идеје имате.
Сачувана
Miki
Гост
« Одговор #1 у: 01.27 ч. 06.06.2010. »

http://mytexttools.com/Reverse-Text-Generator.html или http://www.flipmytext.com/textreverser.html — ако већ имаш откуцан тај списак, пребаци га овде, уради одостраживање Smiley, па га пребаци поново у Ворд (или програм са којим радиш); подржавају наша писма и дијактрике, проверио сам. Ако нећеш да се патиш са интернетским страницама, ево ти један бесплатан програмчић који ради управо то: http://www.softpedia.com/progDownload/Text-Reverser-Download-89502.html. Проблем је што не подржава неенглеска слова, па би морао да примениш опцију Пронађи и замени како би од хијероглифа поново добио наше дијактрике (то и није толико велики посао, десетак минута, за разлику од куцања сваке речи унатрашке, где се лако може догодити превид).
Сачувана
Часлав Илић
језикословац
одомаћен члан
****
Ван мреже Ван мреже

Пол: Мушкарац
Организација:

Име и презиме:

Струка: машинац
Поруке: 474



« Одговор #2 у: 10.41 ч. 06.06.2010. »

Ако се списак речи извезе у обичну текстуалну датотеку, нпр. wordlist.txt, једна реч по реду, онда се овако може поређати одостражно:
Код:
#!/usr/bin/env python

import locale, sys
locale.setlocale(locale.LC_ALL, "sr_RS")
words = [x.decode("utf8") for x in sys.stdin.readlines()]
words_rev = [x[::-1] for x in words]
words_rev.sort(locale.strcoll)
words_srt = [x[::-1] for x in words_rev]
sys.stdout.writelines(x.encode("utf8") for x in words_srt)
Ово се сачува у датотеку нпр. revsort.py, па онда:
Код:
$ python revsort.py <wordlist.txt >wordlist-revsrt.txt
и добије се wordlist-revsrt.txt са жељеним ређањем. Претпоставка је да је списак речи ћирилички и кодиран по УТФ-8, и да на систему постоји српски ћирилички локалитет sr_RS, како би сортирање користило исправну колацију слова (да ј буде између и и к, итд).

За лаку примену овога потребан је способан оперативни систем који је добро прилагођен српском језику. Виндоуз то није. Онда, четири опције:

1) Окачити овде списак речи, у облику обичне текстуалне датотеке, и ја ћу окачити назад ову са одостражним ређањем.

2) Инсталирати систем на коме се горње да̂ лако спровести на основу датих инструкција, рецимо Убунту, Федору, или ОпенСУСЕ (сви су џабе).

3) Инсталирати потребне елементе да би горње радило под виндоузом. Не знам који би то били.

4) Занемарити ово моје брбљање и наставити потрагу за „лаким“ решењем.

Допуна. Са себичне тачке гледишта волео бих да Џо изабере опцију (1), јер би и мени добро дошао један богат списак речи; између осталог, баш и такав поређан одостражно ради проверавања творбених образаца.
« Задњи пут промењено: 10.45 ч. 06.06.2010. од Часлав Илић » Сачувана
J o e
језикословац
староседелац
****
Ван мреже Ван мреже

Пол: Мушкарац
Организација:

Име и презиме:

Струка:
Поруке: 1.688



« Одговор #3 у: 12.29 ч. 06.06.2010. »

Хвала вам обојици! Много сте ми помогли! Вероватно ћу засад користити оне Мирослављеве линкове, пошто би ми требало нешто времена, које тренутно немам, да се позабавим Часлављевим предлогом.

Иначе, није то никакав посебан корпус. Имам тек око две-три стотине примера неологизама наших песника (Змај, Костић...), па испитујем како функционишу творбени обрасци, шта одудара од система и сл. Кад сакупим бар неку хиљаду, можда ће и бити корисно.

Још једном срдачно захваљујем на брзим одговорима! Smiley Smiley
Сачувана
Miki
Гост
« Одговор #4 у: 12.42 ч. 06.06.2010. »

Нема на чему. Раде без грешке обе оне стране при обртању текста, ево доказа (Cheesy):

—>

Мала шала, не замери. Smiley
Сачувана
J o e
језикословац
староседелац
****
Ван мреже Ван мреже

Пол: Мушкарац
Организација:

Име и презиме:

Струка:
Поруке: 1.688



« Одговор #5 у: 12.46 ч. 06.06.2010. »

Знам, знам. Пробао сам, супер је. Што је најгоре, и са̑м сам два сата синоћ, без успеха, тражио нешто овако.
Сачувана
Тагови:
Странице: [1]
  Штампај  
 
Скочи на:  

Покреће MySQL Покреће PHP Powered by SMF 1.1 RC2 | SMF © 2001-2005, Lewis Media Исправан XHTML 1.0! Исправан CSS!