Српски језик - Вокабулар форум
Srpski jezik - Vokabular forum
07.03 ч. 16.04.2024. *
Добро дошли, Гост. Молимо вас пријавите се или се региструјте.
Да ли сте изгубили ваш активациони e-mail?

Пријавите се корисничким именом или имејлом, лозинком и дужином сесије

Помоћ за претрагу речника Вокабулара
Вести:
Правила форума - Речник - Правопис - Граматика - Вокатив - Језичке недоумице

 
   Почетна   Помоћ Претрага форума Календар Тагови Пријављивање Регистрација  
Странице: 1 [2] 3 4 5  Све
  Штампај  
Аутор Тема: Pomoc oko pravljenja translator-a  (Прочитано 48267 пута)
0 чланова и 2 гостију прегледају ову тему.
Sillypuppie
члан
***
Ван мреже Ван мреже

Пол: Мушкарац
Организација:

Име и презиме:

Струка:
Поруке: 128


« Одговор #15 у: 00.17 ч. 21.02.2008. »

verovatno znaš za štos sa ovim novim sonijevim konzolama koje mogu da se koriste kao farma i da se za male parice dobije opasan kompjutor
Сачувана
Часлав Илић
језикословац
одомаћен члан
****
Ван мреже Ван мреже

Пол: Мушкарац
Организација:

Име и презиме:

Струка: машинац
Поруке: 474



« Одговор #16 у: 11.46 ч. 21.02.2008. »

Цитирано: random
Главни разлози зашто ми данас немамо неко пристојно решење транслатора јесу:

-то што човек који жели да се упусти у све то наилази на обесхрабрујуће савете

Извини ако ти говорим оно што већ и сам знаш, али за сваки случај :)

То што ти хоћеш добро је познат проблем вештачке интелигенције, подобласт обраде природних језика (natural language processing), подобласт машинског превођење (machine translation). Има о томе на Википедији, као и обично.

Другим речима, на томе се ради, још како.
Сачувана
Вученовић
језикословац
староседелац
****
Ван мреже Ван мреже

Пол: Мушкарац
Организација:
_
Име и презиме:

Поруке: 889



« Одговор #17 у: 11.48 ч. 21.02.2008. »

Хвала вам људи на подршци!
Јел би могао неко ко баш зна граматику да ми напише оно што сам тражио?  Био бих му јаааако захвалан!

Ја нажалост ипак слабо знам граматику, а мање више све што знам научио сам на овом форуму овде. Wink Стога тешко да могу да ти будем од помоћи...
Претпостављам да би Ђорђе свакако знао да ти напише то што тражиш. Његов негативан и обесхрабрујући став свакако није злонамеран и сад, кад си показао да немаш намеру да одустанеш већ у старту тако лако, мислим да му је време да одустане од тог става, те очекујем од њега да сад помогне.

Једно мало охрабрење које ја сад могу да ти дам је да приметим да писани српски језик нема седам падежа него шест (прочитај ову тему — локатив и датив се разликују само у сасвим малом броју речи, а и то само у нагласку, тако да у писању тих речи нема никакве разлике, те стога твој програм уопште не мора да разликује та два падежа)! У множини има само пет различитих падежа (локатив, датив и инструментал су у множини исти).
Сачувана
random
посетилац
**
Ван мреже Ван мреже

Пол: Мушкарац
Организација:

Име и презиме:

Струка:
Поруке: 11


« Одговор #18 у: 13.06 ч. 21.02.2008. »

Значи Ђорђе је овде "најјачи"? Да онда њега смарам.  .  .   Grin


Цитирано: Часлав Илић link=topic=1904.    msg16682#msg16682 date=1203590802
Цитирано: random
Главни разлози зашто ми данас немамо неко пристојно решење транслатора јесу:

-то што човек који жели да се упусти у све то наилази на обесхрабрујуће савете

Извини ако ти говорим оно што већ и сам знаш, али за сваки случај :)

То што ти хоћеш добро је познат проблем вештачке интелигенције, подобласт обраде природних језика (natural language processing), подобласт машинског превођење (machine translation).     Има о томе на Википедији, као и обично.   

Другим речима, на томе се ради, још како.   


Управо то.     Упознат сам са тиме, мада, морам признати да нисам упознат докле се у свету стигло, нити какве они идеје имају.     Врло је дискутабилно шта се подразумева под вештачком ителигенцијом.     Исто тако, да ли тај транслатор мора имати додира са ВИ или не.     Ја сам замислио то као програм који ће користити законе и везе и примарни циљ је превод текста мада нећу моћи избећи то да програм донекле "разуме" текст који преводи.   
« Задњи пут промењено: 13.13 ч. 21.02.2008. од random » Сачувана
Вученовић
језикословац
староседелац
****
Ван мреже Ван мреже

Пол: Мушкарац
Организација:
_
Име и презиме:

Поруке: 889



« Одговор #19 у: 14.24 ч. 21.02.2008. »

Pa, eto, vidiš, samo jedna imenica ima sedam padeža u jednini i sedam u množini, plus ostaci stare dvojine

За седам падежа већ рекох да их, са аспекта пројекта аутоматског преводиоца, нема толико.
Што се остатака некакве словенске двојине тиче, чини ми се да се тога не треба плашити. Ако не грешим, ти остаци су опстали само у томе што иза бројева 2, 3 и 4 користимо генитив једнине уместо генитива множине, а у тим случајевима је ваљда некада коришћена двојина. То се може решити програмерски, сасвим једноставним алгоритмом, нема потребе да се база пуни некаквом двојином.

Ради се, дакле, о томе да кажемо 2321 улица, 2322 улице, 2325 улица — зависно од тога којом се цифром завршава број, узимамо номинатив једнине, генитив једнине или генитив множине. Морамо пазити на задње две цифре, зато што су 11, 12, 13, и 14 изузеци од оног што сам у претходној реченици рекао — 2312 улица — ипак генитив множине.

Ево кратког алгоритма који би све то решио:

Нека је N остатак броја који је испред посматране именице при дељењу са сто.
Ако је N >= 11 и N <= 14, онда је именица у генитиву множине
Иначе:
     Нека је M остатак броја N при дељењу с десет.
     Ако је M = 1, онда је именица у номинативу једнине.
     Иначе:
          Ако је M >= 5 или M = 0, онда је именица у генитиву множине.
          Иначе:
                Именица је у генитиву једнине.


Дакле, програмски се сасвим просто може одредити да ли се из базе узима номинатив једнине, генитив једнине, или генитив множине, зависно од броја који се испред именице налази. Нема потребе за увођење у базу посебног појма некакве двојине.
« Задњи пут промењено: 14.26 ч. 21.02.2008. од Вученовић » Сачувана
random
посетилац
**
Ван мреже Ван мреже

Пол: Мушкарац
Организација:

Име и презиме:

Струка:
Поруке: 11


« Одговор #20 у: 14.31 ч. 21.02.2008. »

^Одлично.  Али та двојина се корисити само после бројева?!
Треба прикупити и све изузетке, што каже, људи јел знате ви то?
Сачувана
Часлав Илић
језикословац
одомаћен члан
****
Ван мреже Ван мреже

Пол: Мушкарац
Организација:

Име и презиме:

Струка: машинац
Поруке: 474



« Одговор #21 у: 14.56 ч. 21.02.2008. »

Цитирано: random
Цитирано: Часлав Илић
То што ти хоћеш добро је познат проблем [...] машинског превођења.

Управо то. Упознат сам са тиме [...] Главни разлози зашто ми данас немамо неко пристојно решење [...]

Е па, пошто ја нисам упознат с тим више од тога колико да знам да постоји као област изучавања, онда не могу заиста проценити изводљивост и досеге тога што си наумио :) Могу само да укажем на неке мени познате изворе и решења која би можда могла да ти помогну према ономе што си описао да ти треба.

Колико сам разумео, већ постоји некаква дигитална компилација таквих података, реч^и са својим облицима, коју је нпр. користио Горан Ракић за израду речника за правописар Аспел. Тренутно се бави локализацијом Опенофиса на МФу, под покровитељством министарства, па би можда могао да видиш с њим (зашто имам утисак да ове теме нису сасвим неповезане? :) За контактне детаље, Гугл је мајка.

Опет за преводе програма, требали су ми облици неких речи, махом личних именица и од њих изведених придева. Зато сам саставио некакву скриптицу, зовем је „макродеклинатор“, која олакшава извођење потребних облика, тако да на излазу даје парове (граматичка_одредница, облик). Пример улаза:
Код:
# Изводиоци: парови категорија=наставак (н номинатив, г генитив, ...)
|: н=, г=а, д=у, а=а, и=ом, л=у; # типично за м. род
|а: н=а, г=е, д=и, а=у, и=ом, л=и; # типично за ж. род
|ао: н=ао, г=ла, д=лу, а=ла, и=лом, л=лу; # м. род непостојано о
# ...

# Извођења
diomedea: албатрос|;
spheniscidae: пингвин|;
hirundinidae: ласт|а;
ciconiidae: род|а;
accipitridae: ор|ао;
# ...
Лево од двотачке је јединствени кључ уноса. Када се оваква датотека пропусти кроз макродеклинатор, један од излаза је, рецимо, овакав:
Код:
# AUTOGENERATED, do not edit!
# from: aves.frm
#
=:diomedea:н=албатрос:г=албатроса:д=албатросу:а=албатроса:и=албатросом:л=албатросу::
=:spheniscidae:н=пингвин:г=пингвина:д=пингвину:а=пингвина:и=пингвином:л=пингвину::
=:hirundinidae:н=ласта:г=ласте:д=ласти:а=ласту:и=ластом:л=ласти::
=:ciconiidae:н=рода:г=роде:д=роди:а=роду:и=родом:л=роди::
=:accipitridae:н=орао:г=орла:д=орлу:а=орла:и=орлом:л=орлу::
Овај формат зовем с-мапом (мапа својстава), намењен лаком рашчлањивању у програмима-корисницима.

Е сад, иако понудих „олакшање посла“, морам да те упозорим да ми, без обзира на сопствено незнање, примена овога у твојим околностима делује мало неизгледно :) Мени треба за врло ограничену област примене, па и за такву, можеш погледати неке радне примерке: изводиоци, имена држава.

измена: исправан акузатив (у мојим применама је углавном мушки род неживи, не пернати :)
« Задњи пут промењено: 15.05 ч. 21.02.2008. од Часлав Илић » Сачувана
Часлав Илић
језикословац
одомаћен члан
****
Ван мреже Ван мреже

Пол: Мушкарац
Организација:

Име и презиме:

Струка: машинац
Поруке: 474



« Одговор #22 у: 15.38 ч. 21.02.2008. »

Цитирано: Вученовић
[...] иза бројева 2, 3 и 4 користимо генитив једнине уместо генитива множине, а у тим случајевима је ваљда некада коришћена двојина. То се може решити програмерски [...] Ево кратког алгоритма који би све то решио: [...]

Ево и мало запетљаније, радни примерак :)
Код:
"Plural-Forms: nplurals=4; plural=(n==1 ? 3 : n%10==1 && n%100!=11 ? 0 : n%10>=2 && n%10<=4 && (n%100<10 || n%100>=20) ? 1 : 2);\n"
Одавно се користи за поруке са целобројним вредностима које програми приказују корисницима. Преводилац наведе преведену поруку за сва четири случаја (за српски), које се бирају током извршавања на основу тренутног броја и овог израза. Наравно, не у преводу Виндоуза и сличних професионалних подухвата ;)
Сачувана
dekss
посетилац
**
Ван мреже Ван мреже

Организација:

Име и презиме:
Дејан Савковић
Поруке: 21


« Одговор #23 у: 11.57 ч. 22.02.2008. »

мислим да сте мало претерали с тим "дефетизном" Smiley
ако човек каже да је могуће онда је могуће Wink

ок мало се шалим, а сад шалу на страну: јесте српски језик компликован, али није толико компликованији од свих оних језика чији преводиоци већ постоје на интернету (јапански, кинески, руски, ...).
Наравно да је то велики велики посао, али како каже она народна: "мирна вода брег рони" ... немојте омаловажавати опен соурце заједницу (не знам како се ово пише на српском) ... потребна је само јака воља, а надам се да је рандом има... и ако треба помоћ ...

Јесте треба човеку 10 година да добро научи језик (јел ја то чујем неку сујетуWink али није потребно рачунару да тако добор научи српски, тј. не мора тај превод да буде савршен. довољно је да се на брзину преведе неки чланак да онај ко не зна енглески стекне о чему се ради. ако му се превод не свиђа - ето посла за преводиоца Wink
не мора рачунар да зна баш свих седам падежа, доста су 2-3 Wink

рандом, свака част за идеју. само напред, надам се да нећеш одустати...
Сачувана
Ђорђе Божовић
језикословац
староседелац
****
Ван мреже Ван мреже

Пол: Мушкарац
Организација:

Име и презиме:
Đorđe Božović
Струка: lingvist
Поруке: 4.322


« Одговор #24 у: 15.33 ч. 22.02.2008. »

Значи Ђорђе је овде "најјачи"?

Nisam ja najjači. Tu su i vrlo jaki igrači Bojan Bašić i Neskafica, i drugi. Wink

Skoro smo Bojana izglasali za najkorisnijeg posetioca foruma, a Neskafica je zauzeo drugo mesto!

Да онда њега смарам.  .  .   Grin

Nema potrebe za smaranjem. Wink Svi mi dolazimo ovde da bismo pomoć zatražili i pomoć dali. I ja, ali i mnogi drugi igrači, rado ćemo ti pomoći oko svakog jezičkog pitanja i nedoumice koliko znamo i možemo.

Ne sumnjam da će se neko verovatno uskoro skaniti da pojasni makar glavne principe gramatike promenljivih reči. A dotad, ako nemaš pristupa nekoj „papirnatoj“ gramatici, pogledaj recimo članke na Vikipediji o imenicama, glagolima, pridevima — i tamo možeš pronaći te kategorije koje te zanimaju! Na primer, hrvatsko izdanje Vikipedije ima dosta podataka u člancima povezanim sa gramatikom. A ono što tamo ne budeš pronašao, možeš u svakom trenutku pitati ovde, ako se neko ne bude uskoro skanio da odgovori na tvoje prvobitno pitanje. Smiley Jeste malčice preobimno, zar ne?
Сачувана
Madiuxa
староседелац
****
Ван мреже Ван мреже

Пол: Жена
Организација:

Име и презиме:

Струка:
Поруке: 7.477


« Одговор #25 у: 16.39 ч. 04.03.2008. »

Ех, мени је СТВАРНО жао, али морам се сложити са карломружним, Ђорђем, Зораном и осталима... Мислим да је програм за превођење (али људски) немогуће направити, и то не само за српски, него за било који други језик. Зашто? Не због падежа и промена, јер то су конкретне и непроменљиве ствари, то јест обични подаци, већ због како неко већ рече, различитих значења одређених речи у одрешеним језицима... Узмимо нпр. реч играти у српском, и различите преводе те речи на енглески... play, dance...

He played cards all night.
He danced all night.

Како ће компјутер знати коју реч треба користити? И ово је врло, врло прост пример, а таквих и десет пута компликованијих примера има садругим глаголима, да почнемо само од енгл. глагола get, put, have, итд... Отвори било који речник енгл. језика и погледај значења код глагола Get и биће ти јасно о чему говорим. Које значење треба одабрати може се закључити само по контексту, а компјутер једноставно НЕ МОЖЕ да чита контекст, јер да би то радио, треба да буде способан да изађе из својих устаљених испрограмираних шема, што мислим да није могуће...

А о идиомима, изразима, изрекама и сл. да и не говорим...

Погледај само грешке које и сам човек прави баш зато што преводи аутоматски... Кладим се да б и компјутер мртав ладан такође дошао до магнетних ливада и марсовских уметности... Grin
Сачувана
Sillypuppie
члан
***
Ван мреже Ван мреже

Пол: Мушкарац
Организација:

Име и презиме:

Струка:
Поруке: 128


« Одговор #26 у: 19.46 ч. 04.03.2008. »

Ех, мени је СТВАРНО жао, али морам се сложити са карломружним, Ђорђем, Зораном и осталима... Мислим да је програм за превођење (али људски) немогуће направити, и то не само за српски, него за било који други језик. Зашто? Не због падежа и промена, јер то су конкретне и непроменљиве ствари, то јест обични подаци, већ због како неко већ рече, различитих значења одређених речи у одрешеним језицима... Узмимо нпр. реч играти у српском, и различите преводе те речи на енглески... play, dance...

He played cards all night.
He danced all night.

Како ће компјутер знати коју реч треба користити? И ово је врло, врло прост пример, а таквих и десет пута компликованијих примера има садругим глаголима, да почнемо само од енгл. глагола get, put, have, итд... Отвори било који речник енгл. језика и погледај значења код глагола Get и биће ти јасно о чему говорим. Које значење треба одабрати може се закључити само по контексту, а компјутер једноставно НЕ МОЖЕ да чита контекст, јер да би то радио, треба да буде способан да изађе из својих устаљених испрограмираних шема, што мислим да није могуће...

А о идиомима, изразима, изрекама и сл. да и не говорим...

Погледај само грешке које и сам човек прави баш зато што преводи аутоматски... Кладим се да б и компјутер мртав ладан такође дошао до магнетних ливада и марсовских уметности... Grin

i za šah su isto tako govorili, ali kad je postalo moguće držati u memoriji dovoljno podataka, prestalo je da bude nemoguće, isto važi i ovde.

Сачувана
Madiuxa
староседелац
****
Ван мреже Ван мреже

Пол: Жена
Организација:

Име и презиме:

Струка:
Поруке: 7.477


« Одговор #27 у: 19.58 ч. 04.03.2008. »

Ех, мени је СТВАРНО жао, али морам се сложити са карломружним, Ђорђем, Зораном и осталима... Мислим да је програм за превођење (али људски) немогуће направити, и то не само за српски, него за било који други језик. Зашто? Не због падежа и промена, јер то су конкретне и непроменљиве ствари, то јест обични подаци, већ због како неко већ рече, различитих значења одређених речи у одрешеним језицима... Узмимо нпр. реч играти у српском, и различите преводе те речи на енглески... play, dance...

He played cards all night.
He danced all night.

Како ће компјутер знати коју реч треба користити? И ово је врло, врло прост пример, а таквих и десет пута компликованијих примера има садругим глаголима, да почнемо само од енгл. глагола get, put, have, итд... Отвори било који речник енгл. језика и погледај значења код глагола Get и биће ти јасно о чему говорим. Које значење треба одабрати може се закључити само по контексту, а компјутер једноставно НЕ МОЖЕ да чита контекст, јер да би то радио, треба да буде способан да изађе из својих устаљених испрограмираних шема, што мислим да није могуће...

А о идиомима, изразима, изрекама и сл. да и не говорим...

Погледај само грешке које и сам човек прави баш зато што преводи аутоматски... Кладим се да б и компјутер мртав ладан такође дошао до магнетних ливада и марсовских уметности... Grin

i za šah su isto tako govorili, ali kad je postalo moguće držati u memoriji dovoljno podataka, prestalo je da bude nemoguće, isto važi i ovde.



Zivi bili pa videli. Sah je pre svega matematicka igra koja ne ukljucuje inventivnost i mastovitost. Prevod, da bi bio zaista dobar, ne moze biti rezultat automatskog zamenjivanja reci, sablona i sl. Mislim, ok, moze se napraviti program koji bi radio prevode "za prvu pomoc", ali pravo prevodjenje filmova, knjiga i drugih proizvoda ljudske mastovitosti i umetnickog stvaralastva moze da uradi kako treba samo covek, bas zato sto je ljudsko bice a ne masina. Masina je predvidljiva, ljudsko bice nije.
Сачувана
Зоран Ђорђевић
староседелац
****
Ван мреже Ван мреже

Пол: Мушкарац
Организација:

Име и презиме:

Струка: Дипл. инж.
Поруке: 2.364



« Одговор #28 у: 20.10 ч. 04.03.2008. »

Потреба за компјутерским програмима за превођење много квари језик. Поједностављује га, шематизује, користи најпростије конструкције и своди на математику. Превођење је не само занат, него и уметност.
Сачувана
Madiuxa
староседелац
****
Ван мреже Ван мреже

Пол: Жена
Организација:

Име и презиме:

Струка:
Поруке: 7.477


« Одговор #29 у: 20.23 ч. 04.03.2008. »

Потреба за компјутерским програмима за превођење много квари језик. Поједностављује га, шематизује, користи најпростије конструкције и своди на математику. Превођење је не само занат, него и уметност.
Апсолутно тачно.
Сачувана
Тагови: gramatika  srpski jezik  translator prevodilac 
Странице: 1 [2] 3 4 5  Све
  Штампај  
 
Скочи на:  

Покреће MySQL Покреће PHP Powered by SMF 1.1 RC2 | SMF © 2001-2005, Lewis Media Исправан XHTML 1.0! Исправан CSS!