“Dilmanc”:
axtarışlar, nəticələr, perspektivlər
İnsan beyni necə işləyir? Təəssüf ki, bu sualın cavabını tapmaq hələ də mümkün olmamışdır. İnsanın hətta əlçatmaz görünən kosmos haqqında böyük kəşflərinə baxmayaraq, hələ də onun beynində gedən proseslər tam dəqiq başa düşülmür və insanın özü haqqında bildikləri kainat haqqında bildikləri ilə müqayisədə çox kiçik görünür.
Aşkar nailiyyətlərə baxmayaraq, xüsusilə insan beynində gedən proseslərin mahiyyəti hələ də aydın deyildir və məhz buna görə də dünya elmi süni intellekt yaradılması problemini həll etməkdən çox uzaqdır. Lakin buna baxmayaraq insanın qəbul etdiyi və onun verdiyi reaksiyalar əsasında beyində gedən proseslərin təxmini modelinin qurulmasına cəhd olunur. Elə bir modelin qurulmasına cəhd göstərilir ki, onun əsasında kompyuter insan kimi “Fikirləşsin”. Bəzi hallarda yaxşı nəticələr alınır, bəzi hallarda isə lazımı nəticələr alınmır.
Azərbaycan dili üçün (o cümlədən digər dillər üçün də) linqvistik texnologiyaların yaradılması və tətbiqi sahəsindəki axtarışlar məhz bununla bağlıdır. Bu proqram əsasında insan beyninə daxil olan informasiyalardan və insanın verdiyi reaksiyalardan istifadə etməklə beyində gedən proseslər modelləşdirilir.
Azərbaycan dilindən digər dillərə və əksinə tərcümə prosesinin avtomatlaşdırılması məsələsi ilk dəfə 2003-cü ilin əvvəllərində akademik Ə.M.Abbasov tərəfindən qoyulmuş və onun rəhbərliyi altında Azərbaycan dili üçün tətbiqi linqvistik texnologiyaların yaradılması istiqamətində tədqiqatlara başlanmışdır. Bu müddət ərzində Azərbaycan dilindən digər dillərə və əksinə tərcümə prosesini avtomatlaşdırmağa imkan verən xüsusi modelləşdirmə metodu (rəqəmsal modelləşdirmə metodu) yaradılmış və bu metod əsasında Azərbaycan-ingilis maşın tərcüməsi sisteminin yaradılmasına başlanmışdır.
İşlərin məntiqi davamı kimi Azərbaycan Respublikası Rabitə və İnformasiya Texnologiyaları Nazirliyi 2005-ci ilin aprel ayından “Dilmanc” layihəsinin həyata keçirilməsinə başlamışdır.
Hazırda layihədə nəzərdə tutulmuş elmi tədqiqat istiqamətlərinin hər biri üzrə praktik nəticələr əldə olunmuş və onların keyfiyyətinin artırılması üzərində işlər gedir. Layihə çərçivəsində Azərbaycan-ingilis, ingilis-Azərbaycan və türk-Azərbaycan, Azərbaycan-rus və rus-Azərbaycan istiqaməti üzrə tərcümə sistemi yaradılmış və istifadəyə verilmişdir. Bundan əlavə, Azərbaycan dili üçün nitqin tanınması sistemi yaradılmışdır. Azərbaycan dili üçün verilmiş mətni səslə oxuyan mətnin səsləndirilməsi sistemi istifadəyə verilmişdir. Telefon danışığını Azərbaycan dilindən digər dillərə və əksinə tərcümə edə bilən sistemin keyfiyyətinin artırılması üzərində işlər gedir.
Oxucuların böyük maraq göstərdikləri bu məsələ ilə bağlı lazımı məlumatları almaq üçün Rabitə və İnformasiya Texnologiyaları Nazirliyi “Dilmanc” layihəsinin rəhbəri, əməkdar mühəndis, texnika elmləri namizədi, dosent Əbülfət Fətullayevə müraciət etdik. Müsahibimiz fikirlərini bizimlə bölüşdü:
- “Dilmanc” maşın tərcüməsi sistemi mətnləri saniyələr ərzində avtomatik tərcümə edir. Maşın tərcüməsi sistemlərinin müsbət və mənfi cəhətləri vardır. Tərcümənin onlayn olması, konfidensiallığı, sürəti və s. onun müsbət cəhətləridir, keyfiyyətin bəzən aşağı olması isə onun mənfi cəhətidir. İnsanlar tərəfindən edilən real tərcümələrdən fərqli olaraq hələ ki, bu sistem vasitəsilə mətni bütövlükdə başa düşüb tərcümə etmək mümkün deyil. Mətn ayrı-ayrı cümlələr şəklində, yəni ümumi kontekst nəzərə alınmadan tərcümə olunduğu üçün yaradılan bu tərcümə sistemləri mükəmməl deyil, nöqsanlıdır. Bu xətalar yalnız bizim maşın tərcüməsi sisteminə deyil, bütün dünyada istifadə olunan maşın tərcüməsi sistemlərinə də aiddir.
Hazırda bu sistem təkmilləşdirilir. Bunun üçün maşın tərcüməsinə yeni yanaşmalar yönündə axtarışlar aparılır.
Məsələn, əvvəlki maşın tərcümə sistemləri qaydalara əsaslanan tərcümə sistemləri idisə, indikilər statistik maşın tərcümə sistemidir. Biz isə daha mükəmməl olan hibrid yanaşmadan istifadə etmək yönündə işləyirik. Məsələn, www.translate.az saytına daxil olmaqla rusca-azərbaycanca MT sistemini yoxlaya bilərsiniz. Bu sistem ilk hibrid tərcümə sistemidir və daha keyfiyyətli tərcümə almağa imkan verir.
Belə tərcümənin həyata keçirilə bilməsi üçün sırf insan tərəfindən tərcümə edilmiş mətnlərdən istifadə etməklə tərcümə modeli qurulduğundan, nisbətən daha keyfiyyətli, daha yüksək olur. Bunun üçün çox böyük paralel korpus lazımdır. Paralel korpus dedikdə cümlələrin bir dildə yazılışı və onların digər dildə tərcüməsi başa düşülür. Biz Azərbaycanda bütün tərcümə mərkəzlərini, İnternetdəki kontenti yığaraq bir milyona yaxın cümlədən ibarət paralel korpus yaratmışıq. Bu cümlələrin Azərbaycan dilində olan variantının ingilis dilində tərcüməsi vardır. Bundan artıq toplaya bilməmişik. Məsələn, türk dilində təxminən 4 milyon cümlə toplaya bildik. Halbuki belə sistemlərin normal işləməsi üçün 20-30 milyona yaxın cümlə lazımdır ki, edilən tərcümə daha keyfiyyətli alınsın. Nümunə üçün ingilis-fransız, fransız-ingilis maşın tərcümələrini göstərmək olar. Həm fransız, həm ingilis dilində informasiya çox olduğu üçün www.google.com portalında kifayət qədər keyfiyyətli maşın tərcüməsi alınır. Yəqin ki, yaxın gələcəkdə daha yaxşı nəticələr olacaqdır.
Azərbaycan dili üçün nitqin tanınması sistemi barədə məlumat verən Ə.Fətullayev bildirmişdir ki, bu sistem mətni kompyuterə mikrofon vasitəsilə daxil etməyə imkan verir. Klaviaturada yığmaq əvəzinə, mətn mikrofona imla şəklində deyilir və sistem vasitəsilə avtomatik yazıya çevrilir. Bu proqram klaviaturada yığmağa nisbətən mətni kompyuterə 3-4 dəfə artıq sürətlə daxil etməyə imkan verməklə yanaşı, klaviatura ilə işləməkdə çətinlik çəkən insanların, həmçinin əlil və görmə qüsuru olan istifadəçilərin işini asanlaşdırır. Hazırda sistem 160 mindən çox söz-forma tanıya bilir və tanıma keyfiyyəti 91 faizdən yuxarıdır. Sistemin keyfiyyətinin daha da artırılaraq yaxın aylarda istifadəyə verilməsi planlaşdırılır.
Layihə çərçivəsində mətni insan səsi ilə “oxuyan” mətnin səsləndirilməsi sisteminin hazırlandığını deyən Ə.Fətullayev qeyd etmişdir ki, bu proqram vasitəsilə istifadəçilər Azərbaycan dilindəki mətni proqrama daxil edərək onun oxunuşuna qulaq asa bilərlər. Eyni zamanda proqram vasitəsilə məktublar, sənədlər və digər mətnlərlə daha az vaxt sərf etməklə və gözləri yormadan - oxunuşuna qulaq asmaqla tanış olmaq mümkündür. Sistem hazırda http:www.dilmanc.az saytında istifadəyə verilmişdir və istifadəçilər arasında çox populyardır.
Azərbaycanda ilk dəfə 2600-dən çox insanın səsini toplayaraq 40 saata yaxın nitq korpusu yaratmışıq. Nitq korpusu olmasaydı nitqin tanınması sistemi alınmazdı. Hazırladığımız səs sintetikdir. Hərflərin səslənməsindən bir sözü, sonra da cümləni qururuq. Hiss olunur ki, bu, süni səsdir. Çalışırıq ki, bunu təbii səsə yaxınlaşdıraq. Müəyyən nailiyyətlərimiz vardır.
Bu proqram Rabitə və İnformasiya Texnologiyaları Nazirliyinin dəstəyi ilə yaradılacaq telefon-tərcüməçi sisteminin tərkib hissələrindən biridir. Telefon-tərcüməçi sistemi ilə telefon danışığının bir dildən başqa dilə avtomatik tərcüməsi həyata keçiriləcək və beləliklə, əcnəbilərlə telefonda danışmaq çox asan olacaq.
Ə. Fətullayev bildirmişdir ki, bu il “Dilmanc” layihəsi çərçivəsində Azərbaycan dilindən ingilis və rus dillərinə və əksinə onlayn lüğətlər də istifadəyə verilmişdir. Adi lüğətlərdən fərqli olaraq, bu lüğətlərə sözün ixtiyari formasını daxil etmək mümkündür, bu zaman sözün kökü avtomatik tapılır. Bu imkan xüsusilə xarici dili bilməyən və sözün kökünü tapmaqda çətinlik çəkən istifadəçilər üçün əhəmiyyətlidir. Bundan başqa, lüğətdə sözün işləndiyi nümunə cümlələr və onların tərcümələrinə də baxmaq mümkündür. Lüğəti http://dict.dilmanc.az ünvanında istifadə etmək mümkündür.
Ə. Fətullayev Rabitə və İnformasiya Texnologiyaları Nazirliyi ilə Heydər Əliyev Fondunun dəstəyi və sifarişi əsasında Azərbaycanın “NeyroTex” şirkəti tərəfindən gözdən əlil və görmə qabiliyyəti zəif olan insanlar üçün dünyada ilk dəfə olaraq səslə idarə edilən mini kompyuterin hazırlandığını bildirmişdir. Yeni mini kompyuteri yaratmaqda məqsəd gözdən əlil və görmə qabiliyyəti zəif olan insanlara informasiya-kommunikasiya texnologiyalarından bərabərhüquqlu istifadəni təmin etməkdir. Yeni qurğu digərlərindən monitorun və klaviaturanın olmaması və bütün əmrlərin mikrofon vasitəsilə idarə olunması ilə fərqlənir. Kompyuterdə proqram təminatı və bütün əmrlər Azərbaycan dilindədir.
Bu sahədə əldə olunan digər nailiyyətlər barədə məlumat verən Ə.Fətullayev bildirmişdir ki, hazırda sinxron tərcümə sistemi hazırlanır. Xarici dil bilməyən azərbaycanca çıxış edəcək və bu sistem vasitəsilə danışıq ingilis və ya rus dillərindən birinə çevriləcəkdir.
“Dilmanc” layihəsi çərçivəsində "Azərbaycan dilinin tezlik lüğəti" hazırlanmışdır. Təqdim olunan tezlik lüğətinin tərtibi üçün Azərbaycan dilinin bütün üslubları təmsil olunmaqla təxminən 50 milyondan yuxarı söz-formadan ibarət mətn korpusu linqvostatistik təhlilə cəlb olunmuşdur. Bu lüğət 3 cilddən ibarət olacaq. Lüğətin 1-ci cildi artıq çapdan çıxmışdır, hazırda digər iki cild üzərində iş aparılır.
Azərbaycan dili üçün milli axtarış sistemi yaratmaq haqqında da düşünürük. İnformasiya axtaranda Google, Yandex və digər oxşar axtarış maşınlarından istifadə edilir. Biz elə axtarış sistemi yaratmaq istəyirik ki, Azərbaycan dilində verilmiş axtarış kriteriyasını türk, ingilis, rus dilli kontentində də axtararaq alınmış nəticələri azərbaycanca vermək imkanına malik olsun. Azərbaycanca verilən cümlə həm türk, həm ingilis, həm də rus dilində axtarılsın, məlumat toplansın və ana dilimizə tərcümə olunsun.
Ə.Fətullayev bildirmişdir ki, layihənin digər əhəmiyyətli cəhəti də linqvistik texnologiyaların yaradılması sahəsində yeni nəsil milli kadrların hazırlanmasıdır. Layihə qrupu üzvlərinin bəziləri bu sahədə tədqiqatlarının nəticələrini elmi jurnallarda çap etdirmiş və hətta bir çoxları dissertasiya müdafiə etmişlər və bu proses davam edir.
Aparılmış tədqiqatların nəticəsində layihə qrupu bir sıra elmi nailiyyətlərə imza atmış, bu nailiyyətlər beynəlxalq elmi konfranslarda (Almaniya, Fransa, İsveç, Polşa, Çexiya və s.) təqdim edilmiş və nüfuzlu elmi jurnallarda dərc olunmuş, patentlər alınmışdır.
Layihə çərçivəsində yaradılmış texnologiyalar bir çox beynəlxalq sərgilərdə - TelecomWorld (Cenevrə, Dubay), CeBİT (Hannover, İstanbul), Nato konfransı (Batumi), «Svəzğ-Gkspokomm» (Moskva) və s. uğurla təqdim edilmişdir.
“Dilmanc” layihəsi çərçivəsində aparılan elmi tədqiqat işləri və onların nəticələri haqqında beynəlxalq elmi tədbirlərdə məruzələr edilmiş, yeni yaradılmış üsullara görə iki patent alınmışdır.
Məlum olduğu kimi, İnternet əsrində-millətlərin inteqrasiyası dövründə beynəlxalq əlaqələr zərurətindən dillərarası qarşılıqlı tərcümə problemi getdikcə daha da aktuallaşır. “Dilmanc” layihə qrupu üzvləri əldə edilən nailiyyətlərlə kifayətlənmir, öz səylərini daha da artırmağa çalışırlar. Bu çox vacib fəaliyyətlərində onlara uğurlar arzulayırıq.
Xatirə CƏFƏROVA
AzərTAc-ın müxbiri
Ədəbiyyat qəzeti.- 2012.- 7
dekabr.- S.7.