Мирбек Окенов: Эми Google Translate тутумуна кыргызча үн менен которуу кирет
Азыркы учурда кыргыз тилине которуу же кыргыз тилинен башка тилге которуу 100 пайыз туура иштейт деп Google Translate кепилдик бербейт. Мындан ары дайым фразалар менен толуктап турушубуз керек. 400 миң фразаны киргизсек которуу бир аз сапатка өтүп, туура которо баштайт. Ошондой эле үн менен сүйлөмдөрдү которууну киргизүү пландалууда. Мында айтылган үндү таанып, Google Translate ал сөздөрдөн кайсы тилге которуу керек болсо ошол тилге үн менен которуп берет. Болжолдуу бир жылдын ичинде бул долбоордун прототипин чыгарууну пландап жатабыз.
Кыргыз тили бүгүнтөн тарта Google Translate кызматына кошулду. Мамлекеттик тилди өнүктүрүү программасынын алкагында өкмөт бул долбоорду колдоого 1 миллиондон ашык каражат бөлгөн. Маалым болгондой, акыркы жылдары Чоробек Сааданбек баштаган бир катар демилгечилер, кыргыз тилин Google Translate кызматына кошуу үчүн аракеттерди көрүп келген. Жүздөгөн ыктыярчылардын жардамы менен эми кыргыз тили жаңы деңгээлге чыгып отурат. Бул долбоорду ишке ашыруу, андан ары өнүктүрүү милдеттин колго алган “Улут Soft” компаниясынын башкы директору Мирбек Океновду кепке тартык.
– Кыргыз тили Google Translate кызматына кошулду. Алгач куттуктай кетели. Бул иштин артында кандай эмгектер жатат? “Улут Soft” компаниясы кандай эмгек жумшадыңыздар, эмнелерди аткардыңыздар?
– Бүгүн түндөн баштап Кыргыз тили Google Translate кызматында иштеп баштады. Бул узак бир процесс болду. “Улут Soft” компаниясы Мамлекеттик тил комиссиясы жарыялаган тендерди утуп алып, 2014-жылдын декабрында бул долбоорго кошулдук. Бул процесс 2-3 жылдан бери уланып келе жаткан. Бизден мурунку фонддор, ыктыярчылар өздөрүнүн салымын кошуп, 1 миллионго жакын фразалар киргизилген. 1 миллион фразанын негизинде кыргыз тили Google Translate иштеп баштады. Биз бул тендерди утуп алгандан кийин Google компаниясы менен байланыштык. Алар жасалма интеллекттин алгоритими даяр эмес экенин билдирди. Биз мына ушул иш-аракеттин үстүндө иштештик. Жасалма интеллект бир гана фразанын болгонундай которуу эмес, тилдин структурасын түшүнгөн, өзүн-өзү жаңылай турчу система болгондуктан, фразаны киргизүү бул жасалма интеллектке тамак берүү гана болуп калат. Ошондой эле жасалма интеллект бир гана фразаны берүү эмес, википедия сыяктуу булактарды колдонуп, ал жактагы тилди түшүнүп, ошого карата түшүнүк жаратат. Азыркы учурда кыргыз тилине которуу же кыргыз тилинен башка тилге которуу 100 пайыз туура иштейт деп Google Translate кепилдик бербейт. Мындан ары дайым фразалар менен толуктап турушубуз керек. 400 миң фраза киргизүү иштери жүрөт. 400 миң фразаны киргизсек которуу бир аз жакшы сапатка өтүп, туура которо баштайт. Азыр узун жолдун биринчи кадамы башталды.
– Google Translate кызматы 100 пайыз туура которбойт деп айттыңыз. Канчалык деңгээлде туура которот деп айтууга болот?
– Бул системанын иштеп баштаганына бир канча саат гана болду. Азыр кайсы бир санды айтып, баа берүү оор. Учурда өзүбүз да кандай кемчиликтер болуп жатканын анализдеп жатабыз. Анткени структурасы оор, көп колдонулбаган же жаргондорду которо албай калышы ыктымал. Ага карата “Google Translate” сунуштарыбызды жөнөтөбүз.
– Бүгүнкү күндө жалпы канча фраза киргизилди? Кайсы тармак же кайсы нерселер которула элек?
– Мекемелер тараптан берилген маалыматтар боюнча 1 миллионго жакын фраза киргизилген. Ал эми тармакка бөлүнбөйт, тилдин ичиндеги бардык структураларды камтыган бир система. Фразадарды киргизүүдө чек жок. Анткени тил өнүккөн сайын, жаңы фразалар пайда болот.
– Ар бир долбоордун баштоодо чоң финансылык колдоо болот. Бул тендерди жеңип алгандан соң сиздерге канча каражат бөлүндү? Ал каражатка конкреттүү эмнелер аткарылды?
– Биз утуп алган тендер 3млн. 800 миңди түзгөн. Бул 3 лоттон турат. Wikipedia сайтына макала киргизүү, мобилдик тиркеме жана Google Translate 400 миң фраза киргизүү аракеттери жүрүүдө. Мобилдик тиркеме боюнча бир прототип даяр болгону калды. План боюнча бул прототипти март айынын орто ченинде Мамлекеттик тил комиссиясына көрсөтүп, андан соң экинчи этап, мазмуну боюнча иштейбиз. Негизи биз менен 1 жылга келишим түзүлгөн. Ошол бир жыл аралыгында аткарчу иштер көп.
– Бул долбоордун демилгечиси Чоробек Сааданбеков кыргыз тилинин Google Translate кызматына кирүүсүнө бир кадам калды деп айткан болчу. Булардын жасалган эмегектери, которгон котормо иштерин сиздер колдондуңуздарбы же баштап аяк өзүңүздөр иштеп чыктыңыздарбы?
– Албетте булардын салымы бар. 1 млн. фраза которулуп, киргизилген деп “Биздин мурас” фонду айтып келет. Эми биз кошумча катары 400 миң фразаны киргизели деп жатабыз.
– Эми мындан кийинки кадамдар кандай болот, дагы кандай иштер аткарылат?
– Мамлекеттик тил комиссиясы менен бул долбоордун үстүндө иштеп жатканда биз тараптан сунуштар болгон. Ал сунуштардын бири Google Translate үн менен сүйлөмдөрдү которуу болуп саналат. Мында айтылган үндү таанып, Google Translate болгон сөздөрдөн кайсы тилге которуу керек болсо ошол тилге үн менен которуп бере турган система. Аудио файлды текстке айландыруучу программа болот. Азыр мунун үстүндө иштер жүрүп жатат. Болжолдуу бир жылдын ичинде бул долбоордун прототибин чыгарууну пландап жатабыз.
– Кыргыз тили Google Translate кызматына кошулду деп кубанып жатабыз. Бул Кыргызстандын имиджине кандай таасир тийгизет?
– Албетте оң таасирлер болот. Биринчиден өзүбүзгө таасири тийип жатат. Заманбап технологиялардан артта калбай, технологиялардын ичинде колдонулган тил катары сактап калуу максаты турат. Ошондуктан, кеңейип келе жаткан тилдердин астында кыргыз тили эзилип калбасын десек, баарыбыз чогуу иштесек. Баарыбыз күчтү бир жерге топтоп, ар ким билген тармагында иш алып барып, азыркы технологиялардын ичинде колдонулган тилге айланталы. Биз бирге иштешкенге даярбыз.
– Чоң рахмат. Маегиңизге ыраазычылык билдиребиз.
Гүлназ Мамытова, “Марал” ФМ, 18.02.2016-ж.