Tuesday, December 27, 2011

So'zlarni kirill alifbosidan lotin alifbosiga o'tkazish

Ancha vaqtlardan buyon turli dasturlar tarjimasi bilan shug'ullanib kelayapman. Ba'zi vaqtlarda tarjima ishlaridan charchasam, o'zbek tilidagi so'zlar ro'yxatiga yangi so'zlarni qo'shayapman. Mashrab Quvatov tomonidan tuzilgan "uzbek wordlist"da 97000ta kirill alifbosidagi so'zlar mavjud. Bu degani "Libreoffice" va "Ubuntu"ning turli dasturlari faqat kirill alifbosidagi imlo xatolarini tekshiradi deganidir. Ushbu o'zbekcha so'zlar ro'yxati hali to'liq tugallangan emas, lekin anchagina imlo xatolarini tekshirishga yordam beradi. Buni o'zim bir necha marta ishlatib ko'rib guvohi bo'ldim. Agar ushbu bazada birorta so'z kiritilmagan bo'lsa, o'sha so'zni yozsangiz "xato" deb ko'rsatadi. Agar o'sha so'zni to'g'ri yozganligingizga ishonchingiz komil bo'lsa, "Libreoffice" dasturida sichqonchaning o'ng tugmasini bosib, u yerdan avval "Qo'shish" bandini tanlab, u yerdan "standart.dic" fayliga qo'shish mumkin. Men ko'pgina so'zlarni xuddi shu usulda "standart.dic" fayliga qo'shib ko'rdim. Hatto lotin alifbosidagi so'zlarni ham qo'shib ko'rdim. Natija esa yaxshi. Ya'ni lotin alifbosidagi so'zlarni alohida yuqorida, kirill alifbosidagi so'zlarni esa alohida alifbo tartibida saqlar ekan. "standart.dic" faylini esa /home/foydalanuvchi nomi/.libreoffice/3/user/wordbook/ ning ichidan topasiz ("foydalanuvchi nomi"ni o'zingizning hisobingizga o'zgaritirishingiz kerak).
Men lotin alifbosidagi so'zlarni ham "standart.dic"ga qo'sha boshladim, lekin bir necha kunda 1700 ta so'zni kiritishga muvaffaq bo'ldim. Oxiri o'ylab-o'ylab Mashrab Quvatov tuzgan cyr2lat skriptidan foydalanib ko'rmoqchi bo'ldim. Y'ani uz_UZ.dic faylini ichidagi so'zlarni lotin alifbosiga o'tkazmoqchi bo'ldim va buni quyidagicha amalga oshirdim. Avval, Mashrab Quvatov tomonidan tuzilgan cyr2lat skriptini  yuklab olasiz. Ushbu cyr2lat.py faylini home/foydalanuvchi nomi/ jildiga ko'chirasiz. So'ngra "Terminal"ni ishga tushirib, u yerga
chmod u+x /home/foydalanuvchi nomi/cyr2lat.py
deb yozasiz. So'ngra
./cyr2lat.py cry.txt lat.txt
shaklida kiritasiz. Bu yerdagi "cyr.txt"faylini o'rniga kirill alifbosidagi .txt formatdagi faylning nomi yoziladi. lat.txt faylini esa o'zi hosil qiladi. Men "uz_UZ" faylini quyidagicha lotinga aylantirdim.

akmal@akmal-Satellite-C655:~$ chmod u+x /home/akmal/cyr2lat.py
akmal@akmal-Satellite-C655:~$ ./cyr2lat.py uz_UZ.dic lat.txt


Hammasi yaxshi tugadi. Endi menda lotin alifbosidagi o'zbekcha so'zlar ro'yxati bor, lekin u "Libreoffice"da yaxshi ishlamadi.

No comments: