‘සුබස’ සයිබර් අවකාශයේ අපේ සම්මත බසයි

‘සුබස’ සයිබර් අවකාශයේ අපේ සම්මත බසයි

කොළඹ විශ්වවිද්‍යාලයේ ආචාර්ය රුවන් වීරසිංහ

සිංහල බසින් පරිගණකය භාවිතා කිරීමේ දී ඇතිවන වියරණ දොස් නිරාකරණය, අක්ෂර වින්‍යාසය වැනි අවශ්‍ය බොහෝ පහසුකම් මෙම ‘සුබස’ (www.subasa.lk)වෙබ් අඩවිය මඟින් ලබා දෙයි.

කොළඹ විශ්වවිද්‍යාලීය පරිගණක අධ්‍යයනායතනයෙහි භාෂා තාක්ෂණ පර්යේෂණාගාරය විසින් මෙම වෙබ් අඩවිය නිර්මාණය කර ඇත. එම පර්යේෂණ කණ්ඩායමෙහි නියමුවා ලෙස කටයුතු කරන කොළඹ විශ්වවිද්‍යාලයේ ආචාර්ය රුවන් වීරසිංහ මහතා සමඟ සුබස වෙබ් අඩවිය සම්බන්ධව කළ සාකච්ඡාවකි මේ.

අන්තර්ජාලය තුළ සිංහල භාෂාව ඉහළින් තැබීම සඳහා ඔබ ඇතුළු කණ්ඩායමට කවරෙකුගෙන් හෝ සහයෝගය ලැබුණා ද, ඒ පිළිබඳව කතා කළොත්?

මේ සඳහා අරමුදල් රජයෙන් ලබාදී නැහැ. අපි සරදියල් රොල් එකෙන් තමයි මේ සුබස වෙබ් අඩවිය ක්‍රියාත්මක කර ගෙන යන්නේ.

සිංහල යුනිකේත ක්‍රමයෙන් සිංහල වචනයක් ගූගල් වල සෙවීමක් කළහොත් ඒ පිළිබඳව ලැබෙන හිට්ස් ගණන දැන් ලක්ෂය පවා ඉක්මවා තිබෙනවා. එයින් යුනිකේත ක්‍රමය ප්‍රචලිත කිරීම පෙනෙන්නට තිබෙනවා.

මේ ක්‍රමයට අපි යොමු වුණේ 2004දී වෙනම මූල්‍ය ආධාර ලැබුණ නිසයි. 2004දී භාෂා තාක්ෂණ පර්යේෂණගාරයක් අපි පිහිටවනු ලැබුවා. ඊට පෙර අපි මේ සඳහා තනි තනිවයි ක්‍රියා කළේ. මේ පර්යේෂණගාරය තුළින් ව්‍යාපෘති කීපයක්ම ඉදිරියට ඇවිත් තිබෙනවා.

එහිදී අප විශේෂයෙන් සිදු කළේ යුනිකේත ක්‍රමයට සිංහල භාෂාව සඳහා මෙවලම් නිර්මාණ කිරීමයි. එහි ප්‍රතිඵලයක් විද­ිහට තමයි ‘සුබස’ වෙබ් අඩවිය නිර්මාණය වුණේ.

මෙරට සිංහල ගුරු කුල කිහිපයක් තිබෙනවා. මේ සුබස වෙබ් අඩවිය නිර්මාණ කිරීමේ දී ඔබ අනුගමනය කර තිබෙන්නේ මොන ගුරු කුලය ද?

අපි මේ සිංහල වාග් සංහිතාව නිර්මාණය කරන්න මාර්ටින් වික්‍රමසිංහ, කේ. ජයතිලක වැනි ලේඛකයින්ගේ ලේඛන වගේම පුවත්පත් ලිපි, ශාස්ත්‍රීය ලිපි ආදී ලේඛන එකතු කළා. අන්තිමට අපිට පුළුවන් වුණා වචන මිලියන 10ක වාග් සංහිතාවක් නිර්මාණය කරන්න.

පරිගණකය මගින් භාෂාව සම්බන්ධව සිදු කරන පර්යේෂණවලදි මේ වාග් සංහිතාව තමයි අපි සිංහල භාෂාව විදියට සලකන්නෙ.මේක භාවිත කරලා බොහෝ පර්යේෂණ කරන්න පුළුවන්. විශේෂයෙන්ම සුබස වෙබ් අඩවිය හරහා අපි ලබා දෙන අකුරු විනිස පිරික්සුව ගැන මෙතනදි සඳහන් කරන්න ඕන. මොකද එම අකුරු විනිස පිරික්සුව නිර්මාණය වෙන්නෙත් මේ කියන වාග් සංහිතාව උපයෝගී කර ගෙන. එතනදි අපි මුලින්ම සිංහල අකුරු යෙදීමේ සම්භාවිතාව පිළිබඳ පරීක්ෂණ කළා.

උදාහරණ විදියට ‘ක’ අකුරට පස්සෙ ළඟින්ම එන්න පුළුවන් අකුරු මොනවද කියලා හිතුවොත් ‘ර,ළ’ වගේ අකුරු යෙදීමේ සම්භාවිතාව ‘ඤ,ෆ’ අකුරුවලට සාපේක්ෂව ඉතා ඉහළ අගයක් ගන්න පුළුවන්. මොකද කර සහ කළ කියන ඒකක භාෂාවේ සුලබව යෙදෙන නිසා. ඒත් ‘කඤ’ හෝ ‘කෆ ’ වැනි ඒකක දකින්න ඉතා අසීරුයි.

ඒ විදියට අපි සිංහල භාෂාවේ අකුරු දෙකක් සහ අකුරු තුනක් යෙදීමේ සම්භාවිතාව සලකා එයින් ලබා ගත් අගයන් ඔස්සේ තමයි අක්ෂර වින්‍යාසය පරීක්ෂා කරන්නෙ. සිංහල ලියන අයට බහුලව වරදින්නෙ ණ-න, ළ-ල, ශ-ෂ-ස සහ අල්පප්‍රාණ මහප්‍රාණ අකුරු යෙදීමයි. ඒ නිසා අපි මේ අකුරු විනිස පිරික්සුව හරහා ඒ කියපු වෙනස්කම් සම්බන්ධයෙන් තමයි අවධානය යොමු කළේ.

සුබස වෙබ් අඩවිය දිනකට පිරික්සන ගණන කොපමණද? ඒ ජනතාවට සුබස වෙබ් අඩවියෙන් ලබා ගත හැකි දෑ මොනවාද?

දවසකට සුබස වෙබ් අඩවිය විශාල පිරිසක් භාවිතා කරනවා. සිංහල යතුරු පුවරුව නුහුරු අයට අපි ශබ්දිම ක්‍රමයට ටයිප් කරන්න යතුරු පුවරුවක් සකස් කරලා තිබෙනවා. ඒක බොහෝ පිරිසක් භාවිතා කරනවා. ඒ වගේම සුබස ඉඟිය ෆයර්ෆොක්ස් වෙබ් බ්‍රව්සරය සඳහා ඈඳිය හැකි ශබ්දකෝෂයක්. ඔබ නොදන්නා ඉංග්‍රීසි වචනයක් මත මවුස් පොයින්ටර් එක තිබ්බාම එහි සිංහල තේරුම බලා ගන්නත් කිසියම් සිංහල වචනයක ඉංග්‍රීසි තේරුම බලාගන්න අවශ්‍ය නම් ඒ මත මවුස් පොයින්ටර් එක තිබ්බාම එහි ඉංග්‍රීසි අදහස බලාගන්නත් ඒක උදව් වෙනවා.

මේ වෙබ් අඩවියට අලුතින්ම එකතු වුණු මෙවලම් දෙකක් තියෙනවා. ඒ ‘පෙළ කැටපත‘ සහ ‘ඉඟිවදන‘. ඒකෙන් ‘පෙළ කැටපත‘ කියන්නෙ සිංහල මුද්‍රිත අකුරු හඳුනා ගැනීමේ මෘදුකාංගයක්. පින්තූරයක් විදියට තියෙන යම් සිංහල ලේඛනයක් මේ මෙවලම මගින් ඉලෙක්ට්‍රොනික පෙළක් බවට පත් කර ගැනීමේ හැකියාව තිබෙනවා. ඒ වගේම ‘ඉඟිවදන‘ කියන්නෙ ඇන්ඩ්‍රොයිඩ් මෙහෙයුම් පද්ධතිය සඳහා නිර්මාණය කෙරුණු ස්වයං පෙළ පිරික්සුම් මෘදුකාංගයක්.

ඔබ ස්මාට් ෆෝන් එකක් හරි ටැබ්ලට් පරිගණකයක් හරි භාවිතා කරනවා නම් මේ මෙවලම ඉතා වටිනවා. යුනිකෝඩ් නොවන ෆොන්ට් භාවිතා කරලා යතුරු ලියනය කරලා තියෙන ලියවිලි යුනිකෝඩ් ක්‍රමයට පරිවර්තනය කර ගන්නත් මේ අඩවිය හරහා අපි පහසුකම් සපයා තියෙනවා.

මීට අමතරව අපි පැරණි පොත් එකතු කිරීමේ වැඩසටහනකුත් මෙම අඩවිය හරහා සපයා තිබෙනවා. සුබස පොත්ගුල විදියට නම් කරලා තිබෙන මෙම වැඩසටහනට දැනට අපි සම්භාව්‍ය ග්‍රන්ථ කිහිපයක් ඇතුළත් කරලා තියෙනවා. ඒ වැඩසටහනටත් ඔබට දායක වෙන්න පුළුවන්. දැනට ඔබ ළඟ සම්භාව්‍ය සාහිත්‍ය කෘතියක ඉලෙක්ට්‍රොනික පිටපතක් තිබෙනවා නම් එය [email protected] යන ඉ-තැපැල් ලිපිනය හරහා අප වෙත ලබා දුන්නොත් අපට පුළුවනි මෙයට ඇතුළත් කරන්න.

සිංහල භාෂව සයිබර් අවකාශයට ගෙන ගිය ඔබ ඇතුළු කණ්ඩායම දැනට කරගෙන යන අලුත් සොයා ගැනීම් පිළිබඳ කතා කළොත්?

දැනට සිදු කෙරෙන පර්යේෂණවලින් සිංහල කථනය හඳුනා ගැනීමේ පර්යේෂණය සහ සිංහල-දෙමළ භාෂා සඳහා භාෂා පරිවර්තන මෙවලමක් නිර්මාණය කිරීම සඳහා සිදු කෙරෙන පර්යේෂණය ඉතා වැදගත්.

සිංහලෙන් දෙමළට, දෙමළෙන් සිංහලට පරිවර්තකයෝ නැහැ. එම පරිවර්ථක මෙවලම ටිකක් සංකිර්ණයි. එහි පළමු අදියර මේ වසරේ දෙසැම්බර් මාසයේදී එළි දැක්වීමට බලාපොරොත්තු වෙනවා. අලුත් පරිවර්තක පරපුර පරිගණකය භාවිතා කරයි කියා අප විශ්වාස කරනවා. ඒ නිසා අපි පරිවර්තක මතකයන් ඇති මෙවලමක් නිර්මාණය කිරීමටත් අපි කටයුතු කරමින් සිටිනවා.

මේ වසරේ දෙසැම්බරු මාසයේදී අපි ඉදිරිපත් කරන පරිවර්තකය සතුව තිබෙන්නේ වාක්‍ය පනස් දහසක් පමණයි. ඒ නිසා එහි අඩුපාඩු තිබෙන්නට පුළුවන්. අපගේ සේවාව සම්බන්ධයෙන් අදහස් දැක්වීමට, ගැටලු ඇත්නම් විමසා දැන ගැනීමට වගේම අපේ පර්යේෂණවලට සහයෝගය දීමට කැමතිනම් ඔබට පුළුවන් අපිත් සමග සම්බන්ධ වෙන්න.

ලිපිනය:
භාෂා තාක්ෂණ පර්යේෂණාගාරය, කොළඹ විශ්වවිද්‍යාලයීය පරිගණක අධ්‍යයන ආයතනය, නො: 35, රීඩ් මාවත, කොළඹ 07.
ඉ-තැපැල් ලිපිනය: -[email protected]
දුරකථන අංකය: -0112158962

.

කර්තෘට ලියන්න | මුද්‍රණය සඳහා