- அண்மையில் சென்னையில் நடந்துமுடிந்த கணித்தமிழ் 24 மாநாட்டில், பேராசிரியர் வாசு அரங்கநாதன் செயல்விளக்கத்துடன் முன்வைத்த ‘தமிழ் ரோபாட்’ என்ற ஆய்வுரை பலரின் கவனத்தை ஈர்த்திருக்கிறது. மயிலாடுதுறையைச் சேர்ந்த இவர், அமெரிக்காவில் உள்ள பென்சில்வேனியா பல்கலைக்கழகத்தின் தெற்காசிய ஆய்வுப் பிரிவில் பணிபுரிகிறார். தமிழையும் கணினியையும் ஒருங்கிணைத்து ஆய்வு செய்வதிலும் தமிழ் கற்பிப்பதிலும் 1996இலிருந்து ஈடுபட்டுவருகிறார். வாசு அரங்கநாதனுடன் உரையாடியதிலிருந்து...
கணினியைத் தமிழ் பேசச் செய்தல் - உங்களது இந்த முயற்சி என்னென்ன பணிகளை உள்ளடக்கியது
- தமிழ் இலக்கியங்களை மக்களுக்குக் கொண்டுபோய்ச் சேர்த்தல், இணையதளம் வழியே தமிழ் கற்பித்தல் ஆகியவைதான் அடிப்படை நோக்கங்கள். நிரல் (புரோகிராம்) மூலம் எழுத்து வடிவத்தைப் பேச்சு வடிவமாக மாற்றுதல், பேச்சு வடிவத்தை எழுத்து வடிவமாக மாற்றுதல், ஒற்றுப்பிழைகளைத் திருத்துதல், தமிழ் மொழியிலான கட்டளைகளைக் கணினியைப் புரிந்துகொள்ளச் செய்து, அதை ரோபாட் போலப் பயன்படுத்துதல் ஆகிய பணிகளும் இதில் அடங்கும்.
தொழில்நுட்ப நோக்கில் இது எப்படிச் சாத்தியமாகிறது
- சிங்கிள் போர்டு (ஒற்றை மின்சுற்றுப் பலகை) கணினி வகையைச் சேர்ந்த ராஸ்பெரிஃபைல் என்கிற கார்டு மூலம் மேற்கண்ட பணிகளைச் செய்கிறேன். இது அவ்வளவாகப் பயன்படுத்தப்படாத ஒரு தொழில்நுட்ப வாய்ப்பு. இதை வைத்து, அனைத்துப் பணிகளையும் செய்யக்கூடிய ‘தமிழ் ரோபாட்’டை உருவாக்கியுள்ளேன்.
- இது சங்க இலக்கியச் செய்யுள்களை உரக்கக் கூறும்; நாம் ஒரு வரியைக் கூற, அது அடுத்த வரியைக் கூறும்; ஒரு சொல்லைப் பகுதி விகுதியாகப் பிரித்துக் கூறும். தமிழ் இலக்கணம் கற்றுத்தரும்; மயிலாடுதுறை எங்கே இருக்கிறது என்று கேட்டால் பதில் கூறும்; நமது செய்தியை ஓரிடத்திலிருந்து இன்னொரு இடத்துக்குக் கொண்டுபோய்ச் சேர்க்கும். உதாரணமாக, ‘இளங்கோ காபி கேட்கிறார்’ என்று சமையலறைக்குச் சென்று தெரிவிக்கும்.
- ஒரு கணினி, ஒலி ஏற்பி, ஒலிபெருக்கி, வைஃபை வசதி, கூகுளில் உள்ள சில கருவிகள் ஆகியவை இருந்தால் போதும். தமிழ் ரோபாட்டை உருவாக்கிவிடலாம். கூகுள் தளத்தில் உள்ள பல வசதிகளை இதற்காக நான் பயன்படுத்துகிறேன். இப்பணிகளுக்காகவே robot.tamilnlp.com என்ற இணையதளத்தை உருவாக்கினேன். இதில்வழங்கப்பட்டுள்ள சேவைகளை இலவசமாகவே பெற முடியும்.
ஒலிவடிவ நூல்களைக் கேட்போர் எண்ணிக்கை அதிகரித்துள்ளது. உங்களது ஆராய்ச்சி, அந்தத் துறையில் மாற்றம் ஏற்படுத்துமா
- ‘தமிழில் எழுதவும் படிக்கவும் தெரியாது; ஆனால், ஒலி நூல் வடிவத்தில் தமிழ் இலக்கியம் அறிந்துகொள்ளவும் தமிழ் கற்கவும் விரும்புகிறேன்’ என்று சொல்பவர்களைக் கருத்தில் கொண்டுதான் இப்பணிகளைச் செய்துள்ளேன்.
- அன்றாட வாழ்க்கையில் தேவைப்படும் பல வகையான உரையாடல்கள் காணொளிகளாக எனது இணையதளத்தில் தொகுக்கப்பட்டுள்ளது ஓர் உதாரணம். ஆராய்ச்சிகள் மூலம் எதிர்காலத்தில் ஒலிவடிவ நூல்கள் பன்மடங்கு மேம்படும்.
- தமிழ் மொழியியலுக்கான கணக்கீட்டு அணுகுமுறையில் (Computational approaches to Tamil linguistics) தொடர்ந்துஈடுபடுகிறீர்கள். இதை விளக்க இயலுமா? - கணினியிடம் என்ன கேள்வி கேட்டாலும் நுண்ணறிவுடன் பதில் கூற அதைத் தயார் செய்வது, நேச்சுரல் லாங்வேஜ் பிராசஸிங் (என்எல்பி) எனப்படும். இதன் மூலம் மொழி பயன்பாடு சார்ந்து பல வகையான பணிகளைச் செய்ய முடியும்.
- தமிழ் மொழியியலுக்கான கணக்கீட்டு அணுகுமுறை என்பது என்எல்பி-யின் ஓர் உட்பிரிவு. ஒரு சொல்லை - பகுதி, இடைநிலை, விகுதியாகப் பகுத்துக் கூறும் திறனைக் கணினிக்கு ஏற்படுத்துவது போன்ற வேலைகள் இதன் மூலம் சாத்தியமாகின்றன. இதற்கென நாம் நிரல்கள் எழுத வேண்டும்.
- ஒரே பொருள் சங்க காலம், இடைக்காலம், தற்காலம் ஆகிய மூன்றிலும் வெவ்வேறு சொற்களால் குறிக்கப்படுகிறது. சொற்கள் காலப்போக்கில் மாற்றம் அடைகின்றன. ‘ஆகும்’ என்பது ‘ஆம்’ எனச் சுருங்கியது. தற்போது ‘ஆமாம்’ (ஆம் ஆம்) என்று வழங்கப்படுகிறது. இதுகுறித்த புரிதலை எல்லாம் கணக்கீட்டு அணுகுமுறை மூலம் ஏற்படுத்த முடியும்.
மக்கள், தமிழ் கற்பதிலும் பயன்படுத்துவதிலும் எந்தளவுக்கு ஈடுபாடு கொள்கின்றனர்
- முழு நேரப் பணியாகவும் தன்னார்வலர் என்கிற முறையிலும் அயலகத் தமிழர் பலருக்குத் தமிழ் கற்பித்துவருகிறேன். அவர்களது ஈடுபாடு, நாம் நம்பிக்கை கொள்ளும்விதத்தில் உள்ளது. பயில்வோர் தொடக்க நிலை, இடைநிலை, முதுநிலை ஆகிய மூன்று பிரிவுகளிலும் உள்ளனர்.
- பிரான்ஸ் அருகில் உள்ள கூடலூப் என்கிற தீவில் உள்ள மக்களுக்குத் தமிழ் கற்பிக்கச் சென்றேன். அவர்கள் 1800களில் புதுச்சேரியிலிருந்து அங்குள்ள கரும்புத் தோட்டங்களில் வேலை பார்க்க அழைத்துச் செல்லப்பட்டவர்களின் சந்ததியினர். அவர்கள் தமிழில் பெயர் சூட்டிக்கொள்கின்றனர். மாரியம்மன், மதுரை வீரன் போன்றோரை வழிபடுகின்றனர். ஆனால், தமிழ் பேசும் வழக்கம் காலப்போக்கில் நின்றுவிட்டது. தமிழ் மொழி பயில்வதற்கு அவர்கள் காட்டிய ஆர்வம் என்னை நெகிழ வைத்தது.
- உங்கள் பார்வையில் கணித்தமிழ்த் துறையில் உள்ள தடைகள் என்ன? - கணினிக்கு ஏதேனும் ஒரு மொழியில் மட்டுமே ஆணையிட முடியும். தமிழும் ஆங்கிலமும் கலந்த பேச்சுவழக்கு, அங்கு பயன்படாது. இரு மொழிச் சொல்லாடல்கள், இத்தகைய பணிகளில் குழப்பத்தை ஏற்படுத்துகின்றன. முதலில் நாம் ஆங்கிலச் சொற்கள் கலந்து பேசுவதைத் தவிர்க்க வேண்டும்.
- ரஷ்யர்கள், ஜப்பானியர்கள் போன்றோர் அவரவர் தாய்மொழியில் பேசும்போது பிறமொழிச் சொற்கள் கலக்காமல்தான் பேசுகின்றனர். இந்தியர்களிடையே மட்டுமே இப்பிரச்சினை உள்ளது. அதேபோல், மொழியை வளர்ப்பதில் அரசு ஆதரவு முக்கியம்.
- அயலகத் தமிழர், தமிழ் கற்கத் தமிழ்நாடு அரசு உதவுகிறது. கணித்தமிழ் மாநாடு போன்ற அரசின் பணிகள் தடையின்றித் தொடர வேண்டும். அரசுக்கும் தமிழ் அறிஞர்களுக்கும் இடையே ஒருங்கிணைப்பு தேவை. மொழியைப் பேணுவதில் எழுத்தாளர்கள், ஊடகங்கள் ஆகியோரின் பங்களிப்பும் அவசியம்.
நன்றி: இந்து தமிழ் திசை (16 – 02 – 2024)