Search
Kanini Thamizh 09

கணினி ஆய்வில் தமிழ் – 09

கணினி ஆய்வில் தமிழ் – 08

கடந்த சில வாரங்களாக ஒரு தேடு பொறியின் செயல்பாட்டினைப் பற்றிப் பார்த்தோம். இந்த வாரம் நம் பண்டைய இலக்கண நூலான, நன்னூல் மற்றும் சமஸ்கிருத நூல்களான நியாயா, மீமாம்சா போன்ற நூல்கள் எப்படி நேட்சுரல் லாங்குவேஜ் ப்ராசசிங் ஆய்வுகளிற்கு பயன் படுத்தப்பட்டுள்ளன என்பதை பற்றிப் பார்ப்போம்.

கடந்த எட்டு வாரங்களாக நாம் பார்த்த நேட்சுரல் லாங்குவேஜ் ப்ராசசிங் செயல்முறைகள் யாவும் மேற்கத்திய செயல்முறைகள் ஆகும். நமது இந்திய பாரம்பரியத்தில் வந்த இலக்கண நூலான நன்னூல் பல அறிய கருத்துகளை உள்ளடக்கியுள்ளது. உதாரணத்திற்கு அர்கியூமேன்டேட்டிவ் அனாலிசிஸ் (Argumentative Analysis) என்று ஒரு துறை நேட்சுரல் லாங்குவேஜ் ப்ராசசிங்கில் உண்டு. அதாவது இரண்டு கணினிகள் தானாகவே மனிதர்களைப் போல் உரையாட வைத்தலுக்கு அர்கியூமேன்டேட்டிவ்  அனாலிசிஸ் சமமாகும். இவ்வாய்வில் ஆராய்ச்சியாளர்கள், நன்னூலில் கூறப்பட்டுள்ள.. ஒரு நூலின் பத்து அழகு மற்றும் பத்து குற்றம் போன்றவற்றை உரையாடலின் விதிகளில் பயன்படுத்தி வெற்றியும் கண்டுள்ளனர். இது மட்டுமல்லாமல் நன்னூலை மையமாகக் கொண்டு, “இ- லேர்னிங்” (E- learning) ஆய்வுகளும் மேற்கொள்ளப்பட்டு வெற்றியும் அடைந்துள்ளது.

நியாயா மற்றும் மீமாம்சா போன்ற நூல்கள் வேதங்களின் கிளை நூல்கள் ஆகும். இந்நூல்கள் முழுக்க முழுக்க லாஜிக் (logic) பற்றியது ஆகும். நேட்சுரல் லாங்குவேஜ் பிராசசிங்கிற்கு தேவையான பல கருத்துகள் இந்நூல்களில் உள்ளன. உதாரணத்திற்கு, நேட்சுரல் லாங்குவேஜ் ப்ராசசிங்கில் பல தகவல்களை முன்னரே நாம் சேகரித்து வைத்தல் வேண்டும். இத்தகவல்கள் ஒரு டிக்ஷ்னரி (dictionary) மூலமாகவோ, வெர்ட்நெட் (wordnet) மூலமாகவோ, ஆன்டாலஜி (ontology) மூலமாகவோ இருக்கலாம். இவைப் பற்றி நாம் அடுத்த வாரம் விரிவாகப் பார்ப்போம். இப்போதைக்கு ஒரு சிறிய எடுத்துக்காட்டுடன் சுருக்கமாக விளக்குகிறேன். ஒரு தேடு பொறியில், “கணபதி” என்று நாம் வினா கொடுக்கிறோம் என்று வைத்துக் கொள்வோம். நமக்கு அதனுடன் “பிள்ளையார்” பற்றிய செய்திகளும் வர வேண்டுமெனில் முன்னரே இத்தகவலை நாம் கணினியில் சேமித்து வைத்திருக்க வேண்டும். இதை வெர்ட்நெட் மூலமாக செய்யலாம். இன்னும் சுருக்கமாக சொல்ல வேண்டுமெனில் இவை யாவும் ஒரு வகையான டேட்டா பெசிற்கு (data base) ஒப்பாகும். இம்மாதிரியான டேட்டா பேசை உருவாக்க வேண்டிய உத்திகள் நியாயாவில் கூறப்பட்டுள்ளன. அதாவது உலகில் உள்ள அனைத்து ஜீவராசிகள் மற்றும் பொருட்களை எவ்வகையில் வகைப்படுத்த வேண்டும் என்று நியாயாவில் உள்ளது. இவ்வாய்வும் வெற்றிப் பெற்றுள்ளது. மீமாம்சாவில் ஒரு ஹோமம் எப்படி செய்யவேண்டும், கடவுளை எப்படி வணங்க வேண்டும் போன்ற செய்திகளை நாம் நேட்சுரல் லாங்குவேஜ் ப்ராசசிங்கிற்கு நிச்சயமாக உபயோகிக்க முடியும். ஏனெனில் நம் முன்னோர்கள் பல அறிவியல் செய்திகளை மதம் சம்பந்தப்பட்ட நூல்கள் மூலமாகவே கூறியுள்ளனர். பைபிளில் கூட பல அறிய அறிவியல் செய்திகள் உண்டென்று கேள்விப்பட்டுள்ளேன்.

நன்னூல், நியாயா மற்றும் மீமாம்சா நூல்கள் பற்றிய கருத்துகள் இன்னும் பல உள்ளன. ஆனால் அவ்வாய்வுகளை இன்னும் கான்பிரன்ஸ்/ ஜர்னலில் (conference/ journal) வெளியிடாததால் என்னால் விரிவாக கூற முடியவில்லை. ஆய்வுகளை சமர்ப்பித்த பின்னர் மீண்டும் இதுதமிழ் மூலமாக தகவல்களை பகிர்கிறேன்.

அடுத்த வாரம்.. நேட்சுரல் லாங்குவேஜ் ப்ராசசிங்கில் என்ன என்ன தகவல்கள் சேமித்து வைக்க முன்னரே தேவை என்பன போன்ற செய்திகளை பார்ப்போம்.

வாழ்க தமிழ்! வளர்க தமிழ்!!

கணினி ஆய்வில் தமிழ் – 10

– சுபலலிதா




Leave a Reply