Shadow

Tag: சுபலலிதா

கணினி ஆய்வில் தமிழ் – 10

கணினி ஆய்வில் தமிழ் – 10

தொடர், தொழில்நுட்பம்
கணினி ஆய்வில் தமிழ் - 9இந்த வாரம் ஒரு நேட்சுரல் லாங்குவேஜ் ப்ராசசிங் சம்பந்தப்பட்ட ஒரு பயன்பாட்டினை உருவாக்க தேவையான டேட்டா என்ட்ரி வேலைகள் என்ன என்பதைப் பற்றிப் பார்ப்போம். உதாரணத்திற்கு ஒரு தேடு பொறியை உருவாக்க வேண்டுமெனில் அதற்கு தேவையான ஆவணங்கள்/ வலைத்தளங்களில் உள்ள வார்த்தைகளையும் அதன் பல்வேறு அர்த்தங்கள் மற்றும் அவ்வார்த்தையினோடு என்ன வார்த்தைகள் வரக்கூடும் என்பன போன்ற தகவல்களை நாம் டேட்டா பேசில் முன்னமே பதிவு செய்து வைத்தல் வேண்டும். இப்படி செய்யும் பொருட்டு அத்தேடு பொறி மிகுந்த அர்த்தமுள்ளதாகவும் பயனரின் தேவையை பூர்த்தி செய்யக் கூடியதாகவும் அமையும். நாம் முன்னரே பார்த்தது போல், "திருநெல்வேலி" என்று வினா கொடுத்தால் திருநெல்வேலி என்கிற வார்த்தை பெரும்பாலும் சேர்ந்து வரக்கூடிய வார்த்தைகளான "அல்வா", தாமிரபரணி" மற்றும் அங்குள்ள கல்லூரிகள், வழிப்பாட்டுத் தலங்கள் ஆகியவை இ...
கணினி ஆய்வில் தமிழ் – 09

கணினி ஆய்வில் தமிழ் – 09

தொடர், தொழில்நுட்பம்
கணினி ஆய்வில் தமிழ் - 08கடந்த சில வாரங்களாக ஒரு தேடு பொறியின் செயல்பாட்டினைப் பற்றிப் பார்த்தோம். இந்த வாரம் நம் பண்டைய இலக்கண நூலான, நன்னூல் மற்றும் சமஸ்கிருத நூல்களான நியாயா, மீமாம்சா போன்ற நூல்கள் எப்படி நேட்சுரல் லாங்குவேஜ் ப்ராசசிங் ஆய்வுகளிற்கு பயன் படுத்தப்பட்டுள்ளன என்பதை பற்றிப் பார்ப்போம்.கடந்த எட்டு வாரங்களாக நாம் பார்த்த நேட்சுரல் லாங்குவேஜ் ப்ராசசிங் செயல்முறைகள் யாவும் மேற்கத்திய செயல்முறைகள் ஆகும். நமது இந்திய பாரம்பரியத்தில் வந்த இலக்கண நூலான நன்னூல் பல அறிய கருத்துகளை உள்ளடக்கியுள்ளது. உதாரணத்திற்கு அர்கியூமேன்டேட்டிவ் அனாலிசிஸ் (Argumentative Analysis) என்று ஒரு துறை நேட்சுரல் லாங்குவேஜ் ப்ராசசிங்கில் உண்டு. அதாவது இரண்டு கணினிகள் தானாகவே மனிதர்களைப் போல் உரையாட வைத்தலுக்கு அர்கியூமேன்டேட்டிவ்  அனாலிசிஸ் சமமாகும். இவ்வாய்வில் ஆராய்ச்சியாளர்கள், ...
கணினி ஆய்வில் தமிழ் – 08

கணினி ஆய்வில் தமிழ் – 08

தொடர், தொழில்நுட்பம்
கணினி ஆய்வில் தமிழ் - 07 சென்ற வாரம் ஒரு தேடு பொறியில் ஆஃப்லைன் செயல்பாடுகளைப் பற்றிப் பார்த்தோம். இந்த வாரம் ஒரு தேடு பொறியில் பயனர் வினா (க்வெரி: query) கொடுத்தவுடன் அளிக்கப்படும் வலைப்பக்கங்கள் எவ்வாறு வரிசைப்படுத்தப் படுகின்றன என்பதை பற்றிப் பார்ப்போம்.உதாரணத்திற்கு "அண்ணா பல்கலைக்கழகம்" என்று வினாவைக் கொடுக்கிறோம் என்று வைத்துக் கொள்வோம். அண்ணா பல்கலைக்கழக வலைத்தளமான "www.annauniv.edu" முதலில் வரிசைப்படுத்தப்பட்டு இருக்க வேண்டும். அண்ணா பல்கலைக்கழகம் பற்றிய தகவல்களைக் கொண்ட பிற வலைத்தளங்கள் வரிசையில் பின்னர் வர வேண்டும்.வியாபார நோக்கம் இல்லாமல் செயல்படும் தேடு பொறிகள், பயனர் அளிக்கும் வினாவையும் டேட்டா பேசில் (data base) உள்ள வலைப் பக்கங்களையும் நன்கு ஆராய்ந்து, மேத்தமாட்டிக்கல் மாடல் (Mathematical model) மூலமாக ராங்கிங் அல்காரிதத்தை (Ranking alogorithm) வகுத்து செயல்படுகின்ற...
கணினி ஆய்வில் தமிழ் – 07

கணினி ஆய்வில் தமிழ் – 07

தொடர், தொழில்நுட்பம்
கணினி ஆய்வில் தமிழ் - 06சென்ற வாரம் தேடு பொறியில் உள்ள ஆஃப்லைன் செயல்பாடுகளான கிராலிங், இன்டெக்சிங், வினா விரிவாக்கம் குறித்துப் பார்த்தோம். இவ்வாரம் இன்னொரு ஆஃப்லைன் செயல்பாடான சர்ச்சிங் (தேடுதல்) குறித்துப் பார்ப்போம். சென்ற வாரம் உபயோகித்த அதே உதாரணத்தை எடுத்துக் கொள்வோம். அதாவது கீழே ஒரு தேடு பொறியில் இன்டெக்ஸ் செய்யப்பட்ட வார்த்தைகள், பயனர் கொடுக்கும் வினா மற்றும் வினா விரிவாக்க வார்த்தைகள் உதாரணத்திற்கு கொடுக்கப்பட்டுள்ளன.இன்டெக்ஸ் வார்த்தைகள்திருநெல்வேலி அல்வா தாமிரபரணி: -d1 ,d100,d890 திருநெல்வேலி அல்வா: -d5,d450,500,600 திருநெல்வேலி தாமிரபரணி: -d100,d800,4500 திருநெல்வேலி: -d1,...d4000 அல்வா: -d6,...d6000 தாமிரபரணி: -d3,...d5000வினா/க்வெரிதிருநெல்வேலிவினா விரிவாக்கம்திருநெல்வேலி அல்வா தாமிரபரணிஇப்பொழுது சர்ச்சிங் செயல்பாட்டில், ...
கணினி ஆய்வில் தமிழ் – 06

கணினி ஆய்வில் தமிழ் – 06

தொடர், தொழில்நுட்பம்
கணினி ஆய்வில் தமிழ் - 05சென்ற வாரம் தேடு பொறியின் ஆன்லைன் செயல்பாடுகளைப் பற்றி பார்த்தோம்.இவ்வாரம் ஆஃப்லைன் செயல்பாடுகள் பற்றி பார்ப்போம்.பின் வருவன ஆஃப்லைன் செயல்பாடுகள் ஆகும்.வலைத்தளங்களை கிரால் (Crawl) செய்தல் வேண்டும் .இதை செய்யும் நிரலிக்கு "கிராலர் (Crawler)" என்று பெயர்.கிரால் செய்யப்பட்ட வலைத்தளங்களின் உள்ள இமேஜ், எழுத்துமூலம் உள்ள செய்திகள் போன்றவற்றை பிரித்து ஒவ்வொன்றிற்கும் ஆவணங்கள் அடிப்படையில் ஐ.டிக்கள் (IDs) கொடுக்கப்படும். பின் வரும் செயல்பாடுகள் இந்த ஐ.டியை வைத்தே செயல்படும் . வலைத்தளங்களிலிருந்து பிரித்தெடுக்கப்பட்ட  இமேஜ்  மற்றும் செய்திகளில் உள்ள முக்கியமானவற்றை  இன்டெக்ஸ் செய்வார்கள். உதராணத்திற்கு "இந்தியா" என்கிற வார்த்தை அல்லது இமேஜ் d1,d4 d50,d1000 முதலிய வலைத்தளங்களில் / ஆவணங்களில் உள்ளது என குறித்து வைப்பார்கள் .  d1,d4... என...
கணினி ஆய்வில் தமிழ் – 05

கணினி ஆய்வில் தமிழ் – 05

தொடர், தொழில்நுட்பம்
கணினி ஆய்வில் தமிழ் - 04 சென்ற வாரம் அனஃபோரா அனாலிசிஸ் மற்றும் நேம்ட் என்டிட்டி ரெகக்னிஷன் (Anaphora Analysis and Named Entity Recognition) பற்றி பார்த்தோம். இந்த வாரம் கூகுள் போன்ற தேடு பொறிகள் எப்படி செயல்படுகின்றன என்பதைப் பற்றிப் பார்ப்போம்.ஒரு தேடு பொறியின் செயல்பாட்டினை இருவகையாக பிரிக்கலாம். அவை ஆன்லைன் மற்றும் ஆஃப்லைன் செயல்பாடுகள் ஆகும். முதலில் ஆன்லைன் பற்றி பார்ப்போம். ஏனெனில் பயனருக்கு ஓரளவிற்கு பரிச்சயமானது ஆன்லைன் செயல்பாடுகளே ஆகும். அவை பின்வருமாறு:* பயனர் கொடுக்கும் வினா (query) தேடு பொறியினுள் செலுத்தபடுகிறது.* அவ்வினா பல வினாக்களாக விரிவாக்கப்படுகிறது. இதனை க்வெரி எக்ஸ்பான்ஷன் (query expansion) என்பார்கள். ஒரு எடுத்துக்காட்டுடன் இதனை பார்ப்போம். தமிழில் கூகுளை நீங்கள் உபயோகித்திருபீர்கள். "முருகன் கோவில்" என்று நீங்கள் வினா கொடுத்தால், பழனி முருகன...
கணினி ஆய்வில் தமிழ் – 04

கணினி ஆய்வில் தமிழ் – 04

தொடர், தொழில்நுட்பம்
கணினி ஆய்வில் தமிழ் - 03சென்ற வாரம் மெஷின் ட்ரான்ஸ்லேஷன் பற்றி பார்த்தோம். இந்த வாரம் அனஃபோரா அனாலிசிஸ் (anaphora analysis) மற்றும் நேம்ட் என்டிட்டி ரெகக்னிஷன் (named entity recognition) பற்றி பார்ப்போம். முதலில் அனஃபோரா பற்றி பார்போம். அனஃபோரா அனாலிசிசை ப்ரோநெளன் ரெசல்யூஷன்  (pronoun resolution) என்றும் சொல்வார்கள். ஒரு எடுத்துக்காட்டுடன் இதனை பார்ப்போம்."சூரபத்மன் முருகனால் கொல்லப்பட்டான். அவன் மிகவும் கொடியவன்."இரண்டாம் வாக்கியத்தில் உள்ள "அவன்" என்கிற சொல் சூரபத்மனைத்தான் குறிக்கிறது என நாம் அறிவோம். கணினிக்கு அதை தெரிவிப்பது கடினம். அதாவது வாக்கியங்களில் வரும் ப்ரோனவுன் முந்தைய வாக்கியங்களில் உள்ள தகுந்த பெயர்ச் சொல்லை சரியாக கணினியால் எடுத்துக் கொள்ள வைப்பதை அனஃபோரா அனாலிசிஸ் (அ) ப்ரோநெளன் ரெசல்யூஷன் என்கிறோம். இதே போல் ப்ரோநெளன் பின்வரும் வாக்கியங்களில் உள்ள பெயர்...
கணினி ஆய்வில் தமிழ் – 03

கணினி ஆய்வில் தமிழ் – 03

தொடர், தொழில்நுட்பம்
கணினி ஆய்வில் தமிழ் - 02சென்ற கட்டுரையில் "மார்பாலஜிகல் அனாலிசிஸ்" பற்றி பார்த்தோம். 'நேட்சுரல் லாங்குவேஜ் ப்ராசெசிங்'கில் பெரும்பாலான ஆய்வுகளின் முதல் படி மார்பாலஜிகல் அனாலிசிஸ் ஆகவே இருக்கும். ஏனெனில் எழுத்துக்களின்/வார்த்தைகளின்  உருவ அமைப்பை பற்றி முழுமையாக அறிந்து விட்டால் அதை உபயோகப்படுத்துவதற்கான வழிகளை எளிதில் ஆராய முடியும். இக்கட்டுரையில் வாக்கிய அமைப்பை பற்றி பார்ப்போம். இது மார்பாலஜிகல் அனாலிசிஸிற்கு அடுத்த படி ஆகும். கூகுளில் உள்ள மொழிபெயர்ப்பு வசதியை நீங்கள் பார்த்திருப்பீர்கள். இதனை மெஷின் ட்ரான்ஸ்லேஷன் என்று கூறுவார்கள். அதாவது கணினிக்கு கொடுக்கப்பட்ட விதிகளின் அடிப்படையில் கணினியே மொழிபெயர்ப்பதால் மெஷின் ட்ரான்ஸ்லேஷன் என சொல்கிறோம். நேட்சுரல் லாங்குவேஜ் ப்ராசசிங் ஆய்வில் மிக கடினமான ஆய்வு மெஷின் ட்ரான்ஸ்லேஷன் தான். இத்துறையில் மிகப்பெரிய அளவில் ஆய்வுகள் நடந்துக் ...
கணினி ஆய்வில் தமிழ் – 02

கணினி ஆய்வில் தமிழ் – 02

தொடர், தொழில்நுட்பம்
கணினி ஆய்வில் தமிழ் - 01முந்தைய கட்டுரையில் தமிழ் மொழியை கணினியில் பயன்படுத்துவதில் உள்ள 'எழுத்துரு' பிரச்சனைகளை பார்த்தோம். ஒரு மொழியை எழுத்து வடிவத்திலோ ஒலி/ஒளி வடிவத்திலோ ஆராய்வதை "நேட்சுரல் லாங்குவேஜ் ப்ராசெசிங்" என்பார்கள். இதில் பல்வேறு வகையான ஆய்வுகள் அல்லது பயன்பாடுகள் இருக்கின்றன. அவை பின்வருமாறு..    * இன்ஃபர்மேஷன் ரெட்ரீவல் (கூகுள் தேடு பொறி)     * இன்ஃபர்மேஷன் எக்ச்டிராக்ஷன் (கூகுள் தேடு பொறியில் உள்ள இமேஜ் சர்ச் வசதி)     * மெஷின் ட்ரான்ஸ்லேஷன் (கூகுளில் உள்ள மொழிபெயர்ப்பு வசதி)     * ட்ரான்சிலரேஷன் (கூகுளில் உள்ள ஆங்கிலம் மூலம் தமிழ் தட்டச்சு செய்யும் முறை)தகவல்கள் சேகரித்தல், எடுத்தல், மொழிபெயர்த்தல், ஆங்கிலத்தில் தமிழை எழுதி தமிழ் சொற்கள் பெறுதல் என இவ்வாறு சொல்லிக்கொண்டே போகலாம். இம்முறைகளை பற்றி...
இப்போ பேசுங்க பாக்கலாம்

இப்போ பேசுங்க பாக்கலாம்

கதை, படைப்புகள்
"அத்தே என் பிரண்டு ப்ரியாவோட பொண்ணு  கல்யாணத்துக்கு நாளைக்கு போனும் .அவர்க்கு ஆபீஸ்ல வேலை இருக்காம் ..வரமுடியாதாம் ...கூட வரீங்களா ? "நாளைக்கு பக்கத்து வீட்ல பால் காச்றாங்க சுகந்தி  .ரெண்டு தடவ வந்து அந்தம்மா சொல்லீட்டு போனாங்க ..போகலைனா நல்லா இருக்காது ...நீயும் சுரேஷும் போயிட்டு வாங்க ..அவனுக்கு நாளைக்கு காலேஜ் லீவ் தான " "சரிங்கத்த " "டேய் சுரேஷ் நாளைக்கு என்னோட ஒரு கல்யாணத்துக்கு நீ வரணும் ..நாளைக்கு காலேஜ் லீவ் தான ..ஏதாது ஸ்பெஷல் கிளாஸ் இருக்கா ?" "நாளைக்கு ஸ்பெஷல் கிளாஸ் இல்ல ஆனா கிரிகெட் கோச்சிங் இருக்குமா  " "ஒரு நாள் போலனா உங்கோச் ஒன்னும் தலைய வெட்டிட மாட்டாரு " "சரி ...எப்பிடியும் நீ விடப்போறதில்ல ..வழக்கம் போல கோச் கிட்ட ஏதாது போய் சொல்லிகிறேன் " "என்னமோ பண்ணு ...கல்யாணத்துக்கு மட்டும் வந்திரு சாமி "மறுநாள் காலையில்...
முற்பகல் செய்யின்

முற்பகல் செய்யின்

கதை, படைப்புகள்
முற்பகல் : "வணக்கம் சார் ". கேட்டும் கேட்காதது போல் ஆவணங்களை ஆவலுடன் படிப்பது போல் பாவலா செய்து கொண்டிருந்தான் ராமசாமி .... "வணக்கம் சார் " என்று இம்முறை உரத்த குரலில் முயற்சி செய்தான் குமார் ... "வணகொம் வணக்கொம் ...என்ன ஆச்சு நான் சொன்னது " "அது வந்துங்க..... இப்போ கொஞ்சம் பணம் மொட;வேல ஆனதும் எப்பிடியாவது பொரட்டி தாரேங்க..." "அப்பிடியா .....இப்போ கொஞ்சம் வேல இருக்கு .மத்தியானமா வா பாக்கலாம் ...." "ஐயா நேத்து காலைல வரச் சொல்லியிருந்தீங்க அதான் ........" "ஓஹோ ;சரி இப்போ சொல்றேன் ;மத்தியானமா வா " "இல்லைங்க அது வந்து ......மத்தியானம் கொஞ்சம் வேற வேல இருக்கு ......" "அது சரி ஒங்களுக்கு வேல நெறைய இருக்கும் ;நான்தான் இங்க வெட்டியா ஒக்காந்திருக்கேன் " "ஐயோ அப்படி சொல்லலீங்க " "என்ன அப்பிடி சொல்லல இப்பிடி சொல்லல ;ஒரு அம்பதாயிரம் பொரட்ட முடியலன்னு சொல்ற. ; ஒம் பைல நகத்த நான் என்ன பாடு...
ஏட்டுச் சுரைக்காய் எண்ணங்கள்

ஏட்டுச் சுரைக்காய் எண்ணங்கள்

கதை, படைப்புகள்
தாம்பரம் ரயில் நிலையம்.சென்னையில் உள்ள மிக முக்கியமான ரயில் நிலையங்களில் ஒன்று ...வெளியூர் செல்பவர்கள்,சென்னையில் மற்ற பகுதிகளில் வேலைப் பார்ப்பவர்கள் ,படிப்பவர்கள் ,வியாபாரிகள் ,பிச்சைக்காரர்கள் என எப்போதும் கூட்டமாகவே காட்சியளிக்கும் ரயில் நிலையம் .தனிமையின் பொருள் உணரா நிலையம் அது.... அனிதா தினமும் தாம்பரத்தில் இருந்து அவள் வேலை பார்க்கும் தலைமைச் செயலகத்திற்கு மின்சார ரயிலில் செல்லும் பயணி...கூட்ட நெரிசலில் அவதிப்படுவதை தவிர்க்க அதிகாலை ஏழரை மணி ரயிலை பிடித்துவிடுவாள்...வசிப்பது மகளிர் விடுதி என்பதால் ஏழரை மணி வண்டியை பிடிப்பதொன்றும் அவளுக்கு சிரமம் இல்லை ... ஜன்னலோர இருக்கையை பிடித்தே தீரவேண்டும் என்று தினமும் இஷ்டதெய்வத்தை வேண்டிக்கொண்டே ரயிலைப் பிடிப்பாள் ...அதில் எப்போதும் வெற்றியும் அடைவாள்...ஜன்னலோர இருக்கையில் அமர்ந்தாலும் அவளின் பார்வை முழுதும் ரயில் பயணிகளின் மீதே எப்போதும் ...
மனித மனம்

மனித மனம்

கதை, படைப்புகள்
நான்கு ரவுடிகள் தீபாவை துரத்திக்கொண்டு ஓடிக்கொண்டிருந்தனர் ....எதேச்சையாக அந்த தெரு பக்கம் வந்த சுரேந்தர் பார்த்த மாத்திரத்திலேயே துரத்தப்படுவது தன்னுடன் வேலை பார்க்கும் தீபாதான் என்பதை தெளிந்து அந்த ரவுடி கும்பலை விரட்டிப்பிடித்து அடித்து துவைக்கையில் கேட்டது அலாரம் டைம் பீஸின் மணியொலி ...கலைந்தது கனவு.... அலாரத்தை ஆப் செய்ய முயன்றபோதுதான் கௌரி முனங்கினாள் ,"ஏங்க அலாரம் அடிக்கல போன் அடிக்குது ..ஏந்தான் இப்டி இருக்கீங்களோ "என்று அந்த உறக்கத்திலேயும் தெளிவாக கடிந்து விட்டு மீண்டும் உறங்கிவிட்டாள் ... "அட ஆமா போன் அடிக்குது " "ஹலோ....." "டேய் சுரேந்தரு அப்பா பேசுறேன் டா " "என்னப்பா இந்த நேரத்ல என்ன ஆச்சு ?" "ஒண்ணுமில்ல ....அம்மாக்கு கொஞ்சம் ஒடம்பு சரியில்ல...நீ கொஞ்சம் வந்தா தேவலைன்னு தோனுச்சு ..இப்போவே சொன்னாதான நாளைக்காவது வரமுடியும் ...அதான் சொன்னேன்..." "சரிப்பா வரேன் ...அம்மாவ அத...
சூழ்நிலைக் கைதிகள்

சூழ்நிலைக் கைதிகள்

கதை, படைப்புகள்
பொழுது சாய்ந்திருந்தது...அர்ச்சனாவிற்கு சுஜா ஞாபகமாகவே இருந்தது...பள்ளி விட்டு கிட்டத்தட்ட அரை மணிநேரம் ஆகி விட்டது....வீட்டில் தனியாக என்ன செய்கிறாளோ என்று யோசனையாகவே இருந்தது...பணி நேரம் முடிந்ததும் வீட்டிற்கு புறப்பட்டாள் அர்ச்சனா .. "சுஜா குட்டி என்ன பண்றீங்க " "வீடியோ கேம் ஆடுறேன் மம்மி " "ஹோம் வொர்க் பண்ணீங்களா?" "பண்ணிட்டேன் மம்மி.பசிக்குது.பிஸ்கட் தீந்துடுச்சு " "அம்மா பேக்ல கேக் இருக்கு ...சாப்பிடுங்க ..அதுக்குள்ள மம்மி டிபன் ரெடி பண்ணிடுறேன் என்ன ?" "ஓகே மம்மி " சப்பாத்தி குருமா தயார் செய்து முடிக்கும்போது சுந்தர் வந்தான்... "அர்ச்சனா சாப்பாடு ரெடியா?" என கூப்பாடு போட்டான் ... "ரெடி ரெடி" என கூறிய வாறே சப்பாத்தியையும் குருமாவையும் டைனிங் டேபிளில் வைத்தாள்... "அர்ச்சு பேசாம நம்ம ஒரு ஹுண்டாய் சான்ட்ரோ வாங்கலாமா ?" "காரா ?இப்போ எதுக்கு ?" "சுஜாவ டெய்லி ஸ்கூட்டர்ல உக்கா...