Categories
அறிவியல் தமிழ்

செயற்கை நுண்ணறிவு – பாகம் 2 – பொருள் தேவை

ஜெனெரேட்டிவ் AI எனப்படும் செயற்கை நுண்ணறிவு பொதுவாக எப்படி வேலை செய்கிறது என்று இதற்கு முன்பாக பார்த்தோம்

இது உருவாக என்ன தேவை என்றும் அதனால் ஏற்படும் விளைவுகளையும் தொடர்ந்து பார்போம். 

டிரான்ஸ்பார்மர் மாடல்கள் வேலை செய்ய, சிறப்பாக தயாரிக்க பட்ட கிராஃபிக் ப்ராசெஸ்ஸரும் அபரிமிதமான டேட்டாவும் தேவை. 

நமது கம்ப்யூட்டர்களிலும் மொபைல் போன்களிலும் CPU, GPU என்று இரு வேறு செயலிகள் உள்ளன என்று பலரும் அறிவோம்.

CPU கள் பொதுவாக அறிவுறுத்தல்களை வரிசையாக செயல் படுத்துகின்றன. அண்மையில் CPU க்கள் ஒரே நேரத்தில் பல வேலைகளை செய்யுமாறு (multitasking) முன்னேறினாலும் அடிப்படையில் இவை நேராகவே பயணிக்க கூடியவை. ஒரே நேரத்தில் பத்து, பதினைந்து செயலிகள் (application) திறந்து வைத்து மாற்றி மாற்றி வேலை செய்யலாம். ஆனால் பொதுவாக ஓரிரு செயலிகளுக்கே அதிக கவனமும் கணித சக்தியும் பயன்படுத்தும்.

1990 களின் முற்பகுதி வரை, அதாவது GPU களுக்கு முன், CPU மற்றும் மெமரியின் உதவியுடன் கம்ப்யூட்டர்கள் விவரத்தை திரையில் வெளிப்படுத்தின. 

இந்த அணுகுமுறையில், CPU ஆனது காட்சிகளை வழங்குவதற்குத் தேவையான அனைத்து கணக்கீடுகளையும் செய்தது. 

எழுத்து மற்றும் எண்களை தாண்டி படங்களும், வரைகலையும் அதிகரித்த சூழலில், இவற்றிற்கான கணக்கீட்டு தேவையும் அதிகரித்தது. 

கம்ப்யூட்டர் விளையாட்டுகள் மற்றும் 3d graphics கு தேவையான CGI செய்வதற்கு பிரத்தியேகமாக தயார் செய்யப்பட்ட சிப் கள் தேவை பட்டன. 

இவையே GPU என்று அழைக்கப்படுகின்றன. 

Nvidia என்ற நிறுவனத்தால் 2000களில் பிரபலப்படுத்த பட்டு இன்று கம்ப்யூட்டர் விளையாட்டு பிரியர்கள் விரும்பும் GPU களே செயற்கை நுண்ணறிவு உருவாக்கவும் தேவைப்படுகின்றன. இது ஏன் என்று சுருக்கமாக இங்கு பார்ப்போம். 

GPU கள் ஒரே நேரத்தில் பல சிறிய கணக்குகள் செய்வதில் வல்லமை பெற்றிருக்கின்றன. உதாரணமாக ஒருவன் இருட்டில் விளக்கு பிடித்து நடந்து வருவதை CGI மூலம் வெளிப்படுத்த வேண்டும் என்று வைத்துக்கொள்வோம். அவன் நகரும் பொழுது விளக்கும் நகர்கிறது. 

இதனால் விளக்கு இருக்கும் இடத்தில் எவ்வளவு வெளிச்சம் இருக்கும், அதை சுற்றி ஒவ்வொரு இடைவெளியிலும் எவ்வளவு வெளிச்சம் இருக்கும், இது பாறை மீது எப்படி பிரதிபலிக்கிறது, கண்ணாடி மீது எப்படி பிரதிபலிக்கிறது போன்ற கணக்குகளை ஒவ்வொரு நொடியும் கணக்கிட வேண்டும். 

நமது திரையை 1000×1000 என்று கட்டங்களாக பிரித்து கொண்டால் ஒவ்வொரு கட்டத்திலும் எவ்வளவு வெளிச்சம் என்று கணக்கிட வேண்டும். ஒரு கட்டத்தில் ஏற்படும் மாறுதல் மற்ற கட்டங்களை எப்படி பாதிக்கின்றன என்றும், அது பிரதிபலிக்கும் பொருள்களின் சரும இழைமங்கள் வெளிச்சத்தை எப்படி பாத்திக்கிறது என்றும் கணக்கிட வேண்டும். 

பின்னால் உள்ள மென்பொருள் அறிவுறுத்தலை கொண்டு GPU கள் இந்த வேலையை சிறப்பாக செய்கின்றன. 

முதல் பாகத்தை வாசித்தவர்கள் GPU வின் தொழில்நுட்பதுக்கும் செயற்கை நுண்ணறிவுக்கும் உள்ள இணைப்பை ஊகித்திருக்கலாம். 

டிரான்ஸ்போர்மர் இயந்திரத்தின் உருவமைப்பு (chat GPT உருவாக்கியது)

செ.நு. உருவாக்க தேவைப்படும் அணி மாற்றங்கள் (matrix transformations) செய்ய பல சிறிய கணக்குகளை ஒரே நேரத்தில் செய்ய வேண்டும். 

பள்ளியில் matrix கணக்குகள் படித்தவர்களுக்கு இது வியப்பாக இருக்கலாம், ஆனால் சிந்தித்து பார்த்தால் இதில் உள்ள உண்மை விளங்கக்கூடும். 

Matrix இன்னும் அணிகள் பொதுவாக எப்படி செயல்படுகின்றன என்று இங்கு சிறிதாக பார்ப்போம். X ,Y, Z என்று மூன்று மாறிகள் உள்ளன என்று வைத்து கொள்வோம். இந்த மாறிகளை துறந்து வெறும் எண்களாக ஒரு கட்டத்திற்குள் எழுதிவிடலாம். இப்படி அணிக்குள் வெறும் எண்களே இருக்கும். 

அணி பெருக்கல் (matrix multiplication) செய்தவர்களுக்கு ஞாபகம் இருக்கலாம். இதனை செய்யும் பொழுது சிறு சிறு எண்களை பெருக்கவும் கூட்டவுமே திரும்ப திரும்ப செய்ய வேண்டியிருக்கும். 

செ.நு. மாதிரிக்குள் இது போன்ற அணிகளில் நாம் செலுத்தும் கேள்வியின் சொற்றொடர், எண்கள் நிறைந்த அணியாக மாற்றப்பட்டு, பல கோடி கணக்கான சொற்கள் மற்றும் சொற்றொடர்களின் அணிகளுடன் சேர்ந்து transformer என்ற இயந்திரத்தினுள் செலுத்தப்படும்.

இன்றைய பெரிய மொழி மாதிரிகள் பல பில்லியன் அளவுருக்கள் (parameters) கொண்டிருக்கின்றன. இது மட்டுமல்ல, அளவுருக்களின் வெவ்வேறு பரிமானங்களில் சேமிக்கப்பட்டு இவையிடயே கணக்கீடுகள் செய்யப்படுகின்றன. 

நாம் செலுத்தும் கேள்விக்கு பதிலாக என்ன கொடுக்க வேண்டும் என்று செ நு சொல்ல வேண்டும். இதற்காக கேள்வியின் முதல் சொல் உள்ளே செலுத்தப்படும். இந்த சொல்லுக்கும், பல கோடி வார்த்தைகள் மற்றும் வாக்கியங்களுக்கும், இடையே ஆன உறவு எண்களாக சேமிக்கப்படுகிறது.

அடுத்த சொல் வந்தவுடன் முதல் சொல்லுக்கும் மற்ற சொற்களுக்குமான உறவு மதிப்பெண் கூடவோ குறையவோ செய்யலாம். இரண்டு சொற்கள் வந்தவுடன் முதலில் கொண்ட அர்த்தம் முழுமையாக மாறிப்போகலாம் அல்லவா. 

இப்படியாக கேள்வியின் சொற்களுக்கும் மீதம் உள்ள எல்லா சொற்களுக்குமான உறவு செய்யப்பட்டவுடன் இதற்கு பின் அடுத்து என்ன சொல் வர அதிகபட்ச நிகழ்தகவு (probability) உள்ளதென கணக்கிட வேண்டும். 

மேல் கூறிய தரவுகளை, படங்கள் (images) உருவாக்கும் செ நு கருவிகளின் செயல்முறையை ஒவ்வொரு கட்டமாக பார்க்கும் பொழுது கொஞ்சம் புரிந்து கொள்ளலாம். அது எழுத்துக்களையும் இப்படி தான் புரிந்து கொள்ளும் என்று நாம் ஊகித்து கொள்ளலாம்.

இந்த செயல்முறையின் ஒரு பக்க விளைவு, இதற்கு தேவையான கணினி சக்தியும் அதற்கான மின்சார தேவையும். ஒரு புகைப்படம் உருவாக்க ஒரு செல் போன் அளவு மின்சாரம் தேவைப்படுகிறது. மாதிரிகள் பெரியதாகவும், அவை கொண்டுள்ள தகவல் அதிகரிக்கவும், அவற்றிற்கான மின்சார தேவையும் அதிகரிக்கிறது.

மேலும் புரிதல் என்பது இங்கே ஆதாரத்தின் நீட்சியா (stretching the facts) இல்லை செ நு வுக்கு உண்மையான புரிதல் இங்கே இருக்கிறதா என்ற கேள்வியும் வருகிறது. இவற்றை தொடர்ந்து ஆராயலாம்.

அதற்கு முன் ஒரு எடுத்து காட்டு, “தேங்காய் மடையன்“ என்று துவங்கி ஒரு கதை, என்ற கட்டளைக்கு Claude 3.5 Sonnet என்ற மாடல் உருவாக்கிய கதை.

தேங்காய் மடையன்

“தேங்காய் மடையன்!” என்று கத்தினான் ராமு, தன் நண்பன் குமாரை நோக்கி. பள்ளி முடிந்து வீடு திரும்பும் வழியில் இருவரும் வாக்குவாதம் செய்து கொண்டிருந்தனர்.

குமார் தலையைக் குனிந்து கொண்டு நடந்தான். அவன் கண்களில் கண்ணீர் தழும்பியது. ராமுவின் வார்த்தைகள் அவனை ஆழமாக காயப்படுத்தியிருந்தன.

அன்று மதியம், வகுப்பில் ஆசிரியர் கேட்ட கணித கணக்கிற்கு குமாரால் சரியான பதில் சொல்ல முடியவில்லை. அதனால் கோபமடைந்த ராமு, தன் நண்பனை இப்படி அவமானப்படுத்தினான்.

வீட்டிற்குச் சென்றதும், குமார் தன் தாத்தாவிடம் நடந்ததைச் சொன்னான். தாத்தா அவனை ஆறுதல்படுத்தி, “தம்பி, ஒவ்வொருவருக்கும் வேறு வேறு திறமைகள் இருக்கும். நீ கணிதத்தில் சற்று மெதுவாக இருக்கலாம், ஆனால் உன் ஓவியத் திறமை அற்புதமானது. உன் நண்பன் ராமு அதை உணரவில்லை,” என்றார்.

அடுத்த நாள், பள்ளியில் ஓவியப் போட்டி நடந்தது. குமார் அழகான ஓவியம் வரைந்து முதல் பரிசு வென்றான். ராமுவால் நம்ப முடியவில்லை.

பரிசளிப்பு விழாவில், குமார் மேடையில் நின்றபோது, “நேற்று என்னை ‘தேங்காய் மடையன்’ என்று கூறிய என் நண்பன் ராமுவுக்கு இந்த வெற்றியை அர்ப்பணிக்கிறேன். ஒவ்வொருவரும் தனித்துவமானவர்கள் என்பதை அவன் உணர வேண்டும்,” என்றான்.

ராமு வெட்கத்தில் தலை குனிந்தான். அவன் குமாரிடம் சென்று மன்னிப்பு கேட்டான். “நான் தான் உண்மையில் தேங்காய் மடையனாக இருந்திருக்கிறேன். என்னை மன்னித்துவிடு நண்பா,” என்றான்.

அன்றிலிருந்து, இருவரும் ஒருவரின் பலம் மற்றும் பலவீனங்களை மதிக்கக் கற்றுக்கொண்டனர். அவர்களின் நட்பு மேலும் வலுவடைந்தது.

பள்ளி முழுவதும் இந்த சம்பவம் பரவியது. மாணவர்கள் ஒருவரை ஒருவர் கேலி செய்வதை குறைத்துக் கொண்டனர். அனைவரும் ஒவ்வொருவரின் தனித்துவத்தையும் மதிக்கக் கற்றுக்கொண்டனர்.

இறுதியில், “தேங்காய் மடையன்” என்ற வார்த்தை, மாணவர்களிடையே ஒற்றுமையையும் புரிதலையும் ஊக்குவிக்கும் ஒரு படிப்பினையாக மாறியது.

—–

இது போன்ற டெக்னாலஜிகள் இன்று பரவலாக இருக்க, இவைகளின் நன்மைகளையும் தீமைகளையும் தொடர்ந்து பார்ப்போம். அதுவரையில் நினைவுகள் வலைப்பக்கம்.