Categories
அறிவியல் தமிழ்

செயற்கை நுண்ணறிவு – எப்படி வேலை செய்கிறது?

கட்டைவிரலின் தனிச்சிறப்பு அதன் எதிர்மறைச் சிக்கல் திறன் ஆகும். இது என்னவென்றால், நம் கட்டைவிரல், மற்ற நான்கு விரல்களுடன் எதிர்திசையில் நகர்ந்து, பொருட்களை பிடிக்க முடியும். மனிதனை மனிதனாக்கும் இந்த வேறுபாடு பரிணாம வளர்ச்சியின் ஒரு முக்கிய புள்ளியாக கருதப்படுகிறது. 

ஒரு பொருளை கையில் எடுத்து பார்க்கும் திறன் வந்துவிட்டால் குனிந்து தரையோடு நடக்க வேண்டியது இல்லை. நுட்பமாக பொருட்களை பற்றி ஆராயவும், கருவிகள் உருவாக்கத்திலும், இதனாலான மூளை வளர்ச்சியிலும் கட்டை விரலின் பங்கு உண்டு. 

இது போல மனிதனை விலங்கில் இருந்து வேறுபடுத்தும் மொழியை இன்று மனிதன் உருவாக்கிய இயந்திரங்களும் கற்று விட்டன. AI எனப்படும் செயற்கை நுண்ணறிவு எப்படி உருவாக்கப்படுகிறது, இதனால் ஆன பயன்களும், பயங்களும் என்ன என்பதை இந்த கட்டுரையில் பார்க்கலாம். 

AI என்று பொதுவாக கூறப்படுபவை GPT (Generative Pre-trained Transformer) எனப்படும் பெரிய மொழி மாதிரிகள் (Large Language Models, LLM). ஒரு பொருளின் தன்மைகளை வெளிப்படுத்தும் பொம்மையை போல், மொழியின் தன்மையை வெளிப்படுத்தும் மாதிரி.  

மொழியின் மாதிரியை எப்படி உருவாக்குவது? இன்டர்நெட்டில் சேகரித்த மனித பேச்சுக்களை கொண்டு உருவானது. இதில் லட்சகணக்கான blog போஸ்ட்களும், forum எனப்படும் இணைய மன்றங்களின் பேச்சுக்களும் அடக்கம். புத்தகங்கள், கையேடுகள், உரைகள் எல்லாம் அடங்கியிருக்கலாம். இதையெல்லாம் மிக்ஸியில் அரைத்தால் கிடைக்கும் சட்னி, போன்றது பெரிய மொழி மாதிரிகள். (Large Language Models, LLM). 

சொற்களை மனப்பாடம் செய்வது மட்டுமல்லாது ஒவ்வொரு சொல்லுக்கும் மற்ற சொர்க்களுக்கும் உள்ள உறவு பதிவுசெய்து ஆராயப்படுகிறது. 

ஒரு சொற்றொடரை பதிவு செய்யும் பொழுது அதற்கு அடுத்து என்ன வரலாம் என்று மாதிரி கணிக்கும். பதிலான அந்த சொல்லையும் சேர்த்து, மறுபடியும் சொற்றொடரை ஆராய்ந்து, அடுத்து என்ன சொல் வரலாம் என்று கணிக்கும். இவ்வாறு பல்லாயிரம் முறை கணிப்பு செய்து நமக்கு ஒரு பதில் அளிக்கும். நாம் தொடர்ந்து கேள்வி கேட்டால், மேலே உள்ள அத்தனையும் திரும்ப நடைபெறும். 

அது சரியாகத்தான் சொல்லும் என்று என்ன நிச்சயம்? இது போன்ற உருவாக்க (generative) மாதிரிகள் கொடுக்கும் பதில்கள் சரியா தவறா என்று அதற்கு சொல்லிக்கொடுப்பார்கள் (pretrained). 

நாம் உள்ளே செலுத்தும் ஒவ்வொரு சொல்லும், அதன் இடம், பொருள், ஏவல், அறிந்து, பல்லாயிரம் நுனுக்கங்களாக பிரிக்கப்பட்டு அட்டவணையில் சேமிக்கப்படும். 1000 x 1000 அட்டவணை என்று வைத்துக்கொள்வோம் (வரிசை x நெடுவரிசை), அடுத்த சொல்லுக்கும் ஒரு அட்டவணை இருக்கும் 1000 x 1000. இவை இரண்டும் சேர்ந்தால் ஒரு அட்டவணை 1000×1000. இந்த இரண்டும் எப்படி கலக்க வேண்டும் என்று குறிக்க சில அட்டவணையும் உண்டு. 

அட்டவனைகள் இரண்டு பரிணாமங்களில் மட்டும் அல்ல, பல்லாயிரம் பரிணாமங்கள் (dimensions) கொண்ட tensor களாகவும் இருக்கலாம். அதாவது 1000×1000 அடுகுக்கு செங்குத்தாக சில 1000 பரிணாமங்கள் இருக்கலாம். 3க்கு மேல் செங்குத்தான பரிணாமங்களை நம்மால் கற்பனை செய்ய முடியாது. ஆனால் கம்ப்யூட்டருக்கு எல்லாம் 0 வும் 1 உம் தானே. 

இப்படி மாற்றி மாற்றி 1000 முறை ஒட்டி கடைசியாக கிடைக்கும் அட்டவணையில் உள்ள முதல் வரிசை, முதல் நெடுவரிசை இணையும் சொல், பதிலின் முதல் சொல். 

கேள்வியான சொற்றொடருடன் இந்த முதல் சொல்லும் இணைத்து மறுபடியும் உள்ளே போகும். இப்படியே அடுத்த அடுத்த சொற்களையும் அவைகளின் தொடர்ச்சியையும் கணிக்கும். இந்த அட்டவணை மாற்றங்களை செய்யும் நுண்ணறிவு கருவிக்கு பெயர் transformer. 

இந்த கருவிகளின் உள் அமைப்பு யாருக்கும் தெரியாது. அதாவது GPT இயந்திரங்கள் கருப்பு பெட்டி (black box) எனப்படுகின்றன. வெளியில் இருந்து அறிவுரை கொடுக்க மட்டுமே முடியும். அது சரியாக ஓடவில்லை என்றால் ஏன் என்று சொல்ல முடியாது. ரிப்பேர் செய்ய முடியாது.

சொல் அச்சுக்கு எப்படியோ, audio மற்றும் வீடியோவுக்கும் டிரான்ஸ்பார்மர்கள் உண்டு. பல குரல் பதிவுகளை கம்ப்யூட்டரில் பதிவு செய்வது மூலம் நமக்கு வேண்டிய சொற்கள் அந்த குரலில் வடிவமைத்துக்கொள்ளலாம். கதையை கேட்டு, அதற்கு பின்னணி இசை வடிவமைக்கவும் இன்று மாதிரிகள் இருக்கின்றன.

முகமாற்றம் என்னும் Deepfakes, Generative Adversarial Networks (GAN) என்னும் தொழில்நுட்பத்தால் செய்யப்படுகிறது. அதாவது உருவாக்கும் எதிர்மறையான வலைப்பாடு. 

ஜெனரேட்டர் ஒரு தரவுத்தொகுப்பில் இருந்து கற்றுக்கொள்வதன் மூலம் போலியான படங்களை (அல்லது வீடியோக்களை) உருவாக்குகிறது, அதே நேரத்தில், எதிரி (adversarial) போலிகளைக் கண்டறிய முயற்சிக்கும்.

இந்த எதிர்விளைவு செயல்முறை யதார்த்தமான வீடியோக்களை உருவாக்கும் ஜெனரேட்டரின் திறனை மேம்படுத்துகிறது. இதன் மூலம் போதிய பதிவேடுகள் இருந்தால் ஒருவரின் குரலையோ, உருவத்தையோ போலியாக உருவாக்க முடியும். 

“Generative Transformer” என்ற தலைப்பில் chatGPT உருவாக்கிய படம்

செயற்கை நுண்ணறிவின் விளைவுகள், நன்மைகள், கேடுகள் போன்றவற்றை அடுத்த கட்டுரையில் பார்ப்போம். அதுவரையில், நினைவுகள்.

தொடர்ந்து வாசிக்க, சென்ற மாத பதிவுகளுக்கான முன்னோட்டம்,  நினைவுகள் பதிப்பாசிரியர்குறிப்பு – 02

புதிய பதிவுகள் பற்றிய அறிவிப்புகள் பெற நினைவுகள் whatsapp சேனல்