அறிவியல் மற்றும் தொழில்நுட்பம்

AI Model Collapse: ஜெனரேட்டிவ் AI, செயற்கை தரவு மற்றும் சவால்கள்

AI Model Collapse: ஜெனரேட்டிவ் AI, செயற்கை தரவு மற்றும் சவால்கள்
Study next

Convert reading into recall

Read once, then use one quick app action while the topic is fresh. Links open in a new tab.

1 Start True/False practice 2-min recall check Open
Read for
Exam hook Prelims fact Mains angle
Other useful actions
N Save key points Build a revision note S Watch related Shorts Quick visual recap App Open News in Web App Browse related current affairs

செய்திகளில் ஏன்?

ஜெனரேட்டிவ் AI (generative AI) அமைப்புகள் புதிய மனிதனால் உருவாக்கப்பட்ட (human-generated) தரவுகளுக்குப் பதிலாக அவற்றின் சொந்த வெளியீடுகளில் மீண்டும் மீண்டும் பயிற்சியளிக்கப்படும்போது “மாடல் கொலாப்ஸ்” (model collapse) எனப்படும் வீழ்ச்சியால் பாதிக்கப்படலாம் என்று ஆராய்ச்சியாளர்கள் எச்சரித்துள்ளனர். King’s College London, Simon Fraser University மற்றும் University of Oxford ஆகியவற்றின் புதிய ஆய்வு, பயிற்சியில் ஒரு உண்மையான தரவுப் புள்ளியை (genuine data point) செருகுவது கூட இந்தச் சீரழிவை (degradation) தாமதப்படுத்தலாம் அல்லது தடுக்கலாம் என்று காட்டுகிறது.

பின்னணி

பெரிய மொழி மாதிரிகள் (large language models) அல்லது இமேஜ் ஜெனரேட்டர்கள் போன்ற ஜெனரேட்டிவ் AI மாதிரிகள் - பெரிய தரவுத்தொகுப்புகளிலிருந்து வடிவங்களைக் கற்றுக்கொண்டு புதிய உரை, படங்கள் அல்லது இசையை உருவாக்குகின்றன. எதிர்கால மாதிரிகள் பழைய மாதிரிகள் உருவாக்கும் உள்ளடக்கத்தில் பெரும்பாலும் பயிற்சியளிக்கப்பட்டால், பிழைகள் மற்றும் சார்புகள் (biases) குவியக்கூடும். அடுத்தடுத்த தலைமுறைகளில் (successive generations), மாதிரிகள் அவற்றின் பன்முகத்தன்மை மற்றும் உண்மையான அடிப்படையை இழந்து சாதுவான அல்லது ஒத்திசைவற்ற வெளியீடுகளில் (bland or incoherent outputs) ஒன்றிணையலாம் (converge); இந்த நிகழ்வு மாடல் கொலாப்ஸ் என்று அழைக்கப்படுகிறது.

இந்தச் சிக்கல் “கார்பேஜ் இன், கார்பேஜ் அவுட்” (garbage in, garbage out) எனப்படும் பழைய கருத்துடன் (concept) தொடர்புடையது: AI-யின் வெளியீடுகளின் தரம் அதன் பயிற்சித் தரவின் தரத்தைப் பொறுத்தது. செயற்கை தரவு (synthetic data) ஆதிக்கம் செலுத்தும் போது, அரிய அம்சங்கள் மற்றும் நீண்ட வால் தகவல்கள் (long-tail information) மறைந்துவிடும், இதனால் அசாதாரண நிகழ்வுகளை எவ்வாறு கையாள்வது என்பதை மாதிரி மறந்துவிடும். இதன் விளைவு நரம்பியல் நெட்வொர்க்குகளில் (neural networks) ஏற்படும் பேரழிவு மறதிக்கு (catastrophic forgetting) இணையாக உள்ளது.

சமீபத்திய ஆராய்ச்சியின் கண்டுபிடிப்புகள்

  • இந்த ஆய்வு செயற்கைத் தரவுகளில் மீண்டும் மீண்டும் கற்றலை உருவகப்படுத்த (simulate) எக்ஸ்போனென்ஷியல் ஃபேமிலீஸ் (exponential families) எனப்படும் கணித மாதிரிகளைப் பயன்படுத்தியது. தரவின் விநியோகம் காலப்போக்கில் சுருங்குவதை (narrows) இது கண்டறிந்தது, இதனால் மாதிரிகள் சுருங்கி வரும் பன்முகத்தன்மை கொண்ட வெளியீடுகளை உருவாக்குகின்றன.
  • பயிற்சி செயல்பாட்டில் (training process) ஒரு உண்மையான, அவுட்-ஆஃப்-டிஸ்ட்ரிபியூஷன் (out-of-distribution) தரவுப் புள்ளியைச் செருகுவது அல்லது முன் நம்பிக்கையை (prior belief) குறியாக்கம் செய்வது இந்த சுருக்கத்தை (narrowing) குறுக்கிடுகிறது மற்றும் மாதிரியின் வெளியீட்டை யதார்த்தத்திற்கு நெருக்கமாக வைத்திருக்கிறது.
  • ஜெனரேட்டிவ் மாதிரிகளின் பல வகைகளில் முடிவுகள் பொருந்தும், இது ஒரு எளிய வழிகாட்டுதலைப் பரிந்துரைக்கிறது: எப்போதும் உண்மையான மனித தரவை பயிற்சித் தொகுப்புகளில் கலக்கவும் மற்றும் செயற்கை உள்ளடக்கத்தின் தோற்றத்தைக் (provenance) கண்காணிக்கவும்.

விளைவுகள் மற்றும் தணிப்பு (Consequences and mitigation)

  • விளைவுகள்: மாடல் கொலாப்ஸ் நம்பமுடியாத பரிந்துரைகள், மோசமான முடிவெடுத்தல் (decision-making) மற்றும் தானியங்கி அமைப்புகளில் (automated systems) அறிவின் அரிப்புக்கு வழிவகுக்கும். இது பயனர் நம்பிக்கையை குறைமதிப்பிற்கு உட்படுத்துகிறது மற்றும் உள்ளடக்க உருவாக்கம், வடிவமைப்பு அல்லது நோயறிதலுக்கு (diagnostics) ஜெனரேட்டிவ் AI-யை நம்பியிருக்கும் தொழில்களுக்கு தீங்கு விளைவிக்கும்.
  • தணிப்பு உத்திகள் (Mitigation strategies): தரவு ஆதாரங்களை ஆவணப்படுத்தவும், அசல் தரவுத்தொகுப்புகளுக்கான அணுகலைப் பாதுகாக்கவும் மற்றும் குறைந்த தரமான செயற்கைத் தரவைக் கண்டறிந்து அகற்ற தரக் கட்டுப்பாட்டு வடிப்பான்களைப் (quality-control filters) பயன்படுத்தவும் ஆராய்ச்சியாளர்கள் பரிந்துரைக்கின்றனர். உண்மையான மற்றும் செயற்கைத் தரவைக் கலப்பது பன்முகத்தன்மையைப் பராமரிக்க உதவுகிறது.
  • வெளியீடுகளில் திடீர் சீரான தன்மை (uniformity) அல்லது அரிய நிகழ்வுகளைக் கையாளும் மாதிரியின் திறனில் ஏற்படும் குறைவு போன்ற சரிவின் ஆரம்ப அறிகுறிகளைக் கண்டறியும் மதிப்பீட்டு அளவீடுகளிலும் (evaluation metrics) நிறுவனங்கள் முதலீடு செய்ய வேண்டும்.

முடிவுரை

மாடல் கொலாப்ஸ் என்பது சுய-குறிப்புக் கற்றலின் (self-referential learning) வரம்புகள் பற்றிய ஒரு எச்சரிக்கைக் கதையாகும். ஜெனரேட்டிவ் AI மிகவும் பரவலாகி (pervasive) வரும் நிலையில், மாதிரிகள் நிஜ உலகத் தகவல்களில் வேரூன்றி இருப்பதை டெவலப்பர்கள் மற்றும் கட்டுப்பாட்டாளர்கள் (regulators) உறுதி செய்ய வேண்டும். உண்மையான தரவை ஒருங்கிணைத்தல் மற்றும் மாதிரியின் நடத்தையைக் கண்காணித்தல் ஆகியவை புதுமை மற்றும் நம்பகத்தன்மையை (innovation and reliability) பராமரிக்க முக்கியம்.

ஆதாரங்கள்

Finished reading?

Do one recall action now

Practice first while the topic is fresh. Save the key points or use Shorts when you want a quick recap.

1 Start True/False practice 2-min recall check N Save key points Build a revision note S Watch related Shorts Quick visual recap App Open News in Web App Browse related current affairs
Home Current Affairs 📰 Daily News 🎬 Watch Shorts 📊 Economic Survey 2025-26 Subjects 📚 All Subjects ⚖️ Indian Polity 💹 Economy 🌍 Geography 🌿 Environment 📜 History Exam Info 📋 Syllabus 2026 📝 Prelims Syllabus ✍️ Mains Syllabus ✅ Eligibility Resources 📖 Booklist 📊 Exam Pattern 📄 Previous Year Papers ▶️ YouTube Channel
Sign In / Open Web App