AI & ఇంజనీరింగ్ ప్రోగ్రామ్‌లు›🌿 AI Sprouts›పాఠాలు›AI మోడల్‌లను ట్రైనింగ్ చేయడం

🏋️

AI Sprouts • ప్రారంభకుడు⏱️ 15 నిమిషాల పఠన సమయం

AI మోడల్‌లను ట్రైనింగ్ చేయడం

న్యూరల్ నెట్‌వర్క్‌లు వెయిట్‌లు మరియు బయాసులను సర్దుబాటు చేయడం ద్వారా నేర్చుకుంటాయని మీకు ఇప్పుడు తెలుసు. కానీ పూర్తి ట్రైనింగ్ ప్రక్రియ నిజంగా ఎలా పనిచేస్తుంది? మోడల్ తగినంత నేర్చుకుందని - లేదా ఎక్కువగా నేర్చుకుందని - మీకు ఎలా తెలుస్తుంది? ఈ పాఠంలో, మొత్తం ట్రైనింగ్ ప్రయాణం గుండా నడుస్తాము.

ట్రైనింగ్ లూప్

AI మోడల్‌ను ట్రైన్ చేయడం పదే పదే పునరావృతమయ్యే ఒక చక్రాన్ని అనుసరిస్తుంది:

అంచనా వేయండి - డేటాను మోడల్ గుండా ఫీడ్ చేసి ప్రిడిక్షన్ పొందండి.
పోల్చండి - ప్రిడిక్షన్ సరైన సమాధానం నుండి ఎంత దూరంలో ఉందో తనిఖీ చేయండి.
సర్దుబాటు చేయండి - ఎర్రర్‌ను తగ్గించడానికి వెయిట్‌లను అప్‌డేట్ చేయండి.
పునరావృతం - తదుపరి బ్యాచ్ డేటాతో మళ్ళీ చేయండి.

ఈ లూప్ వేలాది లేదా మిలియన్ల సార్లు నడుస్తుంది. ప్రతి పునరావృతం మోడల్‌ను సరైన సమాధానాలకు కొద్దిగా దగ్గరగా నెట్టుతుంది.

ట్రైనింగ్ లూప్ చూపించే వృత్తాకార రేఖాచిత్రం: అంచనా వేయండి, పోల్చండి, సర్దుబాటు చేయండి, పునరావృతం, ప్రతి దశను చక్రంలో కలుపుతూ బాణాలతో — ట్రైనింగ్ లూప్ AI నేర్చుకోవడం యొక్క హృదయ స్పందన - అంచనా వేయండి, పోల్చండి, సర్దుబాటు చేయండి, మరియు పునరావృతం.

🤯

GPT-4 ను ట్రైన్ చేయడానికి కేవలం కంప్యూటింగ్ పవర్‌లోనే $100 మిలియన్ కంటే ఎక్కువ ఖర్చయినట్లు తెలిసింది. ట్రైనింగ్ లూప్ నెలల తరబడి వేలాది ప్రత్యేక చిప్‌లపై నడిచింది.

లాస్ ఫంక్షన్‌లు: మోడల్ ఎంత తప్పు?

ప్రతి ప్రిడిక్షన్ తర్వాత, మోడల్ ఎంత తప్పుగా ఉందో కొలవడానికి ఒక మార్గం అవసరం. ఈ కొలతను లాస్ (లేదా కాస్ట్) అంటారు, దాన్ని లెక్కించే ఫార్ములా లాస్ ఫంక్షన్.

తక్కువ లాస్ = ప్రిడిక్షన్ సరైన సమాధానానికి దగ్గరగా ఉంది.
ఎక్కువ లాస్ = ప్రిడిక్షన్ చాలా దూరంగా ఉంది.

డార్ట్‌బోర్డ్‌లా ఆలోచించండి. బుల్స్‌ఐ సరైన సమాధానం. లాస్ అంటే మీ డార్ట్ పడిన చోటు నుండి బుల్స్‌ఐకి ఉన్న దూరం. ట్రైనింగ్ లక్ష్యం కాలక్రమేణా ఆ దూరాన్ని కనిష్టీకరించడం.

సాధారణ లాస్ ఫంక్షన్‌లు:

Mean Squared Error (MSE) - ప్రిడిక్షన్‌లు మరియు నిజమైన విలువల మధ్య సగటు స్క్వేర్డ్ దూరాన్ని కొలుస్తుంది. సంఖ్యలను అంచనా వేయడానికి ఉపయోగించబడుతుంది.
Cross-Entropy Loss - అంచనా వేసిన ప్రాబబిలిటీలు నిజమైన కేటగిరీలతో ఎంత బాగా సరిపోతాయో కొలుస్తుంది. క్లాసిఫికేషన్ టాస్క్‌లకు ఉపయోగించబడుతుంది.

పాఠం 4 / 160% పూర్తి

←న్యూరల్ నెట్‌వర్క్‌ల పరిచయం

Discussion

lessons.suggestEdit

🧠త్వరిత తనిఖీ

AI ట్రైనింగ్‌లో లాస్ ఫంక్షన్ ఏమి కొలుస్తుంది?

ఎపాక్‌లు: డేటా గుండా ఎన్ని సార్లు?

మొత్తం ట్రైనింగ్ డేటాసెట్ గుండా ఒక పూర్తి పాస్‌ను ఎపాక్ అంటారు. ట్రైనింగ్‌లో సాధారణంగా అనేక ఎపాక్‌లు ఉంటాయి - మోడల్ అదే డేటాను అనేక సార్లు చూస్తుంది, ప్రతి రౌండ్‌లో కొద్దిగా మెరుగుపడుతుంది.

ఎపాక్ 1: మోడల్ అనేక తప్పులు చేస్తుంది; లాస్ ఎక్కువ.
ఎపాక్ 10: మోడల్ గణనీయంగా మెరుగుపడింది; లాస్ తగ్గుతోంది.
ఎపాక్ 50: మెరుగుదలలు నెమ్మదిస్తాయి; మోడల్ దాని ఉత్తమానికి దగ్గరగా ఉంది.
ఎపాక్ 200: మోడల్ బట్టీ పట్టడం ప్రారంభించవచ్చు - ఇది మన తదుపరి అంశానికి తీసుకెళ్తుంది.

🤔

Think about it:

పరీక్ష కోసం రివిజన్ చేయడం ఎపాక్‌లు నడపడం లాంటిది. మొదటి చదివినప్పుడు గందరగోళంగా ఉంటుంది, కానీ ప్రతి సమీక్ష అవగాహనను నిర్మిస్తుంది. అయితే, అదే నోట్స్‌ను వంద సార్లు మళ్ళీ చదివితే, భావనలను నిజంగా అర్థం చేసుకోకుండా ఖచ్చితమైన పదాలను బట్టీ పట్టవచ్చు. AI కి కూడా ఇదే సమస్య ఉంది.

ఓవర్‌ఫిట్టింగ్: బట్టీ పట్టే విద్యార్థి

ఓవర్‌ఫిట్టింగ్ AI ట్రైనింగ్‌లో అత్యంత సాధారణ సమస్యలలో ఒకటి. మోడల్ ట్రైనింగ్ డేటాను మరీ బాగా నేర్చుకున్నప్పుడు - దాని శబ్దం మరియు వింతలతో సహా - కొత్త, చూడని డేటాపై పనిచేయడంలో విఫలమైనప్పుడు ఇది జరుగుతుంది.

గత పరీక్ష పేపర్‌లన్నీ పదానికి పదం బట్టీ పట్టిన విద్యార్థిని ఊహించుకోండి. వారు పాత పేపర్‌లలో ఖచ్చితంగా స్కోర్ చేస్తారు కానీ ప్రశ్నలు కొద్దిగా మారినా కష్టపడతారు. విద్యార్థి విషయాన్ని నేర్చుకోలేదు - వారు సమాధానాలను బట్టీ పట్టారు.

ఓవర్‌ఫిట్టింగ్ సంకేతాలు:

ట్రైనింగ్ ఆక్యురసీ చాలా ఎక్కువ (ఉదా., 99%).
కొత్త డేటాపై పనితీరు చాలా తక్కువ (ఉదా., 75%).
మోడల్ ట్రైనింగ్ ఉదాహరణలను నిజంగా బట్టీ పట్టింది.

💡

ట్రైనింగ్ లక్ష్యం మోడల్ ఇప్పటికే చూసిన డేటాపై ఖచ్చితంగా స్కోర్ చేయడం కాదు. ఇది ఎప్పుడూ చూడని డేటాపై బాగా పనిచేయడం. అదే నేర్చుకోవడం యొక్క నిజమైన పరీక్ష.

అండర్‌ఫిట్టింగ్: చదవని విద్యార్థి

వ్యతిరేక సమస్య అండర్‌ఫిట్టింగ్. మోడల్ డేటా నుండి తగినంత నేర్చుకోనప్పుడు ఇది జరుగుతుంది. ఇది ట్రైనింగ్ డేటా మరియు కొత్త డేటా రెండింటిపై తక్కువగా పనిచేస్తుంది.

అండర్‌ఫిట్టింగ్ కారణాలు:

సమస్య యొక్క సంక్లిష్టతకు మోడల్ చాలా సరళం.
ట్రైనింగ్ చాలా త్వరగా ఆగిపోయింది (తగినంత ఎపాక్‌లు లేవు).
డేటాలోని ఫీచర్లు తగినంత సమాచారపరమైనవి కావు.

ఓవర్‌ఫిట్టింగ్ గత పేపర్లను బట్టీ పట్టడం అయితే, అండర్‌ఫిట్టింగ్ అనేది టెక్స్ట్‌బుక్ దాదాపు తెరవకుండా పరీక్షలోకి నడిచి వెళ్ళడం లాంటిది.

🧠త్వరిత తనిఖీ

ట్రైనింగ్ డేటాపై మోడల్ 98% ఆక్యురసీ స్కోర్ చేస్తుంది కానీ కొత్త డేటాపై కేవలం 60%. అత్యంత సంభావ్య సమస్య ఏమిటి?

వాలిడేషన్ మరియు టెస్ట్ సెట్‌లు

ఓవర్‌ఫిట్టింగ్ మరియు అండర్‌ఫిట్టింగ్‌ను గుర్తించడానికి, మన డేటాను మూడు భాగాలుగా విభజిస్తాము:

| సెట్ | ఉద్దేశ్యం | ఎప్పుడు ఉపయోగించబడుతుంది | |-----|---------|-----------| | ట్రైనింగ్ సెట్ | మోడల్ ఈ డేటా నుండి నేర్చుకుంటుంది | ట్రైనింగ్ సమయంలో | | వాలిడేషన్ సెట్ | ప్రగతిని తనిఖీ చేయడానికి మరియు సెట్టింగ్‌లను ట్యూన్ చేయడానికి ఉపయోగించబడుతుంది | ట్రైనింగ్ సమయంలో | | టెస్ట్ సెట్ | పూర్తిగా చూడని డేటాపై చివరి ఎవాల్యుయేషన్ | ట్రైనింగ్ తర్వాత |

సాధారణ విభజన 70% ట్రైనింగ్, 15% వాలిడేషన్, మరియు 15% టెస్ట్. మోడల్ చివరి వరకు టెస్ట్ సెట్‌ను ఎప్పుడూ చూడదు - ఇది తుది పరీక్ష.

🤔

Think about it:

వాలిడేషన్ సెట్ స్టడీ సెషన్‌ల మధ్య తీసుకునే ప్రాక్టీస్ టెస్ట్ లాంటిది. నిజమైన పరీక్షను పాడు చేయకుండా మీరు ఎంత బాగా నేర్చుకుంటున్నారో ఇది చెబుతుంది. మీ ప్రాక్టీస్ టెస్ట్ స్కోర్‌లు తగ్గడం ప్రారంభిస్తూ, మీ స్టడీ నోట్స్ స్కోర్‌లు పెరుగుతూ ఉంటే, ఏదో తప్పు జరుగుతోందని తెలుస్తుంది.

ట్రైనింగ్ ఎప్పుడు ఆపాలి

ఎప్పుడు ఆపాలో తెలుసుకోవడం కీలకం. తక్కువగా ట్రైన్ చేస్తే మోడల్ అండర్‌ఫిట్ అవుతుంది. ఎక్కువగా ట్రైన్ చేస్తే ఓవర్‌ఫిట్ అవుతుంది. వాలిడేషన్ లాస్ మెరుగుపడటం ఆగిపోయిన చోటు మధ్య స్థానం.

ఎర్లీ స్టాపింగ్ అనే టెక్నిక్ దీన్ని ఆటోమేట్ చేస్తుంది:

ప్రతి ఎపాక్ తర్వాత వాలిడేషన్ లాస్‌ను మానిటర్ చేయండి.
నిర్ణీత సంఖ్యలో ఎపాక్‌లు (పేషన్స్ అంటారు) మెరుగుపడకపోతే, ట్రైనింగ్ ఆపండి.
ఉత్తమ ఎపాక్ నుండి వెయిట్‌లకు తిరిగి వెళ్ళండి.

ఇది మోడల్‌ను ఉపయోగకరమైన నేర్చుకోవడం దాటి బట్టీ పట్టడంలోకి జారిపోకుండా నిరోధిస్తుంది.

🧠త్వరిత తనిఖీ

AI ట్రైనింగ్‌లో 'ఎర్లీ స్టాపింగ్' అంటే ఏమిటి?

🤯

కొన్ని ఆధునిక ట్రైనింగ్ రన్‌లు లెర్నింగ్ రేట్ షెడ్యూలింగ్ అనే టెక్నిక్‌ను ఉపయోగిస్తాయి, ఇది ప్రతి స్టెప్‌తో వెయిట్‌లు ఎంత మారతాయో క్రమంగా తగ్గిస్తుంది - పర్వత శిఖరాన్ని చేరుకుంటున్నప్పుడు చిన్న మరియు మరింత జాగ్రత్తగా అడుగులు వేయడం లాంటిది.

ముఖ్యమైన అంశాలు

ట్రైనింగ్ లూప్ పునరావృతమవుతుంది: అంచనా → పోల్చు → సర్దుబాటు → పునరావృతం.
లాస్ ఫంక్షన్ ప్రిడిక్షన్‌లు నిజం నుండి ఎంత దూరంలో ఉన్నాయో కొలుస్తుంది.
ఎపాక్ ట్రైనింగ్ డేటా గుండా ఒక పూర్తి పాస్.
ఓవర్‌ఫిట్టింగ్ అంటే డేటాను బట్టీ పట్టడం; అండర్‌ఫిట్టింగ్ అంటే తగినంత నేర్చుకోకపోవడం.
డేటా ట్రైనింగ్, వాలిడేషన్, మరియు టెస్ట్ సెట్‌లుగా విభజించబడుతుంది.
ఎర్లీ స్టాపింగ్ ట్రైనింగ్ మరీ ఎక్కువగా వెళ్ళకుండా నిరోధిస్తుంది.

చివరి పాఠంలో, AI యొక్క నైతిక కోణాలను - పక్షపాతం, న్యాయబద్ధత, గోప్యత, మరియు బాధ్యతాయుతమైన AI ఎలా ఉంటుందో అన్వేషిస్తాము.

AI పునాదులు

AI నైపుణ్యం

కెరీర్ రెడీ

ల్యాబ్

AI మోడల్‌లను ట్రైనింగ్ చేయడం

AI మోడల్‌లను ట్రైనింగ్ చేయడం

ట్రైనింగ్ లూప్

లాస్ ఫంక్షన్‌లు: మోడల్ ఎంత తప్పు?

Discussion

ఎపాక్‌లు: డేటా గుండా ఎన్ని సార్లు?

ఓవర్‌ఫిట్టింగ్: బట్టీ పట్టే విద్యార్థి

అండర్‌ఫిట్టింగ్: చదవని విద్యార్థి

వాలిడేషన్ మరియు టెస్ట్ సెట్‌లు

ట్రైనింగ్ ఎప్పుడు ఆపాలి

ముఖ్యమైన అంశాలు