న్యూరల్ నెట్వర్క్లు వెయిట్లు మరియు బయాసులను సర్దుబాటు చేయడం ద్వారా నేర్చుకుంటాయని మీకు ఇప్పుడు తెలుసు. కానీ పూర్తి ట్రైనింగ్ ప్రక్రియ నిజంగా ఎలా పనిచేస్తుంది? మోడల్ తగినంత నేర్చుకుందని - లేదా ఎక్కువగా నేర్చుకుందని - మీకు ఎలా తెలుస్తుంది? ఈ పాఠంలో, మొత్తం ట్రైనింగ్ ప్రయాణం గుండా నడుస్తాము.
AI మోడల్ను ట్రైన్ చేయడం పదే పదే పునరావృతమయ్యే ఒక చక్రాన్ని అనుసరిస్తుంది:
ఈ లూప్ వేలాది లేదా మిలియన్ల సార్లు నడుస్తుంది. ప్రతి పునరావృతం మోడల్ను సరైన సమాధానాలకు కొద్దిగా దగ్గరగా నెట్టుతుంది.
GPT-4 ను ట్రైన్ చేయడానికి కేవలం కంప్యూటింగ్ పవర్లోనే $100 మిలియన్ కంటే ఎక్కువ ఖర్చయినట్లు తెలిసింది. ట్రైనింగ్ లూప్ నెలల తరబడి వేలాది ప్రత్యేక చిప్లపై నడిచింది.
ప్రతి ప్రిడిక్షన్ తర్వాత, మోడల్ ఎంత తప్పుగా ఉందో కొలవడానికి ఒక మార్గం అవసరం. ఈ కొలతను లాస్ (లేదా కాస్ట్) అంటారు, దాన్ని లెక్కించే ఫార్ములా లాస్ ఫంక్షన్.
డార్ట్బోర్డ్లా ఆలోచించండి. బుల్స్ఐ సరైన సమాధానం. లాస్ అంటే మీ డార్ట్ పడిన చోటు నుండి బుల్స్ఐకి ఉన్న దూరం. ట్రైనింగ్ లక్ష్యం కాలక్రమేణా ఆ దూరాన్ని కనిష్టీకరించడం.
సాధారణ లాస్ ఫంక్షన్లు:
Sign in to join the discussion
AI ట్రైనింగ్లో లాస్ ఫంక్షన్ ఏమి కొలుస్తుంది?
మొత్తం ట్రైనింగ్ డేటాసెట్ గుండా ఒక పూర్తి పాస్ను ఎపాక్ అంటారు. ట్రైనింగ్లో సాధారణంగా అనేక ఎపాక్లు ఉంటాయి - మోడల్ అదే డేటాను అనేక సార్లు చూస్తుంది, ప్రతి రౌండ్లో కొద్దిగా మెరుగుపడుతుంది.
పరీక్ష కోసం రివిజన్ చేయడం ఎపాక్లు నడపడం లాంటిది. మొదటి చదివినప్పుడు గందరగోళంగా ఉంటుంది, కానీ ప్రతి సమీక్ష అవగాహనను నిర్మిస్తుంది. అయితే, అదే నోట్స్ను వంద సార్లు మళ్ళీ చదివితే, భావనలను నిజంగా అర్థం చేసుకోకుండా ఖచ్చితమైన పదాలను బట్టీ పట్టవచ్చు. AI కి కూడా ఇదే సమస్య ఉంది.
ఓవర్ఫిట్టింగ్ AI ట్రైనింగ్లో అత్యంత సాధారణ సమస్యలలో ఒకటి. మోడల్ ట్రైనింగ్ డేటాను మరీ బాగా నేర్చుకున్నప్పుడు - దాని శబ్దం మరియు వింతలతో సహా - కొత్త, చూడని డేటాపై పనిచేయడంలో విఫలమైనప్పుడు ఇది జరుగుతుంది.
గత పరీక్ష పేపర్లన్నీ పదానికి పదం బట్టీ పట్టిన విద్యార్థిని ఊహించుకోండి. వారు పాత పేపర్లలో ఖచ్చితంగా స్కోర్ చేస్తారు కానీ ప్రశ్నలు కొద్దిగా మారినా కష్టపడతారు. విద్యార్థి విషయాన్ని నేర్చుకోలేదు - వారు సమాధానాలను బట్టీ పట్టారు.
ఓవర్ఫిట్టింగ్ సంకేతాలు:
ట్రైనింగ్ లక్ష్యం మోడల్ ఇప్పటికే చూసిన డేటాపై ఖచ్చితంగా స్కోర్ చేయడం కాదు. ఇది ఎప్పుడూ చూడని డేటాపై బాగా పనిచేయడం. అదే నేర్చుకోవడం యొక్క నిజమైన పరీక్ష.
వ్యతిరేక సమస్య అండర్ఫిట్టింగ్. మోడల్ డేటా నుండి తగినంత నేర్చుకోనప్పుడు ఇది జరుగుతుంది. ఇది ట్రైనింగ్ డేటా మరియు కొత్త డేటా రెండింటిపై తక్కువగా పనిచేస్తుంది.
అండర్ఫిట్టింగ్ కారణాలు:
ఓవర్ఫిట్టింగ్ గత పేపర్లను బట్టీ పట్టడం అయితే, అండర్ఫిట్టింగ్ అనేది టెక్స్ట్బుక్ దాదాపు తెరవకుండా పరీక్షలోకి నడిచి వెళ్ళడం లాంటిది.
ట్రైనింగ్ డేటాపై మోడల్ 98% ఆక్యురసీ స్కోర్ చేస్తుంది కానీ కొత్త డేటాపై కేవలం 60%. అత్యంత సంభావ్య సమస్య ఏమిటి?
ఓవర్ఫిట్టింగ్ మరియు అండర్ఫిట్టింగ్ను గుర్తించడానికి, మన డేటాను మూడు భాగాలుగా విభజిస్తాము:
| సెట్ | ఉద్దేశ్యం | ఎప్పుడు ఉపయోగించబడుతుంది | |-----|---------|-----------| | ట్రైనింగ్ సెట్ | మోడల్ ఈ డేటా నుండి నేర్చుకుంటుంది | ట్రైనింగ్ సమయంలో | | వాలిడేషన్ సెట్ | ప్రగతిని తనిఖీ చేయడానికి మరియు సెట్టింగ్లను ట్యూన్ చేయడానికి ఉపయోగించబడుతుంది | ట్రైనింగ్ సమయంలో | | టెస్ట్ సెట్ | పూర్తిగా చూడని డేటాపై చివరి ఎవాల్యుయేషన్ | ట్రైనింగ్ తర్వాత |
సాధారణ విభజన 70% ట్రైనింగ్, 15% వాలిడేషన్, మరియు 15% టెస్ట్. మోడల్ చివరి వరకు టెస్ట్ సెట్ను ఎప్పుడూ చూడదు - ఇది తుది పరీక్ష.
వాలిడేషన్ సెట్ స్టడీ సెషన్ల మధ్య తీసుకునే ప్రాక్టీస్ టెస్ట్ లాంటిది. నిజమైన పరీక్షను పాడు చేయకుండా మీరు ఎంత బాగా నేర్చుకుంటున్నారో ఇది చెబుతుంది. మీ ప్రాక్టీస్ టెస్ట్ స్కోర్లు తగ్గడం ప్రారంభిస్తూ, మీ స్టడీ నోట్స్ స్కోర్లు పెరుగుతూ ఉంటే, ఏదో తప్పు జరుగుతోందని తెలుస్తుంది.
ఎప్పుడు ఆపాలో తెలుసుకోవడం కీలకం. తక్కువగా ట్రైన్ చేస్తే మోడల్ అండర్ఫిట్ అవుతుంది. ఎక్కువగా ట్రైన్ చేస్తే ఓవర్ఫిట్ అవుతుంది. వాలిడేషన్ లాస్ మెరుగుపడటం ఆగిపోయిన చోటు మధ్య స్థానం.
ఎర్లీ స్టాపింగ్ అనే టెక్నిక్ దీన్ని ఆటోమేట్ చేస్తుంది:
ఇది మోడల్ను ఉపయోగకరమైన నేర్చుకోవడం దాటి బట్టీ పట్టడంలోకి జారిపోకుండా నిరోధిస్తుంది.
AI ట్రైనింగ్లో 'ఎర్లీ స్టాపింగ్' అంటే ఏమిటి?
కొన్ని ఆధునిక ట్రైనింగ్ రన్లు లెర్నింగ్ రేట్ షెడ్యూలింగ్ అనే టెక్నిక్ను ఉపయోగిస్తాయి, ఇది ప్రతి స్టెప్తో వెయిట్లు ఎంత మారతాయో క్రమంగా తగ్గిస్తుంది - పర్వత శిఖరాన్ని చేరుకుంటున్నప్పుడు చిన్న మరియు మరింత జాగ్రత్తగా అడుగులు వేయడం లాంటిది.
చివరి పాఠంలో, AI యొక్క నైతిక కోణాలను - పక్షపాతం, న్యాయబద్ధత, గోప్యత, మరియు బాధ్యతాయుతమైన AI ఎలా ఉంటుందో అన్వేషిస్తాము.