பைத்தானில் லாஜிஸ்டிக் பின்னடைவை எவ்வாறு செய்வது?

சார்பு மற்றும் ஒன்று அல்லது அதற்கு மேற்பட்ட சுயாதீன மாறிகளுக்கு இடையிலான உறவை தீர்மானிப்பதன் மூலம் விளைவுகளை கணிக்க ஸ்கைலார்னைப் பயன்படுத்தி பைத்தானில் லாஜிஸ்டிக் பின்னடைவு.

பைத்தானில் உள்ள லாஜிஸ்டிக் பின்னடைவு ஒரு முன்கணிப்பு பகுப்பாய்வு நுட்பமாகும். பைனரி வகைப்பாடு சிக்கல்களுக்கு இயந்திர கற்றலிலும் இது பயன்படுத்தப்படுகிறது. இந்த வலைப்பதிவில் பைத்தானில் உள்ள லாஜிஸ்டிக் பின்னடைவைப் புரிந்துகொள்ள பின்வரும் தலைப்புகளைப் பார்ப்போம்:

  1. பின்னடைவு என்றால் என்ன?
  2. பைத்தானில் லாஜிஸ்டிக் பின்னடைவு
  3. லாஜிஸ்டிக் பின்னடைவு Vs நேரியல் பின்னடைவு
  4. பயன்பாடு வழக்குகள்
  5. ஆர்ப்பாட்டம்

ஒரு நல்ல புரிதலுக்கான ஆர்ப்பாட்டத்துடன் பைத்தானில் உள்ள லாஜிஸ்டிக் பின்னடைவு குறித்த விரிவான டுடோரியலையும் நீங்கள் குறிப்பிடலாம் அல்லது லாஜிஸ்டிக் பின்னடைவை மாஸ்டர் செய்ய.



பின்னடைவு என்றால் என்ன?

பகுப்பாய்வு ஒரு சக்திவாய்ந்த புள்ளிவிவர பகுப்பாய்வு நுட்பமாகும். அ சார்ந்தது மற்றவர்களின் மதிப்புகளைக் கணிக்க எங்கள் ஆர்வத்தின் மாறுபாடு பயன்படுத்தப்படுகிறது சுதந்திர மாறிகள் தரவு தொகுப்பில்.

எல்லா நேரத்திலும் ஒரு உள்ளுணர்வு வழியில் பின்னடைவைக் காண்கிறோம். கடந்த கால வானிலை நிலைமைகளின் தரவு தொகுப்பைப் பயன்படுத்தி வானிலை முன்னறிவிப்பது போல.

விளைவுகளை பகுப்பாய்வு செய்வதற்கும் கணிப்பதற்கும் இது பல நுட்பங்களைப் பயன்படுத்துகிறது, ஆனால் முக்கியத்துவம் முக்கியமாக உள்ளது சார்பு மாறி மற்றும் ஒன்று அல்லது அதற்கு மேற்பட்ட சுயாதீன மாறி இடையேயான உறவு.

பகுப்பாய்வு ஒரு பைனரி மாறியில் விளைவுகளை முன்னறிவிக்கிறது, இது இரண்டு சாத்தியமான விளைவுகளை மட்டுமே கொண்டுள்ளது.

பைத்தானில் லாஜிஸ்டிக் பின்னடைவு

ஒரு பைனரி மாறியில் விளைவைக் கணிக்க ஒரு சார்பு மாறி மற்றும் ஒன்று அல்லது அதற்கு மேற்பட்ட சுயாதீன மாறிகள் கொண்ட தரவு-தொகுப்பை பகுப்பாய்வு செய்வதற்கான ஒரு நுட்பமாகும், அதாவது இது இரண்டு விளைவுகளை மட்டுமே கொண்டிருக்கும்.

சார்பு மாறி திட்டவட்டமான இயற்கையில். சார்பு மாறி என்றும் குறிப்பிடப்படுகிறது இலக்கு மாறி மற்றும் சுயாதீன மாறிகள் என்று அழைக்கப்படுகின்றன முன்னறிவிப்பாளர்கள் .

லாஜிஸ்டிக் பின்னடைவு என்பது நேரியல் பின்னடைவின் ஒரு சிறப்பு நிகழ்வு ஆகும், அங்கு நாம் ஒரு வகை மாறியில் விளைவை மட்டுமே கணிக்கிறோம். பதிவு செயல்பாட்டைப் பயன்படுத்தி நிகழ்வின் நிகழ்தகவை இது கணிக்கிறது.

நாங்கள் பயன்படுத்துகிறோம் சிக்மாய்டு செயல்பாடு / வளைவு வகைப்படுத்தப்பட்ட மதிப்பைக் கணிக்க. வாசல் மதிப்பு முடிவை தீர்மானிக்கிறது (வெற்றி / இழப்பு).

நேரியல் பின்னடைவு சமன்பாடு: y = β0 + X1X1 + X2X2…. + XnXn

  • Y என்பது கணிக்க வேண்டிய சார்பு மாறியைக் குறிக்கிறது.
  • β0 என்பது Y- இடைமறிப்பு ஆகும், இது அடிப்படையில் y- அச்சைத் தொடும் வரியின் புள்ளியாகும்.
  • β1 என்பது கோட்டின் சாய்வு (சார்பு மாறி மற்றும் சுயாதீன மாறிக்கு இடையிலான உறவைப் பொறுத்து சாய்வு எதிர்மறையாகவோ அல்லது நேர்மறையாகவோ இருக்கலாம்.)
  • எக்ஸ் இங்கே சுயாதீன மாறியைக் குறிக்கிறது, இது எங்கள் விளைவாக சார்ந்த மதிப்பைக் கணிக்கப் பயன்படுகிறது.

சிக்மாய்டு செயல்பாடு: p = 1/1 + இ-ஒய்

நேரியல் பின்னடைவு சமன்பாட்டில் சிக்மாய்டு செயல்பாட்டைப் பயன்படுத்துங்கள்.

பைதான்-எடுரேகாவில் லாஜிஸ்டிக் பின்னடைவு

லாஜிஸ்டிக் பின்னடைவு சமன்பாடு: p = 1/1 + இ- (β0 + X1X1 + X2X2…. + XnXn)

பல்வேறு வகையான லாஜிஸ்டிக் பின்னடைவைப் பார்ப்போம்.

லாஜிஸ்டிக் பின்னடைவு வகைகள்

சதுரத்தில் நடைமுறை என்ன?
    • பைனரி லாஜிஸ்டிக் பின்னடைவு - இது இரண்டு சாத்தியமான விளைவுகளை மட்டுமே கொண்டுள்ளது. எடுத்துக்காட்டு- ஆம் அல்லது இல்லை
    • பல்லுறுப்பு லாஜிஸ்டிக் பின்னடைவு - இது மூன்று அல்லது அதற்கு மேற்பட்ட பெயரளவு வகைகளைக் கொண்டுள்ளது. எடுத்துக்காட்டு- பூனை, நாய், யானை.
    • சாதாரண லாஜிஸ்டிக் பின்னடைவு- இது மூன்று அல்லது அதற்கு மேற்பட்ட ஆர்டினல் வகைகளைக் கொண்டுள்ளது, ஆர்டினல் அதாவது பிரிவுகள் ஒரு வரிசையில் இருக்கும். எடுத்துக்காட்டு- பயனர் மதிப்பீடுகள் (1-5).

லீனியர் Vs லாஜிஸ்டிக் பின்னடைவு

நேரியல் பின்னடைவு இருக்க முடியும் எல்லையற்ற சாத்தியமான மதிப்புகள், லாஜிஸ்டிக் பின்னடைவு உள்ளது திட்டவட்டமான முடிவுகள் .

மறுமொழி மாறி இயற்கையில் தொடர்ச்சியாக இருக்கும்போது நேரியல் பின்னடைவு பயன்படுத்தப்படுகிறது, ஆனால் பதில் மாறி இயற்கையில் திட்டவட்டமாக இருக்கும்போது லாஜிஸ்டிக் பின்னடைவு பயன்படுத்தப்படுகிறது.

கடந்த கால பரிவர்த்தனை விவரங்களைப் பயன்படுத்தி ஒரு வங்கியில் இயல்புநிலையை முன்னறிவிப்பது லாஜிஸ்டிக் பின்னடைவுக்கு ஒரு எடுத்துக்காட்டு, அதே நேரத்தில் பங்குச் சந்தை மதிப்பெண் போன்ற தொடர்ச்சியான வெளியீடு நேரியல் பின்னடைவுக்கு ஒரு எடுத்துக்காட்டு.

பயன்பாடு வழக்குகள்

லாஜிஸ்டிக் பின்னடைவைப் பயன்படுத்தக்கூடிய பயன்பாட்டு வழக்குகள் பின்வருமாறு.

வானிலை கணிப்பு

வானிலை கணிப்புகள் தர்க்கரீதியான பின்னடைவின் விளைவாகும். இங்கே, முந்தைய வானிலை அறிக்கைகளின் தரவை நாங்கள் பகுப்பாய்வு செய்கிறோம் மற்றும் ஒரு குறிப்பிட்ட நாளுக்கு சாத்தியமான விளைவுகளை கணிக்கிறோம். ஆனால் தருக்க பின்னடைவு என்பது மழை பெய்யுமா இல்லையா என்பது போன்ற திட்டவட்டமான தரவை மட்டுமே கணிக்கும்.

நோயைத் தீர்மானித்தல்

நம்மால் முடியும்பயன்பாடுஎந்தவொரு சந்தர்ப்பத்திலும் நோய் நேர்மறையானதா அல்லது எதிர்மறையானதா என்பதைக் கணிக்க நோயாளியின் மருத்துவ வரலாற்றின் உதவியுடன் தருக்க பின்னடைவு.

லாஜிஸ்டிக் பின்னடைவைப் பயன்படுத்தி ஒரு முன்கணிப்பு மாதிரியை உருவாக்க மாதிரி தரவு-தொகுப்பை எடுக்கலாம்.

டெமோ

நாங்கள் ஒரு கணிப்பு மாதிரியை உருவாக்கப் போகிறோம்பயன்படுத்திஉதவியுடன் பைத்தானில் தருக்க பின்னடைவுofஒரு தரவுத்தொகுப்பு,இதில்தர்க்கரீதியான பின்னடைவை அடைய பின்வரும் படிகளை நாங்கள் மறைக்கப் போகிறோம்.

தரவு சேகரித்தல்

லாஜிஸ்டிக் பின்னடைவை செயல்படுத்துவதற்கான முதல் படி தரவை சேகரிப்பதாகும். தரவு அமைப்பைக் கொண்ட சி.எஸ்.வி கோப்பை பாண்டாக்களைப் பயன்படுத்தி நிரல்களில் ஏற்றுவோம். தொடர்புடைய தரவுகளுக்கிடையேயான உறவை பகுப்பாய்வு செய்வதன் மூலம், ஒரு வீட்டு விளையாட்டு அல்லது தொலைதூர விளையாட்டின் சாத்தியத்தை கணிக்க முன்கணிப்பு மாதிரியை உருவாக்க NBA தரவைப் பயன்படுத்துகிறோம்.

பாண்டாக்களை பி.டி.

எளிதான பகுப்பாய்விற்கு நீங்கள் எல்லா தரவையும் படிக்கக்கூடிய வடிவத்தில் பெறுவீர்கள். உங்கள் மாதிரியின் சார்பு மற்றும் சுயாதீன மாறிகளை நீங்கள் தீர்மானிக்க முடியும்.

தரவை பகுப்பாய்வு செய்தல்

மாறிகளுக்கு இடையிலான உறவைத் தீர்மானிக்க தரவு-தொகுப்பு பகுப்பாய்வு செய்யப்படுகிறது. மாறிகளுக்கு இடையிலான உறவை சரிபார்க்க வெவ்வேறு அடுக்குகளை உருவாக்குவதன் மூலம்.

sns.countplot ('முகப்பு', சாயல் = 'WINorLOSS', தரவு = df) plt.show ()

வீடு / தொலைதூர விளையாட்டைப் பொறுத்தவரை வெற்றி / இழப்பு சதவீதத்திற்கு இடையிலான உறவு மேலே உள்ளது. எஸ்சமமாகதரவில் உள்ள பிற தொடர்புடைய உள்ளீடுகளுக்கு இடையிலான உறவின் வரைபடத்தை நாங்கள் திட்டமிடலாம்.

தரவு மோதல்

இலக்கு மாறிக்கு ஏற்ப தரவு-தொகுப்பு மாற்றியமைக்கப்படுகிறது. எல்லா பூஜ்ய மதிப்புகள் மற்றும் சரம் மதிப்புகளையும் டேட்டாஃப்ரேமிலிருந்து அகற்றுவோம்.

அச்சு (df.isnull (). தொகை ())

முன்கணிப்பு மாதிரியை உருவாக்கும்போது தேவைப்படாத பூஜ்ய மதிப்புகள் மற்றும் மதிப்புகள் போன்ற பொருத்தமற்ற எல்லா தரவையும் நாங்கள் சோதிப்போம். நாங்கள் பயன்படுத்தும் NBA தரவுத்தொகுப்பில் பூஜ்ய மதிப்புகள் எதுவும் இல்லை என்றால், தரவைப் பிரிப்பதைத் தொடருவோம்.

சோதனை மற்றும் ரயில் தரவு

மாதிரியின் செயல்திறனுக்காக தரவு சோதனை தரவு மற்றும் ரயில் தரவுகளாக பிரிக்கப்படுகிறது. ஐப் பயன்படுத்தி தரவு பிரிக்கப்படுகிறது ரயில்_ சோதனை_வெளி . இங்குள்ள தரவு 70:30 என்ற விகிதத்தில் பிரிக்கப்பட்டுள்ளது.

ஜாவாவில் சரத்தை இன்றுவரை மாற்றுகிறது

இப்போது, ​​க்கு மாதிரி கணிப்பு லாஜிஸ்டிக் பின்னடைவு செயல்பாடு sklearn தொகுதியில் லாஜிஸ்டிக் பின்னடைவு மாதிரியை இறக்குமதி செய்வதன் மூலம் செயல்படுத்தப்படுகிறது.

பொருத்தம் செயல்பாட்டைப் பயன்படுத்தி ரயில் பெட்டியில் இந்த மாதிரி பொருந்தும். இதற்குப் பிறகு முன்கணிப்பு செயல்பாட்டைப் பயன்படுத்தி முன்கணிப்பு செய்யப்படுகிறது.

sklearn.model_selection இறக்குமதி ரயில்_டெஸ்ட்_ஸ்பிளிட்டிலிருந்து sklearn.linear_model இறக்குமதி sklearn.metrics இறக்குமதி வகைப்பாடு_ sklearn இலிருந்து அறிக்கை இறக்குமதி. மெட்ரிக்ஸ் இறக்குமதி குழப்பம்_மாட்ரிக்ஸ், துல்லியம்_ ஸ்கோர் x = df.drop ('முகப்பு', அச்சு = 1) y = df ['முகப்பு'] x_train x_test, y_train, y_test = train_test_split (x, y, test_size = 0.33, random_state = 1) logmodel = LogisticRegress () logmodel.fit (x_train, y_train) கணிப்புகள் = logmodel.predict (x_test) print (classification_report) அச்சிடு (குழப்பம்_மாட்ரிக்ஸ் (y_test, கணிப்புகள்)) அச்சு (துல்லியம்_ மதிப்பெண் (y_test, கணிப்புகள்))

வகைப்பாடு அறிக்கை:

வகைப்பாடு அறிக்கை காட்டுகிறது துல்லியம் , நினைவுகூருங்கள், எஃப் 1 மற்றும் ஆதரவு மாதிரிக்கான மதிப்பெண்கள்.

துல்லியம் மதிப்பெண் என்பது மாதிரியால் கணிக்கப்பட்ட துல்லியமான அளவைக் குறிக்கிறது. ஒரு வீட்டு விளையாட்டுக்கான துல்லியம் 0.62 மற்றும் தொலைதூர விளையாட்டு 0.58 .

நினைவு கூருங்கள் மாதிரியின் முடிவை கணிக்கக்கூடிய அளவு. ஒரு வீட்டு விளையாட்டுக்கு நினைவுகூருங்கள் 0.57 மற்றும் ஒரு தொலைதூர விளையாட்டு 0.64 . எஃப் 1 மற்றும் ஆதரவு மதிப்பெண்கள் என்பது கணிப்புகளுக்கு சோதிக்கப்பட்ட தரவுகளின் அளவு. NBA தரவு-தொகுப்பில் வீட்டு விளையாட்டுக்காக சோதிக்கப்பட்ட தரவு 1662 மற்றும் தொலைதூர விளையாட்டு 1586 .

குழப்ப அணி:

குழப்ப மேட்ரிக்ஸ் என்பது ஒரு கணிப்பு மாதிரியின் செயல்திறனை விவரிக்கும் ஒரு அட்டவணை. ஒரு குழப்ப அணி உண்மையான மதிப்புகள் மற்றும் கணிக்கப்பட்ட மதிப்புகளைக் கொண்டுள்ளது. மாதிரியின் துல்லிய மதிப்பெண்ணைக் கணக்கிட இந்த மதிப்புகளைப் பயன்படுத்தலாம்.

குழப்ப மேட்ரிக்ஸ் ஹீட்மேப்:

கடற்புலியைப் பயன்படுத்தி குழப்ப மேட்ரிக்ஸின் வெப்ப-வரைபடத்தைத் திட்டமிடலாம் நாங்கள் உருவாக்கிய கணிப்பு மாதிரியைக் காட்சிப்படுத்த. ஒரு வெப்ப வரைபடத்தைத் திட்டமிட, பின்வரும் தொடரியல் அவசியம்.

sns.heatmap (pd.DataFrame (குழப்பம்_மாட்ரிக்ஸ் (y_test, கணிப்புகள்))) plt.show ()

ஹீட்மாப்பைப் பார்ப்பதன் மூலம், பின்வருவனவற்றை நாம் முடிக்கலாம்:

  • எல்லா கணிப்புகளிலும், வகைப்படுத்தி மொத்தம் 1730 தடவைகளுக்கு ஆம் என்று கணித்துள்ளது, அவற்றில் 1012 உண்மையானவை.
  • எல்லா கணிப்புகளிலும், வகைப்படுத்தி மொத்தம் 1518 தடவைகள் இல்லை என்று கணித்துள்ளது, அவற்றில் 944 உண்மையான எண் இல்லை.

குழப்ப மேட்ரிக்ஸின் இந்த பகுப்பாய்வு மூலம் எங்கள் கணிப்பு மாதிரிக்கான துல்லிய மதிப்பெண்ணை முடிக்க முடியும்.

துல்லிய மதிப்பெண்:

துல்லியம் மதிப்பெண் என்பது மாதிரியால் செய்யப்பட்ட கணிப்புகளின் துல்லியத்தின் சதவீதமாகும். எங்கள் மாதிரியைப் பொறுத்தவரை துல்லியம் மதிப்பெண் 0.60 ஆகும், இது கணிசமாக மிகவும் துல்லியமானது. ஆனால் துல்லியமான மதிப்பெண் எவ்வளவு திறமையானது என்பது நீங்கள் கணிக்கும் மாதிரி. சிறந்த முன்கணிப்பு மாதிரிக்கு அதிக துல்லியத்தன்மை மதிப்பெண்ணை நீங்கள் எப்போதும் குறிக்க வேண்டும்.

மேலே விவாதிக்கப்பட்ட படிகளைப் பின்பற்றுவதன் மூலம், NBA தரவுத்தொகுப்பைப் பயன்படுத்தி வீடு / தொலைதூர விளையாட்டுக்கான சாத்தியத்தை நாங்கள் கணித்துள்ளோம். வகைப்பாடு அறிக்கையை ஆராய்ந்த பிறகு, ஒரு வீடு / தொலைதூர விளையாட்டின் சாத்தியத்தை நாம் கருதலாம்.

இந்த வலைப்பதிவில் பைதான் கருத்துக்களில் உள்ள லாஜிஸ்டிக் பின்னடைவு, இது நேரியல் அணுகுமுறையிலிருந்து எவ்வாறு வேறுபடுகிறது என்பதைப் பற்றி விவாதித்தோம். மேலும், நாங்கள் NBA தரவுத்தொகுப்பைப் பயன்படுத்தி ஒரு ஆர்ப்பாட்டத்தை உள்ளடக்கியுள்ளோம். மேலும் நுண்ணறிவு மற்றும் பயிற்சிக்கு, நீங்கள் விரும்பும் தரவுத்தொகுப்பைப் பயன்படுத்தலாம் மற்றும் பைத்தானில் லாஜிஸ்டிக் பின்னடைவைச் செயல்படுத்த விவாதிக்கப்பட்ட படிகளைப் பின்பற்றலாம்.

மேலும், உங்களில் உள்ள தரவு விஞ்ஞானியை மாஸ்டர் செய்ய எடூரெகா மேடையில் பல்வேறு தரவு-அறிவியல் வலைப்பதிவுகளைப் பாருங்கள்.

நீங்கள் பைத்தானைக் கற்றுக் கொள்ள விரும்பினால் மற்றும் தரவு அறிவியலில் ஒரு தொழிலை உருவாக்க விரும்பினால், எங்கள் ஊடாடும், நேரடி-ஆன்லைனில் பாருங்கள் இங்கே, இது உங்கள் கற்றல் காலம் முழுவதும் உங்களுக்கு வழிகாட்ட 24 * 7 ஆதரவுடன் வருகிறது.
கேள்வி இருக்கிறதா? கருத்துகளில் இதைக் குறிப்பிடவும், நாங்கள் உங்களைத் தொடர்புகொள்வோம்.