ஸ்கிக்கிட் கற்றல் - பைத்தானைப் பயன்படுத்தி இயந்திர கற்றல்



ஸ்கிகிட் கற்றல் வலைப்பதிவு பைத்தானில் இயந்திர கற்றலை உங்களுக்கு அறிமுகப்படுத்தும். ஸ்கிக்கிட் கற்றலைப் பயன்படுத்தி லாஜிஸ்டிக் பின்னடைவை நாங்கள் செயல்படுத்தும் பயன்பாட்டு வழக்கு இதில் அடங்கும்.

இந்த வலைப்பதிவில், பைத்தானில் ஸ்கிக்கிட் கற்றல் பற்றி விவாதிப்போம். ஸ்கிக்கிட் கற்றல் பற்றி பேசுவதற்கு முன், இயந்திர கற்றல் என்ற கருத்தை ஒருவர் புரிந்து கொள்ள வேண்டும்மற்றும் எவ்வாறு பயன்படுத்த வேண்டும் என்பதை அறிந்திருக்க வேண்டும் . இயந்திர கற்றல் மூலம், உங்கள் நுண்ணறிவுகளை கைமுறையாக சேகரிக்க வேண்டியதில்லை. உங்களுக்கு ஒரு வழிமுறை தேவை, மீதமுள்ளதை இயந்திரம் உங்களுக்காக செய்யும்! இது உற்சாகமானதல்லவா? பைத்தானைப் பயன்படுத்தி இயந்திரக் கற்றலைச் செயல்படுத்தக்கூடிய ஈர்ப்புகளில் ஸ்கிக்கிட் கற்றல் ஒன்றாகும். அதுதரவு பகுப்பாய்வு மற்றும் சுரங்க நோக்கங்களுக்காக எளிய மற்றும் திறமையான கருவிகளைக் கொண்ட ஒரு இலவச இயந்திர கற்றல் நூலகம்.பின்வரும் தலைப்புகளின் மூலம் உங்களை அழைத்துச் செல்வேன், இது வரவிருக்கும் வலைப்பதிவுகளுக்கான அடிப்படைகளாக செயல்படும்:

இயந்திர கற்றல் என்றால் என்ன?

இயந்திர கற்றல் என்பது ஒரு வகை செயற்கை நுண்ணறிவு ஆகும், இது மென்பொருள் பயன்பாடுகளை தரவிலிருந்து கற்றுக்கொள்ளவும் மனித தலையீடு இல்லாமல் விளைவுகளை கணிப்பதில் மிகவும் துல்லியமாகவும் மாற அனுமதிக்கிறது. ஆனால் அது எப்படி நடக்கும்? அதற்காக, இயந்திரம் சில தரவுகளில் பயிற்சியளிக்கப்பட வேண்டும், அதன் அடிப்படையில், அது ஒரு மாதிரியை உருவாக்க ஒரு வடிவத்தைக் கண்டுபிடிக்கும்.தரவிலிருந்து அறிவைப் பெறுவதற்கும் சக்திவாய்ந்த நுண்ணறிவுகளை வழங்குவதற்கும் இந்த செயல்முறை இயந்திரக் கற்றல் பற்றியது. அதன் செயல்பாட்டைப் பற்றி நன்கு புரிந்துகொள்ள கீழே உள்ள படத்தைப் பார்க்கவும்:





மெஷின் லர்னிங் - ஸ்கிக்கிட் லர்ன் - எடுரேகா

தரவைப் பயன்படுத்தி, கணினி ஒரு வழிமுறையைக் கற்றுக் கொள்கிறது, பின்னர் அதை ஒரு முன்கணிப்பு மாதிரியை உருவாக்க பயன்படுத்துகிறது. பின்னர், நாங்கள் மாதிரியை சரிசெய்கிறோம் அல்லது பின்னூட்ட தரவைப் பயன்படுத்தி மாதிரியின் துல்லியத்தை மேம்படுத்துகிறோம். இந்த பின்னூட்டத் தரவைப் பயன்படுத்தி, மாதிரியை மாற்றியமைத்து, புதிய தரவுத் தொகுப்பில் செயல்பாட்டைக் கணிக்கிறோம். நாங்கள் செய்வோம்ஒரு விவாதிக்க வேண்டும் வழக்கு பயன்படுத்த உங்கள் குறிப்பிட்ட சிக்கலுக்கு இது ஒரு நல்ல பொருத்தமாக இருக்குமா இல்லையா என்பதைப் பற்றிய சிறந்த உணர்வைத் தர உதவும் தரவைப் பயிற்றுவித்து சோதிக்கும் வழிமுறையின் அணுகுமுறைகளில் ஒன்றாகும்.



அடுத்து, இயந்திர கற்றல் மூன்று வகைகள்:

    • மேற்பார்வை கற்றல் : இது பயிற்சி தரவுத்தொகுப்பிலிருந்து ஒரு வழிமுறை கற்றல் செயல்முறையாகும். மேற்பார்வை கற்றல் என்பது உள்ளீட்டு மாறி (எக்ஸ்) மற்றும் வெளியீட்டு மாறி (ஒய்) ஆகியவற்றுக்கு இடையில் ஒரு மேப்பிங் செயல்பாட்டை உருவாக்குவதோடு, அவற்றுக்கிடையே ஒரு செயல்பாட்டை உருவாக்க ஒரு வழிமுறையைப் பயன்படுத்துகிறீர்கள். இது முன்கணிப்பு மாடலிங் என்றும் அழைக்கப்படுகிறது, இது தரவைப் பயன்படுத்தி கணிப்புகளைச் செய்வதற்கான செயல்முறையைக் குறிக்கிறது. லீனியர் பின்னடைவு, லாஜிஸ்டிக் பின்னடைவு, முடிவு மரம், சீரற்ற காடு மற்றும் நைவ் பேய்ஸ் வகைப்படுத்தி ஆகியவை சில வழிமுறைகளில் அடங்கும். மேற்பார்வையிடப்பட்ட கற்றலின் பயன்பாட்டு வழக்கைப் பற்றி மேலும் விவாதிப்போம் லாஜிஸ்டிக் பின்னடைவு .
    • மேற்பார்வை செய்யப்படாத கற்றல் : இது பெயரிடப்படாத ஒரு தகவலைப் பயன்படுத்தி ஒரு மாதிரி பயிற்சி பெறும் ஒரு செயல்முறை. இந்த செயல்முறை அவற்றின் புள்ளிவிவர பண்புகளின் அடிப்படையில் வகுப்புகளில் உள்ளீட்டு தரவை கொத்து செய்ய பயன்படுத்தலாம். மேற்பார்வை செய்யப்படாத கற்றல் சிகாந்தி பகுப்பாய்வு என்பது பொருள்களை விவரிக்கும் தரவுகளில் காணப்படும் தகவல்களின் அடிப்படையில் அல்லது அவற்றின் உறவை அடிப்படையாகக் கொண்ட பொருள்களின் தொகுப்பைக் குறிக்கிறது. ஒரு குழுவில் உள்ள பொருள்கள் ஒருவருக்கொருவர் ஒத்ததாக இருக்க வேண்டும், ஆனால் மற்றொரு குழுவில் உள்ள பொருட்களிலிருந்து வேறுபட்டதாக இருக்க வேண்டும் என்பதே குறிக்கோள். சில வழிமுறைகளில் கே-பொருள் கிளஸ்டரிங், படிநிலை கிளஸ்டரிங் போன்றவை அடங்கும்.
    • வலுவூட்டல் கற்றல்: வலுவூட்டல் கற்றல் என்பது ஒரு இடம் அல்லது சூழலுடன் தொடர்புகொள்வதன் மூலம் கற்றல்.ஒரு ஆர்.எல் முகவர் வெளிப்படையாக கற்பிப்பதை விட, அதன் செயல்களின் விளைவுகளிலிருந்து கற்றுக்கொள்கிறார். இது அதன் கடந்த கால அனுபவங்களின் (சுரண்டல்) அடிப்படையிலும், புதிய தேர்வுகள் (ஆய்வு) மூலமாகவும் அதன் செயல்களைத் தேர்ந்தெடுக்கிறது.

ஸ்கிக்கிட் கற்றல் பற்றிய கண்ணோட்டம்

பைக்கானில் இயந்திரக் கற்றலைச் செய்யப் பயன்படுத்தப்படும் ஒரு நூலகம் ஸ்கிக்கிட் கற்றல். ஸ்கிக்கிட் கற்றல் என்பது ஒரு திறந்த மூல நூலகமாகும், இது பி.எஸ்.டி.யின் கீழ் உரிமம் பெற்றது மற்றும் பல்வேறு சூழல்களில் மீண்டும் பயன்படுத்தக்கூடியது, கல்வி மற்றும் வணிக பயன்பாட்டை ஊக்குவிக்கிறது. இது பைத்தானில் மேற்பார்வை மற்றும் மேற்பார்வை செய்யப்படாத கற்றல் வழிமுறைகளை வழங்குகிறது.ஸ்கிகிட் கற்றல் பிரபலமான வழிமுறைகள் மற்றும் நூலகங்களைக் கொண்டுள்ளது. தவிர, இது பின்வரும் தொகுப்புகளையும் கொண்டுள்ளது:



  • நம்பி
  • மேட்லோட்லிப்
  • SciPy (அறிவியல் பைதான்)

ஸ்கிக்கிட் கற்றலை செயல்படுத்த, முதலில் மேலே உள்ள தொகுப்புகளை இறக்குமதி செய்ய வேண்டும். இந்த நூலகங்களை நீங்கள் அறிந்திருக்கவில்லை என்றால், எனது முந்தைய வலைப்பதிவுகளைப் பார்க்கலாம் மற்றும் . இந்த இரண்டு தொகுப்புகளையும் கட்டளை வரியைப் பயன்படுத்தி பதிவிறக்கம் செய்யலாம் அல்லது நீங்கள் P ஐப் பயன்படுத்துகிறீர்கள்ஒய்வசீகரம், மற்ற தொகுப்புகளுக்கு நீங்கள் செய்யும் அதே வழியில் உங்கள் அமைப்பிற்குச் செல்வதன் மூலம் அதை நேரடியாக நிறுவலாம்.

அடுத்து, இதேபோன்ற முறையில், நீங்கள் Sklearn ஐ இறக்குமதி செய்ய வேண்டும்.Scikit learn என்பது SciPy (Scientific Python) இல் கட்டமைக்கப்பட்டுள்ளது, நீங்கள் Scikit-learn ஐப் பயன்படுத்துவதற்கு முன்பு நிறுவப்பட வேண்டும். இதை நீங்கள் குறிப்பிடலாம் இணையதளம் அதே பதிவிறக்க. மேலும், ஸ்கிப்பி மற்றும் சக்கர தொகுப்பு இல்லாவிட்டால் அதை நிறுவவும், நீங்கள் கீழே உள்ள கட்டளையை தட்டச்சு செய்யலாம்:

குழாய் நிறுவல் ஸ்கிப்பி

நான் ஏற்கனவே பதிவிறக்கம் செய்து நிறுவியிருக்கிறேன், எந்த குழப்பத்திற்கும் நீங்கள் கீழே உள்ள ஸ்கிரீன் ஷாட்டைப் பார்க்கலாம்.

மேலே உள்ள நூலகங்களை இறக்குமதி செய்த பிறகு, ஆழமாக தோண்டி ஸ்கிக்கிட் கற்றல் எவ்வாறு பயன்படுத்தப்படுகிறது என்பதைப் புரிந்துகொள்வோம்.

ஸ்கிக்கிட் கற்றல் மாதிரி தரவுத்தொகுப்புகளுடன் வருகிறது கருவிழி மற்றும் இலக்கங்கள் . நீங்கள் தரவுத்தொகுப்புகளை இறக்குமதி செய்து அவற்றுடன் விளையாடலாம். அதன் பிறகு, நீங்கள் ஆதரவு திசையன் இயந்திரத்தை குறிக்கும் SVM ஐ இறக்குமதி செய்ய வேண்டும். எஸ்.வி.எம் என்பது இயந்திர கற்றலின் ஒரு வடிவமாகும், இது தரவை பகுப்பாய்வு செய்ய பயன்படுகிறது.

ஒரு அட்டவணை டெவலப்பர் என்ன செய்கிறார்

நாம் எங்கே எடுப்போம் என்பதற்கு ஒரு எடுத்துக்காட்டு எடுத்துக்கொள்வோம் இலக்கங்கள் தரவுத்தொகுப்பு மற்றும் அது எங்களுக்கான எண்களை வகைப்படுத்தும், எடுத்துக்காட்டாக- 0 1 2 3 4 5 6 7 8 9. கீழே உள்ள குறியீட்டைப் பார்க்கவும்:

sklearn இறக்குமதி svm இலக்கங்கள் = datasets.load_digits () அச்சு (digits.data) இலிருந்து sklearn இறக்குமதி தரவுத்தொகுப்புகளிலிருந்து plt ஆக matplotlib.pyplot ஐ இறக்குமதி செய்க.

வெளியீடு -

[[0. 0. 5. ..., 0. 0. 0.] [0. 0. 0. ..., 10. 0. 0.] [0. 0. 0. ..., 16. 9. 0.] ..., [0. 0. 1. ..., 6. 0. 0.] [0. 0. 2. ..., 12. 0. 0.] [0. 0. 10. ..., 12. 1. 0.]]

இங்கே நாம் நூலகங்கள், எஸ்.வி.எம், தரவுத்தொகுப்புகளை இறக்குமதி செய்து தரவை அச்சிட்டுள்ளோம். இது தரவு சேமிக்கப்படும் இலக்கங்களின் தரவுகளின் நீண்ட வரிசை. இது வகைப்படுத்த பயன்படுத்தக்கூடிய அம்சங்களுக்கான அணுகலை வழங்குகிறது இலக்கங்கள் மாதிரிகள். அடுத்து, இலக்கு, படங்கள் போன்ற வேறு சில செயல்பாடுகளையும் நீங்கள் முயற்சி செய்யலாம். கீழே உள்ள எடுத்துக்காட்டைக் கவனியுங்கள்:

sklearn இறக்குமதி svm இலக்கங்களிலிருந்து sklearn இறக்குமதி தரவுத்தொகுப்புகளிலிருந்து plt ஆக matplotlib.pyplot ஐ இறக்குமதி செய்க = datasets.load_digits () அச்சு (இலக்கங்கள். இலக்கு) அச்சு (இலக்கங்கள். படங்கள் [0])

வெளியீடு -

[0 1 2 ..., 8 9 8] // தரவின் இலக்கு [[0. 0. 5. 13. 9. 1. 0. 0.] // தரவின் படம் [0. 0. 13. 15. 10. 15. 5. 0.] [0. 3. 15. 2. 0. 11. 8. 0.] [0. 4. 12. 0. 0. 8. 8. 0.] [0. 5. 8. 0. 0. 9. 8. 0.] [0. 4. 11. 0. 1. 12. 7. 0.] [0. 2. 14. 5. 10. 12. 0. 0. ] [0. 0. 6. 13. 10. 0. 0. 0.]]

நீங்கள் மேலே பார்க்க முடியும் என, இலக்கு இலக்கங்கள் மற்றும் இலக்கங்களின் படம் அச்சிடப்படுகின்றன. digits.target என்பதற்கான அடிப்படை உண்மையை அளிக்கிறது இலக்க தரவுத்தொகுப்பு, இது ஒவ்வொரு இலக்க படத்திற்கும் தொடர்புடைய எண். அடுத்து, தரவு எப்போதும் 2D வரிசையாகும், இது ஒரு வடிவத்தைக் கொண்டுள்ளது (n_ மாதிரிகள், n_ அம்சங்கள்), இருப்பினும் அசல் தரவு வேறு வடிவத்தைக் கொண்டிருக்கலாம். ஆனால் இலக்கங்களைப் பொறுத்தவரை, ஒவ்வொரு அசல் மாதிரியும் வடிவத்தின் உருவம் (8,8) மற்றும் அதைப் பயன்படுத்தி அணுகலாம் இலக்கங்கள் . படம்.

கற்றல் மற்றும் முன்கணிப்பு

c ++ இல் வரிசையைப் பயன்படுத்துவது எப்படி

அடுத்து, ஸ்கிக்கிட் கற்றலில், நாங்கள் ஒரு தரவுத்தொகுப்பைப் பயன்படுத்தியுள்ளோம் (சாத்தியமான 10 வகுப்புகளின் மாதிரி, பூஜ்ஜியத்திலிருந்து ஒன்பது வரையிலான இலக்கங்கள்) மற்றும் ஒரு படம் கொடுக்கப்படும்போது இலக்கங்களை நாம் கணிக்க வேண்டும். வகுப்பைக் கணிக்க, எங்களுக்கு ஒரு தேவை மதிப்பீட்டாளர் இது காணப்படாத மாதிரிகள் எந்த வகுப்புகளுக்கு சொந்தமானது என்பதைக் கணிக்க உதவுகிறது. ஸ்கிக்கிட் கற்றலில், வகைப்படுத்தலுக்கான மதிப்பீட்டாளர் எங்களிடம் இருக்கிறார், இது ஒரு பைதான் பொருள், இது முறைகளை செயல்படுத்துகிறது பொருத்தம் (x, y) மற்றும் முன்கணிப்பு (டி). கீழேயுள்ள உதாரணத்தைக் கருத்தில் கொள்வோம்:

sklearn இறக்குமதி svm இலக்கங்கள் = datasets.load_digits () // தரவுத்தொகுப்பு clf = svm.SVC (காமா = 0.001, சி = 100) அச்சு (லென் (இலக்கங்கள்.டேட்டா)) x, y = digits.data [: - 1], digits.target [: - 1] // தரவைப் பயிற்சி clf.fit (x, y) அச்சு ('கணிப்பு:', clf.predict (digits.data [-1]) ) // தரவை கணிக்கவும் plt.imshow (digits.images [-1], cmap = plt.cm.gray_r, interpolation = 'அருகில்') plt.show ()

வெளியீடு -

1796
கணிப்பு: [8]


மேலே உள்ள எடுத்துக்காட்டில், நாங்கள் முதலில் நீளத்தைக் கண்டுபிடித்து 1796 எடுத்துக்காட்டுகளை ஏற்றினோம். அடுத்து, இந்தத் தரவை ஒரு கற்றல் தரவாகப் பயன்படுத்தினோம், அங்கு கடைசி உறுப்பு மற்றும் முதல் எதிர்மறை உறுப்பை சோதிக்க வேண்டும். மேலும், இயந்திரம் சரியான தரவை முன்னறிவித்ததா இல்லையா என்பதை நாம் சரிபார்க்க வேண்டும். அதற்காக, நாங்கள் இலக்கங்களின் படத்தைக் காட்டியிருந்த மேட்லோட்லிப்பைப் பயன்படுத்தினோம்.எனவே முடிவுக்கு, உங்களிடம் இலக்கங்கள் உள்ளன, நீங்கள் இலக்கைப் பெற்றிருக்கிறீர்கள், அதைப் பொருத்திக் கணிக்கிறீர்கள், எனவே நீங்கள் செல்ல நல்லது! இது மிகவும் விரைவானது மற்றும் எளிதானது, இல்லையா?

இலக்கு லேபிள்களை ஒரு படத்துடன் நீங்கள் காட்சிப்படுத்தலாம், கீழேயுள்ள குறியீட்டைப் பார்க்கவும்:

ஒவ்வொரு உறுப்புக்கும் matllotlib.pyplot ஐ sklearn இறக்குமதி தரவுத்தொகுப்புகளிலிருந்து plt ஆக இறக்குமதி செய்க svm இலக்கங்கள் = datasets.load_digits () # ஒரு படத்தில் உள்ள படங்கள் மற்றும் இலக்கு லேபிள்களில் சேரவும் images_and_labels = பட்டியல் (ஜிப் (இலக்கங்கள். குறியீட்டுக்கான பட்டியலில், (படம், லேபிள்) கணக்கீட்டில் (images_and_labels [: 8]): # i + 1-வது நிலையில் pX.subplot (2, 4, குறியீட்டு + 1) இல் 2X4 இன் துணைப்பிரிவைத் துவக்கவும் # படங்களைக் காண்பி எல்லா சப்ளாட்களிலும் plt.imshow (படம், cmap = plt.cm.gray_r, interpolation = 'அருகில்') # ஒவ்வொரு சப்ளாட்டுக்கும் ஒரு தலைப்பைச் சேர்க்கவும் plt.title ('பயிற்சி:' + str (label)) # சதி plt ஐக் காட்டு. காட்டு ()

வெளியீடு-


மேலே உள்ள குறியீட்டில் நீங்கள் காணக்கூடியது போல, ஒரு பட்டியலில் உள்ள படங்கள் மற்றும் இலக்கு லேபிள்களில் சேர ‘ஜிப்’ செயல்பாட்டைப் பயன்படுத்தினோம், பின்னர் அதை ஒரு மாறியில் சேமிக்கிறோம், images_and_labels என்று சொல்லுங்கள். அதன் பிறகு, ஒவ்வொரு நிலையிலும் முதல் எட்டு கூறுகளை 2 ஆல் 4 என்ற கட்டத்தில் குறியிட்டுள்ளோம். அதன்பிறகு, மேட்லோட்லிபின் உதவியுடன் படங்களை காண்பித்தோம், தலைப்பை ‘பயிற்சி’ என்று சேர்த்துள்ளோம்.

வழக்கு பயன்படுத்தவும் - லாஜிஸ்டிக் பின்னடைவைப் பயன்படுத்தி கணிப்பு

சிக்கல் அறிக்கை - ஒரு கார் நிறுவனம் புதிய எஸ்யூவியை சந்தையில் வெளியிட்டுள்ளது. தங்கள் எஸ்யூவியின் விற்பனையைப் பற்றிய முந்தைய தரவைப் பயன்படுத்தி, இதை வாங்க ஆர்வமுள்ள நபர்களின் வகையை அவர்கள் கணிக்க விரும்புகிறார்கள்.

இதற்காக, நான் வைத்திருக்கும் தரவுத்தொகுப்பைப் பார்ப்போம் பயனர் ஐடி, பாலினம், வயது, மதிப்பிடப்பட்ட சம்பளம் மற்றும் வாங்கப்பட்டது நெடுவரிசைகளாக. இது ஒரு மாதிரி தரவுத்தொகுப்பு, நீங்கள் முழு தரவுத்தொகுப்பையும் பதிவிறக்கம் செய்யலாம் இங்கே . PyCharm இல் தரவை இறக்குமதி செய்தவுடன், இது ஓரளவு தெரிகிறது.

இப்போது இந்த தரவைப் புரிந்துகொள்வோம். மேலே உள்ள தரவுத்தொகுப்பில் நீங்கள் காணக்கூடியபடி, ஐடி, பாலினம், வயது போன்ற பிரிவுகள் எங்களிடம் உள்ளன. இப்போது இந்த வகைகளின் அடிப்படையில், நாங்கள் எங்கள் இயந்திரத்தை பயிற்றுவிக்கப் போகிறோம், இல்லை என்று கணிக்கப் போகிறோம். கொள்முதல். எனவே இங்கே, எங்களிடம் உள்ளது சுதந்திர மாறிகள் ‘வயது’, ‘எதிர்பார்க்கப்படும் சம்பளம்’ மற்றும் சார்பு மாறி ‘வாங்கியது’ என. இப்போது நாங்கள் மேற்பார்வையிடப்பட்ட கற்றலைப் பயன்படுத்துவோம், அதாவது லாஜிஸ்டிக் பின்னடைவு வழிமுறை ஏற்கனவே உள்ள தரவைப் பயன்படுத்தி வாங்கும் எண்ணிக்கையைக் கண்டறிய.

முதலில், லாஜிஸ்டிக் பின்னடைவின் கண்ணோட்டத்தைப் பெறுவோம்.

லாஜிஸ்டிக் பின்னடைவு - லாஜிஸ்டிக் பின்னடைவு ஒரு பைனரி வடிவத்தில் முடிவுகளை உருவாக்குகிறது, இது ஒரு வகை சார்ந்த சார்பு மாறியின் விளைவைக் கணிக்கப் பயன்படுகிறது. சார்பு மாறி பைனரி ஆக இருக்கும்போது இது மிகவும் பரவலாகப் பயன்படுத்தப்படுகிறது, அதாவது கிடைக்கக்கூடிய வகைகளின் எண்ணிக்கை இரண்டு, லாஜிஸ்டிக் பின்னடைவின் வழக்கமான வெளியீடுகள் -

  • ஆமாம் மற்றும் இல்லை
  • உண்மை மற்றும் தவறு
  • உயர் மற்றும் குறைந்த
  • பாஸ் மற்றும் தோல்வி

இப்போது குறியீட்டைத் தொடங்க, முதலில் இந்த நூலகங்களை இறக்குமதி செய்வோம் - நம்பி, மேட்லோட்லிப் மற்றும் பாண்டாஸ். பின்வரும் படிகளைப் பின்பற்றுவதன் மூலம் பைச்சரில் பாண்டாக்களை இறக்குமதி செய்வது மிகவும் எளிதானது:

அமைப்புகள் -> தொகுப்பைச் சேர் -> பாண்டாக்கள் -> நிறுவவும்

இதற்குப் பிறகு, தரவுத்தொகுப்பு மற்றும் தனி சார்பு மாறி (வாங்கியவை) மற்றும் சுயாதீன மாறி (வயது, சம்பளம்) ஆகியவற்றை இறக்குமதி செய்வோம்:

dataset = pd.read_csv ('Social_Network_Ads.csv') X = dataset.iloc [:, [2, 3]]. மதிப்புகள் y = dataset.iloc [:, 4] .மதிப்பீடுகள் அச்சு (X) அச்சு (y)

அடுத்த கட்டமாக பயிற்சி மற்றும் தரவை சோதிக்கும். பெயரிடப்பட்ட எல்லா தரவையும் எடுத்து பயிற்சி மற்றும் சோதனை துணைக்குழுக்களாகப் பிரிப்பதே ஒரு பொதுவான உத்தி, இது வழக்கமாக பயிற்சி துணைக்குழுவுக்கு 70-80% மற்றும் சோதனை துணைக்குழுவுக்கு 20-30% என்ற விகிதத்துடன் எடுக்கப்படுகிறது. எனவே, குறுக்கு_மதிப்பீட்டைப் பயன்படுத்தி பயிற்சி மற்றும் சோதனை தொகுப்புகளை உருவாக்கியுள்ளோம்.

sklearn.cross_validation import train_test_split X_train, X_test, y_train, y_test = train_test_split (X, y, test_size = 0.25, random_state = 0)

கீழே காட்டப்பட்டுள்ளபடி ஸ்டாண்டர்ஸ்கேலரைப் பயன்படுத்தி சிறந்த செயல்திறனுக்கான உள்ளீட்டு மதிப்புகளை அளவிடலாம்:

sklearn.preprocessing import இலிருந்து StandardScaler sc = StandardScaler () X_train = sc.fit_transform (X_train) X_test = sc.transform (X_test)

இப்போது எங்கள் லாஜிஸ்டிக் பின்னடைவு மாதிரியை உருவாக்குவோம்.

பொருள்களின் வரிசையை உருவாக்கவும் ஜாவா
sklearn.linear_model import இலிருந்து LogisticRegress classifier = LogisticRegress (random_state = 0) classifier.fit (X_train, y_train)

இதைப் பயன்படுத்தலாம் மற்றும் எங்கள் சோதனை தொகுப்பின் முடிவுகளை கணிக்க முடியும்.

y_pred = classifier.predict (X_test)

இப்போது, ​​எத்தனை கணிப்புகள் துல்லியமாக இருந்தன, எத்தனை பயன்படுத்தவில்லை என்பதை நாம் சரிபார்க்கலாம் குழப்ப அணி . Y ஐ நேர்மறையான நிகழ்வுகளாகவும் N ஐ எதிர்மறை நிகழ்வுகளாகவும் வரையறுப்போம். நான்கு முடிவுகள் 2 * 2 குழப்ப மேட்ரிக்ஸில் வடிவமைக்கப்பட்டுள்ளன, அவை கீழே குறிப்பிடப்பட்டுள்ளன:

sklearn.metrics இறக்குமதி குழப்பம்_மாட்ரிக்ஸ் செ.மீ = குழப்பம்_மாட்ரிக்ஸ் (y_test, y_pred) அச்சு (செ.மீ)

வெளியீடு-

[[65 3] [8 24]]

அடுத்து, எங்கள் குழப்ப மேட்ரிக்ஸின் அடிப்படையில், துல்லியத்தை நாம் கணக்கிட முடியும். எனவே எங்கள் மேலே உள்ள எடுத்துக்காட்டில், துல்லியம் பின்வருமாறு:

= TP + TN / FN + FP

= 65 + 24/65 +3+ 8 + 24

= 89%

இதை நாங்கள் கைமுறையாக செய்துள்ளோம்! இயந்திரம் நமக்கு எவ்வாறு கணக்கிடுகிறது என்பதை இப்போது பார்ப்போம், அதற்காக ஒரு உள்ளடிக்கிய செயல்பாடு ‘துல்லியம்_ஸ்கோர்’ உள்ளது, இது துல்லியத்தை கணக்கிட்டு அச்சிடுகிறது, கீழே காட்டப்பட்டுள்ளது:

sklearn.metrics இறக்குமதி துல்லியம்_ஸ்கோர் // செயல்பாட்டை இறக்குமதி செய்க துல்லியம்_ ஸ்கோர் அச்சு (துல்லியம்_ ஸ்கோர் (y_test, y_pred) * 100) // துல்லியத்தை அச்சிடுகிறது

வெளியீடு -

89.0

ஹர்ரே! 89% துல்லியத்துடன் ஸ்கிக்கிட் கற்றலைப் பயன்படுத்தி லாஜிஸ்டிக் பின்னடைவை வெற்றிகரமாக செயல்படுத்தியுள்ளோம்.

இங்கே கிளிக் செய்க மேற்கண்ட கணிப்பின் முழு முழுமையான மூலத்தைப் பெற பைதான் ஸ்கிக்கிட் கற்றல் நூலகத்தைப் பயன்படுத்துதல்.

இதன் மூலம், மலைப்பாம்பு வழங்க வேண்டிய பல பிரபலமான வழிமுறைகளில் ஒன்றை மட்டுமே நாங்கள் உள்ளடக்கியுள்ளோம்.ஸ்கிக்கிட் நூலகத்தைக் கற்றுக்கொள்வதற்கான அனைத்து அடிப்படைகளையும் நாங்கள் உள்ளடக்கியுள்ளோம்,எனவே நீங்கள் இப்போது பயிற்சி தொடங்கலாம். நீங்கள் எவ்வளவு அதிகமாக பயிற்சி செய்கிறீர்களோ அவ்வளவுக்கு நீங்கள் கற்றுக்கொள்வீர்கள். மேலும் பைதான் டுடோரியல் வலைப்பதிவுகளுக்கு காத்திருங்கள்!

எங்களுக்கு ஒரு கேள்வி கிடைத்ததா? இந்த “ஸ்கிக்கிட் லர்ன்” வலைப்பதிவின் கருத்துகள் பிரிவில் இதைக் குறிப்பிடவும், விரைவில் நாங்கள் உங்களைத் தொடர்புகொள்வோம். பைத்தானைப் பற்றிய ஆழமான அறிவை அதன் பல்வேறு பயன்பாடுகளுடன் பெற, நீங்கள் செய்யலாம் 24/7 ஆதரவு மற்றும் வாழ்நாள் அணுகலுடன் நேரடி ஆன்லைன் பயிற்சிக்கு.