லினக்ஸில் அப்பாச்சி பன்றி நிறுவல்



இந்த வலைப்பதிவு லினக்ஸ் சூழலில் அப்பாச்சி பன்றி நிறுவலுக்கான படி வழிகாட்டியாகும். நாங்கள் அப்பாச்சி பன்றி 0.16.0 ஐ நிறுவி வெவ்வேறு முறைகளில் இயக்குவோம்.

இந்த பதிவில், நான் பேசுவேன் லினக்ஸில் அப்பாச்சி பன்றி நிறுவல் . அப்பாச்சி பன்றி மற்றும் பன்றி லத்தீன் ஆகியவற்றின் அடிப்படை வரையறையுடன் ஆரம்பிக்கலாம்.

அப்பாச்சி பன்றி ஹடூப்புடன் பயன்படுத்தப்படும் வரைபடக் குறைப்பு நிரலை உருவாக்கி செயல்படுத்துவதற்கான ஒரு கருவி / தளம். இது பெரிய அளவிலான தரவுகளை பகுப்பாய்வு செய்வதற்கான ஒரு கருவி / தளமாகும். அப்பாச்சி பன்றி என்பது வரைபடத்தை விட ஒரு சுருக்கமாகும் என்று நீங்கள் கூறலாம். ஜாவாவில் அவ்வளவு சிறப்பாக இல்லாத புரோகிராமர்கள் ஹடூப்பில் பணிபுரிய சிரமப்பட்டனர், முக்கியமாக மேப்ரூட் வேலைகளை எழுதும் போது.எனவே, கற்றுக்கொள்வதற்கும் தேர்ச்சி பெறுவதற்கும் இது ஒரு முக்கியமான தலைப்பு .அப்பாச்சி பன்றிக்கு அதன் சொந்த மொழி உள்ளது பன்றி லத்தீன் இது ஏழை புரோகிராமர்களுக்கு வரம்.





பிக் லத்தீன் மொழியின் அடிப்படை அறிமுகம் உங்களுக்கு நன்றாக புரிந்துகொள்ள உதவும்:

அப்பாச்சி பன்றி மேடையில் பயன்படுத்தப்படும் உயர் மட்ட நடைமுறை மொழி என்று அழைக்கப்படுகிறது பன்றி லத்தீன் . அப்பாச்சி பிக் ‘பன்றி லத்தீன்’ அம்சங்களைக் கொண்டுள்ளது, இது ஒப்பீட்டளவில் எளிமையான மொழியாகும், இது ஹடூப் கோப்பு முறைமையில் (எச்டிஎஃப்எஸ்) விநியோகிக்கப்பட்ட தரவுத்தொகுப்புகளை இயக்க முடியும். அப்பாச்சி பன்றியில், நீங்கள் பன்றி லத்தீன் மொழியைப் பயன்படுத்தி பன்றி ஸ்கிரிப்ட்களை எழுத வேண்டும், இது உங்கள் பன்றி ஸ்கிரிப்டை இயக்கும் போது MapReduce வேலைக்கு மாற்றப்படும். அப்பாச்சி பிக் பல்வேறு ஆபரேட்டர்களைக் கொண்டுள்ளது, அவை தரவைப் படிப்பது, எழுதுவது, செயலாக்குவது போன்ற பணிகளைச் செய்யப் பயன்படுகின்றன. அப்பாச்சி பன்றி ஆபரேட்டர்களைப் பற்றி அறிய, எங்கள் வலைப்பதிவுக்குச் செல்லவும் “ அப்பாச்சி பன்றியில் ஆபரேட்டர்கள்: பகுதி 1- ரிலேஷனல் ஆபரேட்டர்கள் ”.

இப்போது நீங்கள் அப்பாச்சி பன்றியைப் பற்றிய அடிப்படை புரிதலைக் கொண்டுள்ளதால், லினக்ஸில் அப்பாச்சி பன்றி நிறுவலுடன் தொடங்குவோம்.



லினக்ஸில் அப்பாச்சி பன்றி நிறுவல்:

லினக்ஸில் அப்பாச்சி பன்றி நிறுவலுக்கான படிகள் கீழே உள்ளன (லினக்ஸ் வி.எம் ஐப் பயன்படுத்தி உபுண்டு / சென்டோஸ் / விண்டோஸ்). கீழே உள்ள அமைப்பில் நான் உபுண்டு 16.04 ஐப் பயன்படுத்துகிறேன்.

படி 1: பதிவிறக்க Tamil பன்றி தார் கோப்பு.

கட்டளை: wget http://www-us.apache.org/dist/pig/pig-0.16.0/pig-0.16.0.tar.gz



பன்றி பதிவிறக்க - பன்றி நிறுவல் - எடுரேகா

படி 2: பிரித்தெடுக்கவும் தார் தார் கட்டளையைப் பயன்படுத்தி கோப்பு. தார் கட்டளைக்கு கீழே, எக்ஸ் காப்பக கோப்பை பிரித்தெடுப்பது, உடன் gzip மூலம் காப்பகத்தை வடிகட்டவும், f காப்பக கோப்பின் கோப்பு பெயர்.

கட்டளை: tar -xzf pig-0.16.0.tar.gz

கட்டளை: ls

படி 3: திருத்து “ .bashrc அப்பாச்சி பன்றின் சூழல் மாறிகள் புதுப்பிக்க கோப்பு. எந்தவொரு கோப்பகத்திலிருந்தும் பன்றியை அணுகுவதற்காக நாங்கள் அதை அமைத்து வருகிறோம், பன்றி கட்டளைகளை இயக்க பன்றி அடைவுக்கு செல்ல வேண்டியதில்லை. மேலும், வேறு ஏதேனும் பயன்பாடு பன்றியைத் தேடுகிறதென்றால், இந்த கோப்பிலிருந்து அப்பாச்சி பன்றின் பாதையை அது அறிந்து கொள்ளும்.

கட்டளை: sudo gedit .bashrc

சமையல்காரர் மற்றும் கைப்பாவை என்ன

கோப்பின் முடிவில் பின்வருவனவற்றைச் சேர்க்கவும்:

# PIG_HOME ஐ அமைக்கவும்

ஏற்றுமதி PIG_HOME = / home / edureka / pig-0.16.0
ஏற்றுமதி PATH = $ PATH: /home/edureka/pig-0.16.0/bin
ஏற்றுமதி PIG_CLASSPATH = $ HADOOP_CONF_DIR

மேலும், ஹடூப் பாதையும் அமைக்கப்பட்டிருப்பதை உறுதிப்படுத்திக் கொள்ளுங்கள்.

மாற்றங்கள் ஒரே முனையத்தில் புதுப்பிக்க கட்டளைக்கு கீழே இயக்கவும்.

கட்டளை: மூல .bashrc

படி 4: பன்றி பதிப்பைச் சரிபார்க்கவும். அப்பாச்சி பன்றி சரியாக நிறுவப்பட்டதா என்பதை சோதிக்க இது. நீங்கள் அப்பாச்சி பன்றி பதிப்பைப் பெறவில்லை எனில், மேலே உள்ள படிகளை நீங்கள் சரியாகப் பின்பற்றினீர்களா என்பதை சரிபார்க்க வேண்டும்.

கட்டளை: பன்றி-மாற்றம்

படி 5 :அனைத்து பன்றி கட்டளை விருப்பங்களையும் காண பன்றி உதவியைச் சரிபார்க்கவும்.

கட்டளை: பன்றி-உதவி

படி 6 :கிரன்ட் ஷெல்லைத் தொடங்க பன்றை இயக்கவும். பிக் லத்தீன் ஸ்கிரிப்ட்களை இயக்க கிரண்ட் ஷெல் பயன்படுத்தப்படுகிறது.

கட்டளை: பன்றி

மேலே உள்ள படத்தை நீங்கள் சரியாகப் பார்த்தால், அப்பாச்சி பன்றில் இரண்டு முறைகள் உள்ளன, அதில் இயங்கக்கூடியது, இயல்புநிலையாக இது MapReduce பயன்முறையைத் தேர்வுசெய்கிறது. நீங்கள் பன்றியை இயக்கக்கூடிய மற்ற முறை உள்ளூர் பயன்முறையாகும். இதைப் பற்றி மேலும் சொல்கிறேன்.

அப்பாச்சி பன்றியில் செயல்படுத்தும் முறைகள்:

  • MapReduce பயன்முறை - இது இயல்புநிலை பயன்முறையாகும், இதற்கு ஹடூப் கிளஸ்டர் மற்றும் எச்டிஎஃப்எஸ் நிறுவலுக்கான அணுகல் தேவைப்படுகிறது. இது இயல்புநிலை பயன்முறையாக இருப்பதால், -x கொடியைக் குறிப்பிட தேவையில்லை (நீங்கள் இயக்கலாம் பன்றி அல்லது பன்றி-எக்ஸ் வரைபடம் ). இந்த பயன்முறையில் உள்ளீடு மற்றும் வெளியீடு HDFS இல் உள்ளன.
  • உள்ளூர் பயன்முறை - ஒரு இயந்திரத்திற்கான அணுகலுடன், எல்லா கோப்புகளும் நிறுவப்பட்டு உள்ளூர் ஹோஸ்ட் மற்றும் கோப்பு முறைமையைப் பயன்படுத்தி இயங்கும். இங்கே உள்ளூர் பயன்முறை ‘-x கொடி’ ( பன்றி-எக்ஸ் உள்ளூர் ). இந்த பயன்முறையில் உள்ளீடு மற்றும் வெளியீடு உள்ளூர் கோப்பு முறைமையில் உள்ளன.

கட்டளை: பன்றி-எக்ஸ் உள்ளூர்

லினக்ஸில் அப்பாச்சி பன்றி நிறுவலைப் பார்க்க நீங்கள் கீழே உள்ள வீடியோ வழியாக செல்லலாம்:

அப்பாச்சி பன்றி நிறுவல் | லினக்ஸில் பன்றி நிறுவல் | எடுரேகா

இப்போது நீங்கள் லினக்ஸில் அப்பாச்சி பன்றி நிறுவலுடன் முடித்துவிட்டீர்கள், அடுத்த கட்டமாக பிக் கிரண்ட் ஷெல்லில் சில தொடர்புடைய பன்றி ஆபரேட்டர்களை முயற்சிக்கவும். எனவே, அடுத்த வலைப்பதிவு “ அப்பாச்சி பன்றியில் ஆபரேட்டர்கள்: பகுதி 1- ரிலேஷனல் ஆபரேட்டர்கள் ”பன்றி ஆபரேட்டர்களை மாஸ்டர் செய்ய உங்களுக்கு உதவும்.

இப்போது நீங்கள் லினக்ஸில் அப்பாச்சி பன்றியை நிறுவியுள்ளீர்கள், பாருங்கள் உலகெங்கிலும் பரவியுள்ள 250,000 க்கும் மேற்பட்ட திருப்தியான கற்றவர்களின் வலைப்பின்னலுடன் நம்பகமான ஆன்லைன் கற்றல் நிறுவனமான எடுரேகாவால். சில்லறை, சமூக மீடியா, விமான போக்குவரத்து, சுற்றுலா, நிதி களத்தில் நிகழ்நேர பயன்பாட்டு நிகழ்வுகளைப் பயன்படுத்தி எச்டிஎஃப்எஸ், நூல், வரைபடம், பன்றி, ஹைவ், ஹெபேஸ், ஓஸி, ஃப்ளூம் மற்றும் ஸ்கூப் ஆகியவற்றில் நிபுணர்களாக மாற எடூரெகா பிக் டேட்டா ஹடூப் சான்றிதழ் பயிற்சி பாடநெறி உதவுகிறது.

எங்களுக்கு ஒரு கேள்வி கிடைத்ததா? கருத்துகள் பிரிவில் இதைக் குறிப்பிடவும், நாங்கள் உங்களைத் தொடர்புகொள்வோம்.