அப்பாச்சி துரப்பணியில் துளையிடுதல், புதிய வயது வினவல் இயந்திரம்

இந்த அப்பாச்சி துரப்பணம் பயிற்சி, அப்பாச்சி துரப்பண வினவல் இயந்திரம், ஹடூப், பிக் டேட்டா மற்றும் அப்பாச்சி ஸ்பார்க் ஆகியவற்றுடன் தொடங்கத் தேவையான அனைத்து தகவல்களையும் உங்களுக்கு வழங்குகிறது.

அப்பாச்சி துரப்பணம் என்பது தொழில்துறையின் முதல் திட்டமில்லாத SQL இயந்திரமாகும். துரப்பணம் உலகின் முதல் வினவல் இயந்திரம் அல்ல, ஆனால் இது நெகிழ்வுத்தன்மை மற்றும் வேகத்திற்கு இடையிலான சிறந்த சமநிலையைத் தாக்கும் முதல் முறையாகும். BI / Analytics சூழல்களுக்குத் தேவைப்படும் ஊடாடும் வேகத்தில் பல ஆயிரம் கணுக்கள் மற்றும் வினவல் பெட்டாபைட் தரவை அளவிட வடிவமைக்கப்பட்டுள்ளது.இது ஹைவ், எச் பேஸ், மோங்கோடிபி, கோப்பு முறைமை, ஆர்.டி.பி.எம்.எஸ் போன்ற பல தரவு மூலங்களுடன் ஒருங்கிணைக்க முடியும். மேலும், அவ்ரோ, சி.எஸ்.வி, டி.எஸ்.வி, பி.எஸ்.வி, பார்க்வெட், ஹடூப் சீக்வென்ஸ் கோப்புகள் போன்ற உள்ளீட்டு வடிவங்கள் மற்றும் பலவற்றை டிரில்லில் எளிதாகப் பயன்படுத்தலாம்.

அப்பாச்சி துரப்பணம் ஏன்?

அப்பாச்சி துரப்பணியின் மிகப்பெரிய நன்மை என்னவென்றால், நீங்கள் எந்த தரவையும் வினவும்போது அது பறக்கக்கூடிய திட்டத்தைக் கண்டறிய முடியும். மேலும், இது உங்கள் BI கருவிகளான Tableau, Qlikview, MicroStrategy போன்றவற்றுடன் சிறந்த பகுப்பாய்வுகளுக்கு வேலை செய்ய முடியும்.

அப்பாச்சி துரப்பணியின் மதிப்பை சுருக்கமாகக் கூறும் தொழில் ஆய்வாளரின் மேற்கோள் இங்கே:

“துரப்பணம் என்பது SQL-on-Hadoop ஐப் பற்றியது அல்ல. இது SQL- ஆன்-எதைப் பற்றியும், உடனடியாகவும், முறைப்படி இல்லாமல் இருக்கும். ”

- ஆண்ட்ரூ பர்ஸ்ட், கிகாம் ஆராய்ச்சி, ஜனவரி 2015

ட்ரில்பிட் என்பது அப்பாச்சி ட்ரில்லின் டீமான் ஆகும், இது கிளஸ்டரில் உள்ள ஒவ்வொரு முனையிலும் இயங்கும். இது கிளஸ்டர் மற்றும் மெயின்டெய்ன் கிளஸ்டர் உறுப்பினர்களில் உள்ள அனைத்து தகவல்தொடர்புகளுக்கும் ZooKeeper ஐப் பயன்படுத்துகிறது. வாடிக்கையாளரிடமிருந்து கோரிக்கைகளை ஏற்றுக்கொள்வது, வினவல்களைச் செயலாக்குவது மற்றும் வாடிக்கையாளருக்கு முடிவுகளை வழங்குவது பொறுப்பு. வாடிக்கையாளரிடமிருந்து கோரிக்கையைப் பெறும் துரப்பணியை ‘ஃபோர்மேன்’ என்று அழைக்கப்படுகிறது. இது செயல்படுத்தல் திட்டத்தை உருவாக்குகிறது, மரணதண்டனை துண்டுகள் கிளஸ்டரில் இயங்கும் பிற துரப்பணிகளுக்கு அனுப்பப்படுகின்றன.

Drillbits-Apache-Drill

இன்னும் ஒரு நன்மை என்னவென்றால், துரப்பணியின் நிறுவலும் அமைப்பும் மிகவும் எளிது. அப்பாச்சி துரப்பணியை எவ்வாறு நிறுவுவது என்பதைக் கற்றுக்கொள்வோம்.

முதல் படி துரப்பணம் தொகுப்பை பதிவிறக்கம் செய்ய வேண்டும்.

ஜாவாவுக்கு கிரகணத்தை எவ்வாறு கட்டமைப்பது

கட்டளை: wget https://archive.apache.org/dist/drill/drill-1.5.0/apache-drill-1.5.0.tar.gz

கட்டளை: tar -xvf apache-drill-1.5.0.tar.gz

கட்டளை: ls

அடுத்து, .bashrc கோப்பில் சூழல் மாறிகள் அமைக்கவும்.

கட்டளை: sudo gedit .bashrc

ஏற்றுமதி DRILL_HOME = / home / edureka / apache-drill-1.5.0

ஏற்றுமதி PATH = $ PATH: /home/edureka/apache-drill-1.5.0/bin

இந்த கட்டளை மாற்றங்களை புதுப்பிக்கும்:

கட்டளை: மூல .bashrc

இப்போது conf அடைவை துளைக்கச் சென்று, கிளஸ்டர் ஐடி மற்றும் ஜூக்கீப்பர் ஹோஸ்ட் & போர்ட் மூலம் துரப்பணம்-ஓவர்ரைடு.கான்ஃப் கோப்பைத் திருத்தவும், நாங்கள் அதை உள்ளூர் கிளஸ்டரில் இயக்குவோம்.

கட்டளை: cd apache-drill-1.5.0

கட்டளை: sudo gedit conf / drill-override.conf

இயல்பாக, DRILL_MAX_DIRECT_MEMORY துரப்பணம்- env.sh இல் 8 ஜிபி இருக்கும், மேலும் நம்மிடம் உள்ள நினைவகத்திற்கு ஏற்ப அதை வைத்திருக்க வேண்டும்.

கட்டளை: sudo gedit conf / drill-env.sh

ஒற்றை முனையில் மட்டுமே துரப்பணியை நிறுவ, நீங்கள் உட்பொதிக்கப்பட்ட பயன்முறையைப் பயன்படுத்தலாம், அங்கு அது உள்நாட்டில் இயங்கும். இந்த கட்டளையை இயக்கும்போது அது தானாகவே துரப்பண சேவையைத் தொடங்கும்.

கட்டளை: ./bin/drill-embedded

நிறுவலைச் சரிபார்க்க நீங்கள் ஒரு எளிய வினவலை இயக்கலாம்.

கட்டளை: sys.options இலிருந்து * ஐத் தேர்ந்தெடுக்கவும் WHERE type = ‘SYSTEM’ மற்றும் ‘security%’ போன்ற பெயர்

அப்பாச்சி துரப்பணியின் வலை கன்சோலை சரிபார்க்க, வலை உலாவியில் உள்ள லோக்கல் ஹோஸ்ட்: 8047 க்கு செல்ல வேண்டும்.

உங்கள் வினவலை வினவல் தாவலிலிருந்தும் இயக்கலாம்.

விநியோகிக்கப்பட்ட பயன்முறையில் துரப்பணியை இயக்க, நீங்கள் கிளஸ்டர் ஐடியைத் திருத்த வேண்டும் மற்றும் கீழேயுள்ளபடி துரப்பணம்-ஓவர்ரைடு.கான்ஃப் இல் ஜூக்கீப்பர் தகவலைச் சேர்க்க வேண்டும்.

ஒவ்வொரு முனையிலும் ZooKeeper சேவையைத் தொடங்க வேண்டும். அதன் பிறகு இந்த கட்டளையுடன் ஒவ்வொரு முனையிலும் துரப்பண சேவையை தொடங்க வேண்டும்.

கட்டளை: ./bin/drillbit.sh தொடக்க

கட்டளை: jps

ஜாவாவில் ஆழமற்ற நகலுக்கும் ஆழமான நகலுக்கும் உள்ள வேறுபாடு

இப்போது, ​​துரப்பண ஷெல்லைத் தொடங்க கீழே உள்ள கட்டளையைப் பயன்படுத்துகிறோம்.

இப்போது, ​​எங்கள் கேள்விகளை கிளஸ்டரில் விநியோகிக்கப்பட்ட பயன்முறையில் இயக்கலாம்.

இரண்டு பகுதி அப்பாச்சி துரப்பணம் வலைப்பதிவு தொடரின் முதல் வலைப்பதிவு இடுகை இதுவாகும். தொடரின் இரண்டாவது வலைப்பதிவு விரைவில் வருகிறது.

எங்களுக்கு ஒரு கேள்வி கிடைத்ததா? கருத்துப் பிரிவில் அவற்றைக் குறிப்பிடுங்கள், நாங்கள் உங்களிடம் திரும்புவோம்.

தொடர்புடைய இடுகைகள்:

அப்பாச்சி துரப்பணம் பகுதி 2 இல் துளையிடுதல்

அப்பாச்சி ஸ்பார்க் Vs ஹடூப் வரைபடம்