25 के लिए शीर्ष 2026 ETL परीक्षण साक्षात्कार प्रश्न और उत्तर

यहां नए और अनुभवी उम्मीदवारों के लिए ईटीएल परीक्षण साक्षात्कार प्रश्न और उत्तर दिए गए हैं ताकि वे अपने सपनों की नौकरी पा सकें।

 

फ्रेशर्स के लिए ETL परीक्षण साक्षात्कार प्रश्न


1) ईटीएल क्या है?

डेटा वेयरहाउसिंग आर्किटेक्चर में, ETL एक महत्वपूर्ण घटक है, जो किसी भी व्यावसायिक प्रक्रिया के लिए डेटा का प्रबंधन करता है। ETL का मतलब है Extracटी, रूपांतरित करें और भार. भूतपूर्वtracडेटा को डेटाबेस से पढ़ने की प्रक्रिया में 't' का उपयोग होता है। 'Transform' डेटा को रिपोर्टिंग और विश्लेषण के लिए उपयुक्त प्रारूप में परिवर्तित करता है। वहीं, 'load' डेटा को लक्ष्य डेटाबेस में लिखने की प्रक्रिया में उपयोग होता है।

👉 निःशुल्क पीडीएफ डाउनलोड: ईटीएल परीक्षण साक्षात्कार प्रश्न और उत्तर


2) बताएं कि ETL परीक्षण कार्यों में क्या शामिल है?

ईटीएल परीक्षण में शामिल हैं:

  • सत्यापित करें कि डेटा व्यावसायिक आवश्यकताओं के अनुसार सही ढंग से परिवर्तित हो रहा है या नहीं
  • सत्यापित करें कि प्रक्षेपित डेटा बिना किसी कटौती और डेटा हानि के डेटा वेयरहाउस में लोड किया गया है
  • सुनिश्चित करें कि ETL अनुप्रयोग अमान्य डेटा की रिपोर्ट करता है और डिफ़ॉल्ट मानों के साथ प्रतिस्थापित करता है
  • मापनीयता और प्रदर्शन में सुधार के लिए सुनिश्चित करें कि डेटा अपेक्षित समय सीमा पर लोड हो

ईटीएल प्रक्रिया
ईटीएल


3) बताएं कि डेटा वेयरहाउस एप्लिकेशन के प्रकार क्या हैं और डेटा माइनिंग और डेटा वेयरहाउसिंग के बीच क्या अंतर है?

डेटा वेयरहाउस अनुप्रयोगों के प्रकार हैं

  • सूचना प्रसंस्करण
  • विश्लेषणात्मक प्रसंस्करण
  • आँकड़ा खनन

डेटा माइनिंग इसे निकास की प्रक्रिया के रूप में परिभाषित किया जा सकता हैtracबड़े डेटाबेस से छिपी हुई पूर्वानुमानित जानकारी प्राप्त करना और डेटा की व्याख्या करना, जबकि डेटा वेयरहाउसिंग डेटा के विश्लेषणात्मक प्रसंस्करण के लिए डेटा माइनिंग का उपयोग तेजी से कर सकती है। विवरण भण्डारण यह एकाधिक स्रोतों से डेटा को एक सामान्य संग्रह में एकत्रित करने की प्रक्रिया है


4) ईटीएल में प्रयुक्त विभिन्न उपकरण कौन-कौन से हैं?

  • कॉग्नोस निर्णय स्ट्रीम
  • Oracle गोदाम निर्माता
  • व्यावसायिक वस्तुएँ XI
  • एसएएस बिजनेस वेयरहाउस
  • SAS एंटरप्राइज़ ETL सर्वर

5) तथ्य क्या है? तथ्य कितने प्रकार के होते हैं?

यह बहुआयामी मॉडल का एक केंद्रीय घटक है जिसमें विश्लेषण किए जाने वाले उपाय शामिल होते हैं। तथ्य आयामों से संबंधित होते हैं।

तथ्यों के प्रकार हैं

  • योगात्मक तथ्य
  • अर्ध-योगात्मक तथ्य
  • गैर-योजक तथ्य

6) बताएं कि क्यूब्स और ओएलएपी क्यूब्स क्या हैं?

क्यूब्स डेटा प्रोसेसिंग यूनिट हैं जो डेटा वेयरहाउस से तथ्य तालिकाओं और आयामों से मिलकर बनी होती हैं। यह बहुआयामी विश्लेषण प्रदान करता है।

OLAP का मतलब है ऑनलाइन एनालिटिक्स प्रोसेसिंग, और OLAP क्यूब रिपोर्टिंग उद्देश्यों के लिए बहु-आयामी रूप में बड़े डेटा को संग्रहीत करता है। इसमें माप के रूप में वर्गीकृत तथ्य शामिल हैं।


7) स्पष्ट करें कि क्या है tracइसका स्तर क्या है और इसके प्रकार क्या हैं?

Tracलॉग लेवल लॉग फाइलों में संग्रहीत डेटा की मात्रा है। Tracलेखन स्तर को दो भागों में वर्गीकृत किया जा सकता है: सामान्य और विस्तृत। सामान्य स्तर निम्नलिखित बातों की व्याख्या करता है: tracविस्तृत तरीके से स्तर की व्याख्या करना जबकि विस्तृत व्याख्या करना tracप्रत्येक पंक्ति में स्तरों को समायोजित करना।


8) ग्रेन ऑफ फैक्ट क्या है?

ग्रेन फैक्ट को उस स्तर के रूप में परिभाषित किया जा सकता है जिस पर तथ्य जानकारी संग्रहीत की जाती है। इसे फैक्ट ग्रैन्युलैरिटी के नाम से भी जाना जाता है


9) बताएं तथ्यहीन तथ्य स्कीमा क्या है और माप क्या है?

बिना माप के एक तथ्य तालिका को तथ्यहीन तथ्य तालिका के रूप में जाना जाता है। यह होने वाली घटनाओं की संख्या देख सकता है। उदाहरण के लिए, इसका उपयोग किसी कंपनी में कर्मचारी संख्या जैसी घटना को रिकॉर्ड करने के लिए किया जाता है।

तथ्य तालिका में स्तंभों पर आधारित संख्यात्मक डेटा को माप के रूप में जाना जाता है


10) बताएं कि परिवर्तन क्या है?

परिवर्तन एक रिपोजिटरी ऑब्जेक्ट है जो डेटा उत्पन्न करता है, संशोधित करता है या पास करता है। परिवर्तन दो प्रकार के होते हैं सक्रिय और निष्क्रिय


अनुभवी लोगों के लिए ETL डेवलपर साक्षात्कार प्रश्न और उत्तर

11) लुकअप ट्रांसफॉर्मेशन के उपयोग को समझाइए?

लुकअप ट्रांसफॉर्मेशन इसके लिए उपयोगी है

  • स्तंभ मान का उपयोग करके तालिका से संबंधित मान प्राप्त करना
  • धीरे-धीरे बदलती आयाम तालिका को अपडेट करें
  • सत्यापित करें कि तालिका में रिकॉर्ड पहले से मौजूद हैं या नहीं

12) बताएं कि विभाजन, हैश विभाजन और राउंड रोबिन विभाजन क्या है?

प्रदर्शन को बेहतर बनाने के लिए, लेन-देन को उप-विभाजित किया जाता है, इसे विभाजन कहा जाता है। विभाजन सक्षम बनाता है सूचना विज्ञान विभिन्न स्रोतों से एकाधिक कनेक्शन बनाने के लिए सर्वर

विभाजन के प्रकार हैं

राउंड-रॉबिन विभाजन:

  • इन्फॉर्मेटिका द्वारा डेटा सभी विभाजनों के बीच समान रूप से वितरित किया जाता है
  • प्रत्येक विभाजन में जहां प्रक्रिया करने के लिए पंक्तियों की संख्या लगभग समान है, यह विभाजन लागू होता है

हैश विभाजन:

  • विभाजनों के बीच डेटा को समूहीकृत करने के लिए विभाजन कुंजियों के उद्देश्य से Informatica सर्वर एक हैश फ़ंक्शन लागू करता है
  • इसका उपयोग तब किया जाता है जब प्रक्रियाओं को सुनिश्चित करने के लिए एक ही विभाजन में समान विभाजन कुंजी वाली पंक्तियों के समूहों को सुनिश्चित करने की आवश्यकता होती है

13) डेटा रीडर डेस्टिनेशन एडाप्टर का उपयोग करने का क्या लाभ है?

डेटा रीडर गंतव्य एडाप्टर का उपयोग करने का लाभ यह है कि यह एक डेटा रीडर गंतव्य एडाप्टर का उपयोग करता है। ADO रिकॉर्डसेट (रिकॉर्ड और कॉलम से मिलकर) मेमोरी में डेटा रीडर इंटरफेस को कार्यान्वित करके डेटाफ्लो कार्य से डेटा को उजागर करता है, ताकि अन्य अनुप्रयोग डेटा का उपभोग कर सकें।


14) SSIS (SQL सर्वर एकीकरण सेवा) का उपयोग करके तालिका को अद्यतन करने के संभावित तरीके क्या हैं?

SSIS का उपयोग करके तालिका को अद्यतन करने के संभावित तरीके निम्नलिखित हैं:

  • उपयोग एसक्यूएल आदेश
  • स्टेजिंग टेबल का उपयोग करें
  • कैश का प्रयोग करें
  • स्क्रिप्ट कार्य का उपयोग करें
  • यदि MSSQL का उपयोग किया जाता है तो अद्यतन करने के लिए पूर्ण डेटाबेस नाम का उपयोग करें

15) यदि आपके पास लुकअप के लिए गैर-OLEDB (ऑब्जेक्ट लिंकिंग और एम्बेडिंग डेटाबेस) स्रोत है तो आप क्या करेंगे?

यदि आपके पास लुकअप के लिए गैर-OLEBD स्रोत है तो आपको डेटा लोड करने के लिए कैश का उपयोग करना होगा और इसे स्रोत के रूप में उपयोग करना होगा


16) कनेक्टेड और अनकनेक्टेड रूपांतरणों में आप डायनेमिक कैश और स्टैटिक कैश का उपयोग किस स्थिति में करते हैं?

  • डायनेमिक कैश का उपयोग तब किया जाता है जब आपको मास्टर टेबल और धीरे-धीरे बदलते आयामों (SCD) प्रकार 1 को अपडेट करना होता है
  • फ्लैट फ़ाइलों के लिए स्टेटिक कैश का उपयोग किया जाता है

17) बताएं कि अनकनेक्टेड और कनेक्टेड लुकअप के बीच क्या अंतर हैं?

कनेक्टेड लुकअप असंबद्ध लुकअप
कनेक्टेड लुकअप मैप में भाग लेता हैping इसका उपयोग तब किया जाता है जब मैप के दौरान एक्सप्रेशन ट्रांसफॉर्मेशन के बजाय लुकअप फ़ंक्शन का उपयोग किया जाता है।ping
एकाधिक मान लौटाए जा सकते हैं केवल एक आउटपुट पोर्ट लौटाता है
इसे अन्य रूपांतरणों से जोड़ा जा सकता है और यह एक मान लौटाता है किसी अन्य परिवर्तन को जोड़ा नहीं जा सकता
कनेक्टेड लुकअप के लिए स्टेटिक या डायनेमिक कैश का उपयोग किया जा सकता है केवल स्थिर कैश के रूप में असंबद्ध
कनेक्टेड लुकअप उपयोगकर्ता द्वारा निर्धारित डिफ़ॉल्ट मानों का समर्थन करता है असंबद्ध लुकअप उपयोगकर्ता द्वारा निर्धारित डिफ़ॉल्ट मानों का समर्थन नहीं करता है
कनेक्टेड लुकअप में एक ही पंक्ति से कई कॉलम वापस किए जा सकते हैं या डायनेमिक लुकअप कैश में डाले जा सकते हैं असंबद्ध लुकअप एक रिटर्न पोर्ट निर्दिष्ट करता है और प्रत्येक पंक्ति से एक कॉलम लौटाता है

18) बताएं कि डेटा स्रोत दृश्य क्या है?

डेटा स्रोत दृश्य रिलेशनल स्कीमा को परिभाषित करने की अनुमति देता है जिसका उपयोग विश्लेषण सेवा डेटाबेस में किया जाएगा। डेटा स्रोत ऑब्जेक्ट से सीधे नहीं, बल्कि डेटा स्रोत दृश्यों से आयाम और क्यूब्स बनाए जाते हैं।


19) ओएलएपी टूल्स और ईटीएल टूल्स के बीच क्या अंतर है समझाइए?

ETL और OLAP टूल के बीच अंतर यह है कि

ईटीएल उपकरण यह पूर्व के लिए हैtracपुराने सिस्टम से डेटा प्राप्त करना और डेटा को साफ करने की प्रक्रिया के साथ निर्दिष्ट डेटाबेस में लोड करना।

उदाहरण: डेटा स्टेज, इन्फॉर्मेटिका आदि।

जबकि OLAP का उद्देश्य बहु-दिशात्मक मॉडल में उपलब्ध OLAP डेटा में रिपोर्टिंग करना है।

उदाहरण: बिजनेस ऑब्जेक्ट्स, कॉग्नोस आदि.


20) आप कैसे कर सकते हैंtract SAP क्या आप इन्फॉर्मेटिका का उपयोग करके डेटा एकत्र करना चाहते हैं?

  • पावर कनेक्ट विकल्प के साथ आपtract SAP डेटा का उपयोग कर informatica
  • PowerConnect टूल को स्थापित और कॉन्फ़िगर करें
  • स्रोत विश्लेषक में स्रोत आयात करें। Informatica और के बीच SAP पावरकनेक्ट एक गेटवे के रूप में कार्य करता है। अगला चरण मैप के लिए ABAP कोड जनरेट करना है।ping तभी इन्फॉर्मेटिका डेटा प्राप्त कर सकता है SAP
  • बाहरी प्रणालियों से स्रोतों को जोड़ने और आयात करने के लिए पावर कनेक्ट का उपयोग किया जाता है

21) पावर मार्ट और पावर सेंटर में क्या अंतर है?

पावर सेंटर पावर मार्ट
मान लीजिए कि बड़ी मात्रा में डेटा को संसाधित करना है मान लीजिए कि कम मात्रा में डेटा को संसाधित करना है
यह ईआरपी स्रोतों का समर्थन करता है जैसे SAP, लोग नरम आदि यह ERP स्रोतों का समर्थन नहीं करता है
यह स्थानीय और वैश्विक रिपोजिटरी का समर्थन करता है यह स्थानीय रिपोजिटरी का समर्थन करता है
यह स्थानीय को वैश्विक रिपोजिटरी में परिवर्तित करता है इसमें स्थानीय को वैश्विक रिपोजिटरी में परिवर्तित करने का कोई विनिर्देश नहीं है

22) बताएं कि स्टेजिंग एरिया क्या है और स्टेजिंग एरिया का उद्देश्य क्या है?

डेटा स्टेजिंग एक ऐसा क्षेत्र है जहाँ आप डेटा को डेटा वेयरहाउस सर्वर पर अस्थायी रूप से रखते हैं। डेटा स्टेजिंग में निम्नलिखित चरण शामिल हैं

  • स्रोत डेटा पूर्वtracडेटा रूपांतरण और पुनर्गठन (पुनर्गठन)
  • डेटा रूपांतरण (डेटा सफाई, मूल्य रूपांतरण)
  • सरोगेट कुंजी असाइनमेंट

23) बस स्कीमा क्या है?

विभिन्न व्यावसायिक प्रक्रियाओं के लिए सामान्य आयामों की पहचान करने के लिए, BUS स्कीमा का उपयोग किया जाता है। यह सूचना की मानकीकृत परिभाषा के साथ अनुरूप आयामों के साथ आता है


24) बताएं कि डेटा पर्जिंग क्या है?

डेटा पर्जिंग डेटा वेयरहाउस से डेटा हटाने की एक प्रक्रिया है। यह जंक डेटा को हटाता है जैसे शून्य मान वाली पंक्तियाँ या अतिरिक्त रिक्त स्थान।


25) स्कीमा ऑब्जेक्ट्स क्या हैं, बताएं?

स्कीमा ऑब्जेक्ट्स तार्किक संरचना हैं जो सीधे डेटाबेस डेटा को संदर्भित करते हैं। स्कीमा ऑब्जेक्ट्स में टेबल, व्यू, अनुक्रम समानार्थी, इंडेक्स, क्लस्टर, फ़ंक्शन पैकेज और डेटाबेस लिंक शामिल हैं


26) सेशन, वर्कलेट, मैपलेट और वर्कफ़्लो इन शब्दों की व्याख्या करें?

  • मैपलट: यह परिवर्तन के सेटों को व्यवस्थित या निर्मित करता है
  • वर्कलेट: यह दिए गए कार्यों के एक विशिष्ट समूह का प्रतिनिधित्व करता है
  • कार्यप्रवाह: यह निर्देशों का एक सेट है जो सर्वर को बताता है कि कार्यों को कैसे निष्पादित किया जाए
  • सत्र: यह मापदंडों का एक सेट है जो सर्वर को बताता है कि डेटा को स्रोत से लक्ष्य तक कैसे ले जाना है

ये साक्षात्कार प्रश्न आपके मौखिक (मौखिक) में भी मदद करेंगे

इस पोस्ट को संक्षेप में इस प्रकार लिखें: