25 nejlepších otázek a odpovědí na testovací rozhovor ETL pro rok 2026
Otázky k pohovoru o testování ETL pro osvěžovače
1) Co je ETL?
V architektuře datových skladů je ETL důležitou součástí, která spravuje data pro jakýkoli podnikový proces. ETL znamená Extract, Transformace a Zatížení. PřtracFunkce t provádí proces čtení dat z databáze. Funkce Transform provádí převod dat do formátu vhodného pro reporting a analýzu. Funkce load provádí proces zápisu dat do cílové databáze.
👉 Zdarma ke stažení PDF: Otázky a odpovědi k testovacímu rozhovoru ETL
2) Vysvětlete, co zahrnují operace testování ETL?
ETL testování zahrnuje:
- Ověřte, zda se data transformují správně podle obchodních požadavků
- Ověřte, zda jsou projektovaná data načtena do datového skladu bez jakéhokoli zkrácení a ztráty dat
- Ujistěte se, že aplikace ETL hlásí neplatná data a nahradí je výchozími hodnotami
- Ujistěte se, že se data načítají v očekávaném časovém rámci, aby se zlepšila škálovatelnost a výkon

3) Uveďte, jaké jsou typy aplikací datových skladů a jaký je rozdíl mezi data miningem a datovým skladem?
Typy aplikací datových skladů jsou
- Zpracování informací
- Analytické zpracování
- Data Mining
Dolování dat lze definovat jako proces extraczískávání skrytých prediktivních informací z velkých databází a interpretace dat, zatímco datové sklady mohou využívat datový důl pro analytické zpracování dat rychlejším způsobem. Skladování dat je proces agregace dat z více zdrojů do jednoho společného úložiště
4) Jaké jsou různé nástroje používané v ETL?
- Rozhodovací proud Cognos
- Oracle Stavitel skladu
- Obchodní objekty XI
- Obchodní sklad SAS
- Server SAS Enterprise ETL
5) Co je skutečnost? Jaké jsou typy faktů?
Je to ústřední součást vícerozměrného modelu, který obsahuje opatření, která mají být analyzována. Fakta souvisí s rozměry.
Typy faktů jsou
- Aditivní fakta
- Poloaditivní fakta
- Neaditivní fakta
6) Vysvětlete, co jsou kostky a OLAP kostky?
Kostky jsou jednotky pro zpracování dat složené z tabulek faktů a dimenzí z datového skladu. Poskytuje vícerozměrnou analýzu.
OLAP je zkratka pro Online Analytics Processing a OLAP kostka ukládá velká data ve vícerozměrné podobě pro účely vytváření sestav. Skládá se z faktů nazývaných jako míry kategorizované podle dimenzí.
7) Vysvětlete, co je tracúroveň a jaké jsou typy?
TracÚroveň logování je množství dat uložených v souborech protokolu. TracÚroveň lingu lze rozdělit na normální a podrobný. Normální úroveň vysvětluje tracúroveň podrobným způsobem, zatímco podrobně vysvětluje tracúrovně v každém řádku.
8) Vysvětlete, co je Grain of Fact?
Fakta zrna lze definovat jako úroveň, na které jsou informace o faktech uloženy. Je také známá jako zrnitost faktů
9) Vysvětlete, co je schéma bez faktů a co jsou opatření?
Tabulka faktů bez měření je známá jako tabulka faktů bez faktů. Může zobrazit počet vyskytujících se událostí. Například se používá k záznamu události, jako je počet zaměstnanců ve společnosti.
Číselná data založená na sloupcích v tabulce faktů se nazývají míry
10) Vysvětlete, co je to transformace?
Transformace je objekt úložiště, který generuje, upravuje nebo předává data. Transformace jsou dva typy aktivní a pasivní
ETL Developer Interview Otázky a odpovědi pro zkušené
11) Vysvětlete použití Lookup Transformation?
Transformace vyhledávání je užitečná pro
- Získání související hodnoty z tabulky pomocí hodnoty sloupce
- Aktualizujte tabulku pomalu se měnících rozměrů
- Ověřte, zda v tabulce již existují záznamy
12) Vysvětlete, co je to dělení, rozdělování hash a rozdělování typu round robin?
Pro zlepšení výkonu jsou transakce rozděleny na další části, což se nazývá rozdělení. Rozdělení umožňuje Informatika Server pro vytvoření vícenásobného připojení k různým zdrojům
Typy oddílů jsou
Rozdělení mezi kruhy:
- Podle informatica jsou data distribuována rovnoměrně mezi všechny oddíly
- V každém oddílu, kde je počet řádků ke zpracování přibližně stejný, je toto rozdělení použitelné
Rozdělení hash:
- Pro účely rozdělení klíčů na seskupení dat mezi oddíly používá server Informatica hashovací funkci
- Používá se při zajištění, že je potřeba zajistit skupiny procesů se stejným rozdělovacím klíčem ve stejném oddílu
13) Uveďte, jaké jsou výhody použití DataReader Destination Adapter?
Výhodou použití DataReader Destination Adapter je to, že naplní Sada záznamů ADO (sestávající ze záznamů a sloupců) v paměti a zpřístupňuje data z úlohy DataFlow implementací rozhraní DataReader, takže data může spotřebovávat jiná aplikace.
14) Jaké jsou možné způsoby aktualizace tabulky pomocí SSIS (SQL Server Integration Service)?
Pro aktualizaci tabulky pomocí SSIS jsou možné způsoby:
- Použití SQL příkaz
- Použijte pracovní stůl
- Použijte mezipaměť
- Použijte úlohu skriptu
- Pokud používáte MSSQL, použijte pro aktualizaci úplný název databáze
15) V případě, že máte jiný zdroj než OLEDB (Object Linking and Embedding Database) pro vyhledávání, co byste udělali?
V případě, že máte pro vyhledávání jiný než OLEBD zdroj, musíte k načtení dat použít mezipaměť a použít je jako zdroj
16) V jakém případě používáte dynamickou mezipaměť a statickou mezipaměť v připojených a nepřipojených transformacích?
- Dynamická mezipaměť se používá, když musíte aktualizovat hlavní tabulku a pomalu se měnící rozměry (SCD) typu 1
- Pro ploché soubory se používá statická mezipaměť
17) Vysvětlete, jaké jsou rozdíly mezi vyhledáváním Nepřipojeno a Připojeno?
| Připojené vyhledávání | Nepřipojené vyhledávání |
|---|---|
| Propojené vyhledávání se podílí na mapěping | Používá se, když se místo transformace výrazu použije vyhledávací funkce při mapování.ping |
| Lze vrátit více hodnot | Vrací pouze jeden výstupní port |
| Může být připojen k dalším transformacím a vrací hodnotu | Další transformaci nelze připojit |
| Pro připojené vyhledávání lze použít statickou nebo dynamickou mezipaměť | Nepřipojeno jako pouze statická mezipaměť |
| Připojené vyhledávání podporuje uživatelem definované výchozí hodnoty | Nepřipojené vyhledávání nepodporuje uživatelem definované výchozí hodnoty |
| V Connected Lookup lze vrátit více sloupců ze stejného řádku nebo vložit do mezipaměti dynamického vyhledávání | Nepřipojené vyhledávání určuje jeden návratový port a vrací jeden sloupec z každého řádku |
18) Vysvětlete, co je zobrazení zdroje dat?
Zobrazení zdroje dat umožňuje definovat relační schéma, které bude použito v databázích analytických služeb. Spíše než přímo z objektů zdroje dat se dimenze a krychle vytvářejí ze zobrazení zdroje dat.
19) Vysvětlete, jaký je rozdíl mezi nástroji OLAP a nástroji ETL?
Rozdíl mezi nástrojem ETL a OLAP je v tom
ETL nástroj je určeno pro bývalétracpřevod dat ze starších systémů a jejich načtení do určené databáze s určitým procesem čištění dat.
Příklad: Data stage, Informatica atd.
Zatímco OLAP je určen pro účely podávání zpráv v datech OLAP dostupných ve vícesměrném modelu.
Příklad: Business Objects, Cognos atd.
20) Jak můžeš býttract SAP data pomocí Informatica?
- S možností připojení k napájení si vyberetetract SAP data pomocí informatiky
- Nainstalujte a nakonfigurujte nástroj PowerConnect
- Importujte zdroj do Source Analyzer. Mezi Informatica a SAP Powerconnect funguje jako brána. Dalším krokem je vygenerování kódu ABAP pro mapu.ping pak pouze informatika může data z SAP
- Pro připojení a import zdrojů z externích systémů se používá Power Connect
21) Uveďte, jaký je rozdíl mezi Power Mart a Power Center?
| mocenské centrum | Power Mart |
|---|---|
| Předpokládejme, že zpracováváte obrovské množství dat | Předpokládejme, že zpracováváte malý objem dat |
| Podporuje ERP zdroje jako např SAP, lidé měkcí atd. | Nepodporuje zdroje ERP |
| Podporuje lokální a globální úložiště | Podporuje místní úložiště |
| Převádí místní na globální úložiště | Nemá žádnou specifikaci pro převod lokálního na globální úložiště |
22) Vysvětlete, co je to inscenační prostor a k čemu slouží?
Data staging je oblast, kde dočasně uchováváte data na serveru datového skladu. Data staging zahrnuje následující kroky
- Zdrojová data např.traca transformace dat (restrukturalizace)
- Transformace dat (čištění dat, transformace hodnot)
- Náhradní klíčové úkoly
23) Co je schéma autobusu?
Pro různé obchodní procesy k identifikaci společných dimenzí se používá schéma BUS. Dodává se s přizpůsobenými rozměry spolu se standardizovanou definicí informací
24) Vysvětlete, co je čištění dat?
Čištění dat je proces mazání dat z datového skladu. Odstraňuje nevyžádaná data, jako jsou řádky s hodnotami null nebo mezerami navíc.
25) Vysvětlete, co jsou objekty schématu?
Objekty schématu jsou logickou strukturou, která přímo odkazuje na data databáze. Objekty schématu zahrnují tabulky, pohledy, synonyma sekvencí, indexy, shluky, balíčky funkcí a databázové odkazy
26) Vysvětlete tyto pojmy Session, Worklet, Mapplet a Workflow?
- Mapplet: Uspořádá nebo vytvoří sady transformací
- Worklet: Představuje konkrétní soubor zadaných úkolů
- Pracovní postup: Je to sada instrukcí, které říkají serveru, jak provádět úkoly
- Zasedání: Je to sada parametrů, které serveru říkají, jak přesunout data ze zdrojů do cíle
Tyto otázky na pohovoru také pomohou ve vašem životě (ústních)
