คำถามและคำตอบสัมภาษณ์การทดสอบ ETL 25 อันดับแรกและคำตอบในปี 2025

ต่อไปนี้เป็นคำถามและคำตอบในการสัมภาษณ์การทดสอบ ETL สำหรับผู้สมัครใหม่และมีประสบการณ์เพื่อให้ได้งานในฝัน

 

คำถามสัมภาษณ์การทดสอบ ETL สำหรับนักศึกษาใหม่


1) ETL คืออะไร?

ในสถาปัตยกรรมคลังข้อมูล ETL เป็นส่วนประกอบสำคัญที่จัดการข้อมูลสำหรับกระบวนการทางธุรกิจใดๆ ETL ย่อมาจาก แยก, แปลงร่าง และ โหลด- Extract ทำหน้าที่อ่านข้อมูลจากฐานข้อมูล การแปลงเป็นการแปลงข้อมูลเป็นรูปแบบที่อาจเหมาะสมสำหรับการรายงานและการวิเคราะห์ ในขณะที่โหลดเป็นกระบวนการเขียนข้อมูลลงในฐานข้อมูลเป้าหมาย

👉 ดาวน์โหลดไฟล์ PDF ฟรี: คำถามและคำตอบสัมภาษณ์การทดสอบ ETL


2) อธิบายว่าการดำเนินการทดสอบ ETL มีครอบคลุมอะไรบ้าง

การทดสอบ ETL ประกอบด้วย:

  • ตรวจสอบว่าข้อมูลมีการเปลี่ยนแปลงอย่างถูกต้องตามความต้องการทางธุรกิจหรือไม่
  • ตรวจสอบว่าข้อมูลที่คาดการณ์ไว้ถูกโหลดเข้าสู่คลังข้อมูลโดยไม่มีการตัดทอนและข้อมูลสูญหาย
  • ตรวจสอบให้แน่ใจว่าแอปพลิเคชัน ETL รายงานข้อมูลที่ไม่ถูกต้องและแทนที่ด้วยค่าเริ่มต้น
  • ตรวจสอบให้แน่ใจว่าข้อมูลโหลดตามกรอบเวลาที่คาดหวังเพื่อปรับปรุงความสามารถในการปรับขนาดและประสิทธิภาพ

กระบวนการ ETL
ETL


3) กล่าวถึงแอปพลิเคชันคลังข้อมูลประเภทใดบ้าง และการทำเหมืองข้อมูลและคลังข้อมูลแตกต่างกันอย่างไร

ประเภทของแอปพลิเคชันคลังข้อมูลได้แก่

  • การประมวลผลข้อมูล
  • การประมวลผลเชิงวิเคราะห์
  • การทำเหมืองข้อมูล

การทำเหมืองข้อมูล สามารถกำหนดเป็นกระบวนการดึงข้อมูลคาดการณ์ที่ซ่อนอยู่จากฐานข้อมูลขนาดใหญ่และตีความข้อมูลในขณะที่คลังข้อมูลอาจใช้การขุดข้อมูลเพื่อประมวลผลการวิเคราะห์ข้อมูลในลักษณะที่รวดเร็วยิ่งขึ้น คลังข้อมูล เป็นกระบวนการรวบรวมข้อมูลจากหลายแหล่งมาไว้ในที่เก็บข้อมูลร่วมแห่งเดียว


4) ETL มีเครื่องมืออะไรบ้าง?

  • สตรีมการตัดสินใจ Cognos
  • Oracle ช่างสร้างโกดัง
  • วัตถุประสงค์ทางธุรกิจ XI
  • คลังสินค้าธุรกิจ SAS
  • เซิร์ฟเวอร์ SAS Enterprise ETL

5) ข้อเท็จจริงคืออะไร? ข้อเท็จจริงมีกี่ประเภท?

เป็นองค์ประกอบหลักของแบบจำลองหลายมิติซึ่งประกอบด้วยการวัดผลที่จะวิเคราะห์ ข้อเท็จจริงเกี่ยวข้องกับมิติ

ประเภทของข้อเท็จจริงได้แก่

  • ข้อเท็จจริงเพิ่มเติม
  • ข้อเท็จจริงกึ่งสารเติมแต่ง
  • ข้อเท็จจริงที่ไม่ใช่สารเติมแต่ง

6) อธิบายว่า Cubes และ OLAP Cubes คืออะไร

คิวบ์เป็นหน่วยประมวลผลข้อมูลที่ประกอบด้วยตารางข้อเท็จจริงและมิติจากคลังข้อมูล มีการวิเคราะห์หลายมิติ

OLAP ย่อมาจาก Online Analytics Processing และคิวบ์ OLAP จัดเก็บข้อมูลขนาดใหญ่ในรูปแบบหลายมิติเพื่อวัตถุประสงค์ในการรายงาน ประกอบด้วยข้อเท็จจริงที่เรียกว่าเป็นมาตรการแบ่งตามมิติ


7) อธิบายว่าระดับการติดตามคืออะไรและมีประเภทใดบ้าง?

ระดับการติดตามคือจำนวนข้อมูลที่จัดเก็บไว้ในไฟล์บันทึก ระดับการติดตามสามารถจำแนกได้เป็นสองระดับ ปกติ และ ละเอียด ระดับปกติอธิบายระดับการติดตามในลักษณะโดยละเอียด ในขณะที่รายละเอียดอธิบายระดับการติดตามในแต่ละแถว


8) อธิบายว่า Grain of Fact คืออะไร?

ข้อมูลข้อเท็จจริงสามารถกำหนดเป็นระดับที่ข้อมูลข้อเท็จจริงถูกเก็บไว้ เรียกอีกอย่างว่ารายละเอียดข้อเท็จจริง


9) อธิบายว่าสคีมาข้อเท็จจริงที่ไร้ข้อเท็จจริงคืออะไร และมาตรการคืออะไร

ตารางข้อเท็จจริงที่ไม่มีหน่วยวัดเรียกว่าตารางข้อเท็จจริงที่ไม่มีข้อเท็จจริง สามารถดูจำนวนเหตุการณ์ที่เกิดขึ้นได้ ตัวอย่างเช่น ใช้เพื่อบันทึกเหตุการณ์ เช่น จำนวนพนักงานในบริษัท

ข้อมูลตัวเลขที่ยึดตามคอลัมน์ในตารางข้อเท็จจริงเรียกว่าหน่วยวัด


10) อธิบายว่าการเปลี่ยนแปลงคืออะไร?

การแปลงเป็นออบเจ็กต์พื้นที่เก็บข้อมูลซึ่งสร้าง แก้ไข หรือส่งข้อมูล การเปลี่ยนแปลงมีสองประเภท Active และ Passive


คำถามและคำตอบสัมภาษณ์นักพัฒนา ETL สำหรับผู้มีประสบการณ์

11) อธิบายการใช้ Lookup Transformation อย่างไร?

การแปลงการค้นหามีประโยชน์สำหรับ

  • รับค่าที่เกี่ยวข้องจากตารางโดยใช้ค่าคอลัมน์
  • อัพเดทตารางมิติที่เปลี่ยนแปลงอย่างช้าๆ
  • ตรวจสอบว่ามีระเบียนอยู่แล้วในตารางหรือไม่

12) อธิบายว่าการแบ่งพาร์ติชั่น, การแบ่งแฮชและการแบ่งพาร์ติชั่นแบบโรบินคืออะไร?

เพื่อปรับปรุงประสิทธิภาพ ธุรกรรมจะถูกแบ่งย่อย ซึ่งเรียกว่าการแบ่งพาร์ติชัน การแบ่งพาร์ติชันทำให้ได้ สารสนเทศ เซิร์ฟเวอร์สำหรับสร้างการเชื่อมต่อที่หลากหลายไปยังแหล่งต่างๆ

ประเภทของพาร์ติชั่นคือ

การแบ่งพาร์ติชันแบบ Round-Robin:

  • โดยข้อมูลสารสนเทศจะถูกกระจายอย่างเท่าเทียมกันในทุกพาร์ติชัน
  • ในแต่ละพาร์ติชั่นที่จำนวนแถวที่จะประมวลผลเท่ากันโดยประมาณ การแบ่งพาร์ติชั่นนี้สามารถใช้ได้

การแบ่งพาร์ติชันแฮช:

  • เพื่อวัตถุประสงค์ในการแบ่งพาร์ติชันคีย์เพื่อจัดกลุ่มข้อมูลระหว่างพาร์ติชัน เซิร์ฟเวอร์ Informatica จะใช้ฟังก์ชันแฮช
  • มันถูกใช้เมื่อต้องแน่ใจว่ากลุ่มกระบวนการของแถวที่มีคีย์การแบ่งพาร์ติชั่นเดียวกันในพาร์ติชั่นเดียวกันจำเป็นต้องได้รับความมั่นใจ

13) พูดถึงข้อดีของการใช้ DataReader Destination Adapter คืออะไร?

ข้อดีของการใช้ DataReader Destination Adapter คือ จะมีการเติมข้อมูลลงในไฟล์ ชุดระเบียน ADO (ประกอบด้วยบันทึกและคอลัมน์) ในหน่วยความจำและเปิดเผยข้อมูลจากงาน DataFlow โดยใช้อินเทอร์เฟซ DataReader เพื่อให้แอปพลิเคชันอื่นสามารถใช้ข้อมูลได้


14) การใช้ SSIS (SQL Server Integration Service) มีวิธีใดที่เป็นไปได้ในการอัปเดตตาราง

หากต้องการอัปเดตตารางโดยใช้ SSIS วิธีที่เป็นไปได้คือ:

  • ใช้ SQL คำสั่ง
  • ใช้ตารางแสดงละคร
  • ใช้แคช
  • ใช้งานสคริปต์
  • ใช้ชื่อฐานข้อมูลแบบเต็มสำหรับการอัปเดตหากใช้ MSSQL

15) ในกรณีที่คุณมีแหล่งข้อมูลที่ไม่ใช่ OLEDB (Object Linking and Embedding Database) สำหรับการค้นหา คุณจะทำอย่างไร

ในกรณีที่คุณมีแหล่งที่มาที่ไม่ใช่ OLEBD สำหรับการค้นหา คุณต้องใช้แคชเพื่อโหลดข้อมูลและใช้เป็นแหล่งข้อมูล


16) ในกรณีใดที่คุณใช้ไดนามิกแคชและแคชคงที่ในการแปลงที่เชื่อมต่อและไม่เชื่อมต่อ?

  • แคชแบบไดนามิกจะใช้เมื่อคุณต้องอัปเดตตารางหลักและเปลี่ยนขนาด (SCD) ชนิด 1 อย่างช้าๆ
  • สำหรับไฟล์แฟลต มีการใช้แคชแบบคงที่

17) อธิบายว่าอะไรคือความแตกต่างระหว่างการค้นหาที่ไม่เชื่อมต่อและการค้นหาที่เชื่อมต่อ?

การค้นหาที่เชื่อมต่อ การค้นหาที่ไม่เชื่อมต่อ
การค้นหาที่เชื่อมต่อมีส่วนร่วมในการแม็ป มันถูกใช้เมื่อมีการใช้ฟังก์ชันการค้นหาแทนการแปลงนิพจน์ขณะทำการแมป
สามารถส่งคืนค่าได้หลายค่า ส่งคืนพอร์ตเอาต์พุตเพียงพอร์ตเดียวเท่านั้น
สามารถเชื่อมต่อกับการแปลงอื่นและส่งกลับค่าได้ ไม่สามารถเชื่อมต่อการเปลี่ยนแปลงอื่นได้
สามารถใช้แคชแบบคงที่หรือไดนามิกสำหรับการค้นหาที่เชื่อมต่อ ไม่ได้เชื่อมต่อเป็นแคชแบบคงที่เท่านั้น
การค้นหาที่เชื่อมต่อสนับสนุนค่าเริ่มต้นที่ผู้ใช้กำหนด การค้นหาที่ไม่เชื่อมต่อไม่สนับสนุนค่าเริ่มต้นที่ผู้ใช้กำหนด
ในการค้นหาที่เชื่อมต่อสามารถส่งคืนหลายคอลัมน์จากแถวเดียวกันหรือแทรกลงในแคชการค้นหาแบบไดนามิก การค้นหาที่ไม่ได้เชื่อมต่อจะกำหนดพอร์ตส่งคืนหนึ่งพอร์ต และส่งกลับหนึ่งคอลัมน์จากแต่ละแถว

18) อธิบายว่ามุมมองแหล่งข้อมูลคืออะไร?

มุมมองแหล่งข้อมูลช่วยให้สามารถกำหนดสคีมาเชิงสัมพันธ์ซึ่งจะใช้ในฐานข้อมูลบริการการวิเคราะห์ แทนที่จะสร้างจากออบเจ็กต์แหล่งข้อมูลโดยตรง มิติและคิวบ์จะถูกสร้างขึ้นจากมุมมองแหล่งข้อมูล


19) อธิบายว่าเครื่องมือ OLAP และเครื่องมือ ETL แตกต่างกันอย่างไร

ความแตกต่างระหว่างเครื่องมือ ETL และ OLAP ก็คือ

เครื่องมือ ETL มีไว้สำหรับการดึงข้อมูลจากระบบเดิมและโหลดเข้าสู่ฐานข้อมูลที่ระบุด้วยกระบวนการล้างข้อมูลบางอย่าง

ตัวอย่าง: ขั้นข้อมูล Informatica ฯลฯ

ในขณะที่ OLAP มีไว้เพื่อการรายงานในข้อมูล OLAP ที่มีอยู่ในโมเดลหลายทิศทาง

ตัวอย่าง: ออบเจ็กต์ทางธุรกิจ Cognos ฯลฯ


20) คุณจะแยกออกมาได้อย่างไร SAP ข้อมูลโดยใช้ Informatica?

  • ด้วยตัวเลือกการเชื่อมต่อพลังงานที่คุณแยกออกมา SAP ข้อมูลโดยใช้สารสนเทศ
  • ติดตั้งและกำหนดค่าเครื่องมือ PowerConnect
  • นำเข้าแหล่งที่มาไปยังเครื่องวิเคราะห์แหล่งที่มา ระหว่าง Informatica และ SAP Powerconnect ทำหน้าที่เป็นเกตเวย์ ขั้นตอนต่อไปคือการสร้างโค้ด ABAP สำหรับการแมป จากนั้นมีเพียงสารสนเทศเท่านั้นที่สามารถดึงข้อมูลได้ SAP
  • ในการเชื่อมต่อและนำเข้าแหล่งที่มาจากระบบภายนอก Power Connect จะใช้

21) พูดถึงความแตกต่างระหว่าง Power Mart และ Power Center?

ศูนย์พลังงาน พาวเวอร์มาร์ท
สมมติว่าประมวลผลข้อมูลจำนวนมหาศาล สมมติว่าประมวลผลข้อมูลในปริมาณน้อย
รองรับแหล่ง ERP เช่น SAP, คนอ่อนไหว ฯลฯ ไม่รองรับแหล่งที่มาของ ERP
รองรับพื้นที่เก็บข้อมูลท้องถิ่นและระดับโลก รองรับพื้นที่เก็บข้อมูลในเครื่อง
มันแปลงโลคัลเป็นที่เก็บข้อมูลส่วนกลาง ไม่มีข้อกำหนดในการแปลงโลคัลเป็นที่เก็บโกลบอล

22) อธิบายว่าพื้นที่การแสดงละครคืออะไร และจุดประสงค์ของพื้นที่การแสดงละครคืออะไร?

การจัดเตรียมข้อมูลเป็นพื้นที่ที่คุณเก็บข้อมูลชั่วคราวบนเซิร์ฟเวอร์คลังข้อมูล การจัดเตรียมข้อมูลประกอบด้วยขั้นตอนต่อไปนี้

  • การดึงข้อมูลต้นทางและการแปลงข้อมูล (การปรับโครงสร้างใหม่)
  • การแปลงข้อมูล (การล้างข้อมูล การแปลงค่า)
  • มอบหมายงานสำคัญแทน

23) Bus Schema คืออะไร?

สำหรับกระบวนการทางธุรกิจต่างๆ เพื่อระบุมิติทั่วไป จะใช้ BUS schema มันมาพร้อมกับมิติที่สอดคล้องพร้อมกับคำจำกัดความของข้อมูลที่เป็นมาตรฐาน


24) อธิบายว่าการล้างข้อมูลคืออะไร?

การล้างข้อมูลเป็นกระบวนการลบข้อมูลจากคลังข้อมูล มันจะลบแถวเหมือนข้อมูลขยะที่มีค่าว่างหรือช่องว่างเพิ่มเติม


25) อธิบายว่า Schema Objects คืออะไร?

วัตถุ Schema คือโครงสร้างเชิงตรรกะที่อ้างอิงถึงข้อมูลของฐานข้อมูลโดยตรง วัตถุ Schema ประกอบด้วยตาราง มุมมอง คำพ้องความหมายของลำดับ ดัชนี คลัสเตอร์ แพ็คเกจฟังก์ชัน และลิงก์ฐานข้อมูล


26) อธิบายคำศัพท์เหล่านี้ Session, Worklet, Mapplet และ Workflow ?

  • แม็ปเล็ต: มันจัดเรียงหรือสร้างชุดของการเปลี่ยนแปลง
  • งาน: มันแสดงถึงชุดงานเฉพาะที่ได้รับมอบหมาย
  • ขั้นตอนการทำงาน: เป็นชุดคำสั่งที่บอกเซิร์ฟเวอร์ถึงวิธีดำเนินงาน
  • เซสชั่น: เป็นชุดพารามิเตอร์ที่บอกเซิร์ฟเวอร์ถึงวิธีย้ายข้อมูลจากแหล่งหนึ่งไปยังอีกเป้าหมาย

คำถามสัมภาษณ์เหล่านี้จะช่วยในวีว่าของคุณ (วาจา)