Đề 6 – Bài tập, đề thi trắc nghiệm online Dữ liệu lớn (BigData)

Đề 6 – Bài tập, đề thi trắc nghiệm online Dữ liệu lớn (BigData)

Đề 6 – Bài tập, đề thi trắc nghiệm online Dữ liệu lớn (BigData)

Số câu30
Quiz ID13246
Câu 1
1. Trong ngữ cảnh Dữ liệu lớn, 'Data Mining' (Khai phá dữ liệu) chủ yếu tập trung vào điều gì?
Câu 2
2. Trong phân tích Dữ liệu lớn, kỹ thuật 'Dimensionality Reduction' (Giảm chiều dữ liệu) nhằm mục đích chính là gì?
Câu 3
3. Công nghệ nào sau đây thường được sử dụng để xử lý dữ liệu 'theo dòng' (stream processing) trong thời gian thực trong môi trường Dữ liệu lớn?
Câu 4
4. Kỹ thuật 'Data Sampling' (Lấy mẫu dữ liệu) thường được sử dụng khi làm việc với Dữ liệu lớn để làm gì?
Câu 5
5. Phương pháp tiếp cận 'ELT' (Extract, Load, Transform) khác biệt so với 'ETL' (Extract, Transform, Load) chủ yếu ở giai đoạn nào?
Câu 6
6. Thách thức về 'Volume' (Khối lượng) trong Dữ liệu lớn chủ yếu liên quan đến vấn đề nào?
Câu 7
7. Lợi ích chính của việc sử dụng 'in-memory processing' (xử lý trong bộ nhớ) trong Dữ liệu lớn là gì?
Câu 8
8. Phương pháp 'Data Federation' (Liên kết dữ liệu) được sử dụng để giải quyết vấn đề gì trong môi trường Dữ liệu lớn phân tán?
Câu 9
9. Yếu tố nào sau đây KHÔNG phải là một thành phần phổ biến trong kiến trúc xử lý Dữ liệu lớn điển hình?
Câu 10
10. Ứng dụng nào sau đây KHÔNG phải là một ví dụ điển hình của việc sử dụng Dữ liệu lớn?
Câu 11
11. Trong Dữ liệu lớn, thuật ngữ 'Data Silos' (Ống khói dữ liệu) đề cập đến vấn đề gì?
Câu 12
12. Thuật ngữ 'Hadoop' thường được liên kết chặt chẽ nhất với khía cạnh nào của Dữ liệu lớn?
Câu 13
13. Trong bối cảnh Dữ liệu lớn, 'Data Lineage' (Dòng dõi dữ liệu) giúp ích gì?
Câu 14
14. Trong Dữ liệu lớn, 'Data Catalog' (Danh mục dữ liệu) có vai trò tương tự như?
Câu 15
15. Thử thách lớn nhất liên quan đến 'Veracity' (Độ tin cậy) trong 5Vs của Dữ liệu lớn là gì?
Câu 16
16. Kỹ thuật 'Data Partitioning' (Phân vùng dữ liệu) trong Dữ liệu lớn được sử dụng để cải thiện điều gì?
Câu 17
17. Công cụ 'Apache Kafka' thường được sử dụng cho mục đích chính nào trong hệ sinh thái Dữ liệu lớn?
Câu 18
18. Trong Dữ liệu lớn, 'Data Wrangling' (Chuẩn bị dữ liệu) là quá trình bao gồm các bước nào?
Câu 19
19. Công nghệ 'NoSQL' (Not Only SQL) được phát triển chủ yếu để giải quyết hạn chế nào của cơ sở dữ liệu quan hệ truyền thống (RDBMS) trong bối cảnh Dữ liệu lớn?
Câu 20
20. Ưu điểm chính của việc sử dụng 'cloud-based Big Data solutions' (Giải pháp Dữ liệu lớn trên nền tảng đám mây) so với giải pháp tại chỗ (on-premises) là gì?
Câu 21
21. Đặc điểm nào sau đây KHÔNG phải là một trong '5Vs' thường được dùng để mô tả Dữ liệu lớn?
Câu 22
22. Thách thức 'Velocity' (Tốc độ) của Dữ liệu lớn đề cập đến điều gì?
Câu 23
23. Loại dữ liệu nào sau đây KHÔNG được xem là một nguồn dữ liệu 'đa dạng' (Variety) trong bối cảnh Dữ liệu lớn?
Câu 24
24. Trong Dữ liệu lớn, 'Data Lakehouse' là một kiến trúc kết hợp ưu điểm của Data Lake và Data Warehouse, vậy nó hướng đến mục tiêu chính nào?
Câu 25
25. Khi đánh giá một giải pháp Dữ liệu lớn, yếu tố 'Scalability' (Khả năng mở rộng) quan trọng nhất khi nào?
Câu 26
26. Trong kiến trúc Dữ liệu lớn, 'Data Lake' (Hồ dữ liệu) khác biệt chính so với 'Data Warehouse' (Kho dữ liệu) ở điểm nào?
Câu 27
27. Trong Dữ liệu lớn, 'Data Governance' (Quản trị dữ liệu) đóng vai trò quan trọng nhất trong việc đảm bảo điều gì?
Câu 28
28. Trong mô hình 'Lambda Architecture' cho Dữ liệu lớn, lớp 'Speed Layer' (Lớp tốc độ) có chức năng chính là gì?
Câu 29
29. Khái niệm 'Schema on Read' (Lược đồ khi đọc) thường được liên kết với loại hệ thống lưu trữ dữ liệu nào?
Câu 30
30. Trong bối cảnh bảo mật Dữ liệu lớn, kỹ thuật 'Data Masking' (Che giấu dữ liệu) được sử dụng để làm gì?

Để lại một bình luận