Đề 12 – Bài tập, đề thi trắc nghiệm online Dữ liệu lớn (BigData)

Đề 12 – Bài tập, đề thi trắc nghiệm online Dữ liệu lớn (BigData)

Đề 12 – Bài tập, đề thi trắc nghiệm online Dữ liệu lớn (BigData)

Số câu30
Quiz ID13252
Câu 1
1. Ngôn ngữ lập trình nào phổ biến nhất được sử dụng để phân tích dữ liệu và thống kê trong lĩnh vực Dữ liệu lớn?
Câu 2
2. Kỹ thuật 'Data Sampling' (Lấy mẫu dữ liệu) thường được sử dụng trong Dữ liệu lớn để:
Câu 3
3. Trong Dữ liệu lớn, 'Data Cleansing' (Làm sạch dữ liệu) là quá trình:
Câu 4
4. Phương pháp 'In-memory processing' (Xử lý trong bộ nhớ) trong Dữ liệu lớn, ví dụ như Spark, mang lại lợi ích chính nào?
Câu 5
5. Đặc điểm nào sau đây KHÔNG phải là một trong '5Vs' thường được dùng để mô tả Dữ liệu lớn?
Câu 6
6. Trong kiến trúc Dữ liệu lớn, 'Data Warehouse' (Kho dữ liệu) thường được sử dụng cho mục đích:
Câu 7
7. Công nghệ nào sau đây KHÔNG phải là một phần cốt lõi của hệ sinh thái Hadoop?
Câu 8
8. Thuật ngữ 'Data Lake' (Hồ dữ liệu) trong Dữ liệu lớn dùng để chỉ:
Câu 9
9. Khía cạnh 'Variety' (Đa dạng) trong '5Vs' của Dữ liệu lớn đề cập đến:
Câu 10
10. Kỹ thuật 'Data Visualization' (Trực quan hóa dữ liệu) đóng vai trò quan trọng trong Dữ liệu lớn vì:
Câu 11
11. Loại cơ sở dữ liệu nào thường được sử dụng trong các ứng dụng Dữ liệu lớn để xử lý dữ liệu phi cấu trúc hoặc bán cấu trúc với khả năng mở rộng cao?
Câu 12
12. Khái niệm 'Schema on Read' (Lược đồ khi đọc) thường liên quan đến loại hệ thống dữ liệu lớn nào?
Câu 13
13. Trong ngữ cảnh Dữ liệu lớn, 'Data Governance' (Quản trị dữ liệu) đề cập đến:
Câu 14
14. Thách thức lớn nhất khi làm việc với Dữ liệu lớn KHÔNG bao gồm:
Câu 15
15. Công nghệ nào sau đây thường được sử dụng để xử lý và phân tích Dữ liệu lớn phân tán trên nhiều máy tính?
Câu 16
16. Công cụ nào sau đây thường được sử dụng để truy vấn và phân tích dữ liệu trong Hadoop Data Lake sử dụng ngôn ngữ giống SQL?
Câu 17
17. Trong bối cảnh Dữ liệu lớn, ETL là viết tắt của quy trình nào?
Câu 18
18. Mục tiêu chính của việc 'Data Mining' (Khai phá dữ liệu) trong Dữ liệu lớn là:
Câu 19
19. Công cụ mã nguồn mở nào phổ biến để xử lý dòng dữ liệu (stream processing) trong thời gian thực trong hệ sinh thái Hadoop?
Câu 20
20. Thách thức về 'Veracity' (Độ tin cậy) trong '5Vs' của Dữ liệu lớn liên quan đến:
Câu 21
21. Công cụ nào sau đây là một nền tảng đám mây phổ biến cung cấp các dịch vụ Dữ liệu lớn và phân tích?
Câu 22
22. Ứng dụng nào sau đây KHÔNG phải là một ví dụ điển hình của việc sử dụng Dữ liệu lớn?
Câu 23
23. Một trong những rủi ro đạo đức chính liên quan đến việc sử dụng Dữ liệu lớn là:
Câu 24
24. Trong mô hình 'Lambda Architecture' cho xử lý Dữ liệu lớn, lớp 'Batch Layer' (Lớp xử lý theo lô) có vai trò chính là:
Câu 25
25. Trong ngữ cảnh Dữ liệu lớn và Machine Learning, 'Feature Engineering' (Kỹ thuật đặc trưng) là quá trình:
Câu 26
26. Loại hình phân tích Dữ liệu lớn nào tập trung vào việc dự đoán các sự kiện hoặc xu hướng trong tương lai?
Câu 27
27. Loại dữ liệu nào sau đây KHÔNG được coi là dữ liệu 'phi cấu trúc'?
Câu 28
28. Ưu điểm chính của việc sử dụng 'Cloud Computing' (Điện toán đám mây) cho Dữ liệu lớn là gì?
Câu 29
29. Khái niệm 'Real-time analytics' (Phân tích thời gian thực) trong Dữ liệu lớn có nghĩa là:
Câu 30
30. Ứng dụng của Dữ liệu lớn trong lĩnh vực y tế KHÔNG bao gồm:

Để lại một bình luận