Đề 3 – Bài tập, đề thi trắc nghiệm online Dữ liệu lớn (BigData)

Đề 3 – Bài tập, đề thi trắc nghiệm online Dữ liệu lớn (BigData)

Đề 3 – Bài tập, đề thi trắc nghiệm online Dữ liệu lớn (BigData)

Số câu30
Quiz ID13243
Câu 1
1. Trong ngữ cảnh Dữ liệu lớn, 'real-time analytics' (phân tích thời gian thực) có nghĩa là gì?
Câu 2
2. Thuật ngữ 'Data Governance' (Quản trị dữ liệu) trong Dữ liệu lớn liên quan đến vấn đề gì?
Câu 3
3. Một trong những thách thức chính về kỹ năng trong lĩnh vực Dữ liệu lớn hiện nay là gì?
Câu 4
4. Lợi ích chính của việc sử dụng Dữ liệu lớn trong lĩnh vực y tế là gì?
Câu 5
5. Công cụ nào sau đây thường được sử dụng để trực quan hóa dữ liệu lớn, giúp người dùng dễ dàng hiểu và phân tích thông tin?
Câu 6
6. Công nghệ nào sau đây thường được sử dụng để xử lý Dữ liệu lớn phân tán trên nhiều máy tính?
Câu 7
7. Khái niệm 'data wrangling' (chuẩn bị dữ liệu) trong Dữ liệu lớn bao gồm các công việc chính nào?
Câu 8
8. Trong Dữ liệu lớn, 'machine learning' (học máy) thường được sử dụng để làm gì?
Câu 9
9. Đặc điểm nào sau đây KHÔNG phải là một trong '5Vs' thường được dùng để mô tả Dữ liệu lớn (Big Data)?
Câu 10
10. Khái niệm 'Value' (Giá trị) trong '5Vs' của Dữ liệu lớn nhấn mạnh điều gì?
Câu 11
11. Yếu tố 'Velocity' (Tốc độ) trong Dữ liệu lớn đề cập đến khía cạnh nào?
Câu 12
12. Loại dữ liệu nào sau đây KHÔNG được xem là 'phi cấu trúc' trong bối cảnh Dữ liệu lớn?
Câu 13
13. Thách thức về 'Veracity' (Tính xác thực) trong Dữ liệu lớn có thể ảnh hưởng tiêu cực đến điều gì?
Câu 14
14. Công nghệ nào sau đây KHÔNG phải là một thành phần phổ biến trong hệ sinh thái Hadoop?
Câu 15
15. Trong bối cảnh IoT (Internet of Things), Dữ liệu lớn đóng vai trò quan trọng như thế nào?
Câu 16
16. Ứng dụng nào sau đây KHÔNG phải là một ví dụ điển hình của việc sử dụng Dữ liệu lớn?
Câu 17
17. Ứng dụng nào sau đây thể hiện rõ nhất giá trị của Dữ liệu lớn trong lĩnh vực 'thành phố thông minh'?
Câu 18
18. Ưu điểm chính của việc sử dụng 'cloud computing' (điện toán đám mây) cho Dữ liệu lớn là gì?
Câu 19
19. Loại cơ sở dữ liệu nào thường được sử dụng cho Dữ liệu lớn vì khả năng mở rộng linh hoạt và xử lý dữ liệu phi cấu trúc?
Câu 20
20. Công cụ nào sau đây thường được sử dụng để thực hiện truy vấn và phân tích dữ liệu trong Hadoop?
Câu 21
21. Mô hình lập trình 'MapReduce' trong Hadoop hoạt động dựa trên nguyên tắc nào?
Câu 22
22. Trong kiến trúc Dữ liệu lớn, 'Data Lake' (Hồ dữ liệu) khác biệt so với 'Data Warehouse' (Kho dữ liệu) chủ yếu ở điểm nào?
Câu 23
23. Vấn đề về 'quyền riêng tư dữ liệu' trở nên đặc biệt quan trọng trong bối cảnh Dữ liệu lớn vì lý do gì?
Câu 24
24. Quy trình 'Data Mining' (Khai phá dữ liệu) trong Dữ liệu lớn chủ yếu tập trung vào điều gì?
Câu 25
25. Vấn đề 'data silos' (tổ chức dữ liệu rời rạc) có thể gây trở ngại gì cho việc khai thác giá trị từ Dữ liệu lớn?
Câu 26
26. Thách thức lớn nhất liên quan đến 'Veracity' (Tính xác thực) trong bối cảnh Dữ liệu lớn là gì?
Câu 27
27. Ưu điểm của việc sử dụng 'columnar database' (cơ sở dữ liệu cột) so với 'row-based database' (cơ sở dữ liệu hàng) trong phân tích Dữ liệu lớn là gì?
Câu 28
28. Công nghệ 'in-memory processing' (xử lý trong bộ nhớ) trong Dữ liệu lớn, như Apache Spark, giúp cải thiện hiệu suất xử lý dữ liệu như thế nào?
Câu 29
29. Ngôn ngữ lập trình nào phổ biến trong việc xử lý và phân tích Dữ liệu lớn, đặc biệt trong các framework như Spark?
Câu 30
30. Trong kiến trúc lambda và kappa cho Dữ liệu lớn, kiến trúc nào tập trung vào xử lý cả dữ liệu theo lô (batch) và dữ liệu luồng (stream) trong cùng một hệ thống?

Để lại một bình luận